Null-Breite-Zeichen-Detektor
Erkennen und entfernen Sie unsichtbare Unicode-Zeichen mit Nullbreite (ZWJ, ZWNJ, ZWSP, BOM) aus Text. Finden Sie versteckte Zeichen, die Formatierungs- oder Sicherheitsprobleme verursachen.
0 characters
Was sind Null-Breite-Zeichen?
Null-Breite-Zeichen sind unsichtbare Unicode-Zeichen, die visuell nicht angezeigt werden, aber Formatierungsprobleme, Sicherheitsprobleme und Analysefehler verursachen können. Dieses Tool erkennt 22 verschiedene Typen darunter:
- Null-Breite-Leerzeichen (U+200B)
- Null-Breite-Verbinder (U+200D)
- Null-Breite-Nicht-Verbinder (U+200C)
- Byte-Reihenfolge-Markierung / BOM (U+FEFF)
- Direktionale Formatierungszeichen
- Und 17 weitere unsichtbare Zeichen
Null-Breite-Zeichen Referenz
| Codepunkt | Zeichenname | Beschreibung |
|---|---|---|
| U+200B | Zero Width Space (ZWSP) | Used for line breaking opportunities in long words |
| U+200C | Zero Width Non-Joiner (ZWNJ) | Prevents joining of adjacent characters in some scripts |
| U+200D | Zero Width Joiner (ZWJ) | Forces joining of adjacent characters (e.g., emoji combinations) |
| U+FEFF | Zero Width No-Break Space (BOM) | Byte Order Mark, often used at start of files |
| U+200E | Left-to-Right Mark | Forces left-to-right text direction |
| U+200F | Right-to-Left Mark | Forces right-to-left text direction |
| U+202A | Left-to-Right Embedding | Treats following text as left-to-right |
| U+202B | Right-to-Left Embedding | Treats following text as right-to-left |
| U+202C | Pop Directional Formatting | Terminates directional formatting |
| U+202D | Left-to-Right Override | Forces left-to-right direction override |
| U+202E | Right-to-Left Override | Forces right-to-left direction override |
| U+2060 | Word Joiner | Prevents line breaks between characters |
| U+2061 | Function Application | Mathematical function application |
| U+2062 | Invisible Times | Mathematical multiplication |
| U+2063 | Invisible Separator | Mathematical separator |
| U+2064 | Invisible Plus | Mathematical addition |
| U+206A | Inhibit Symmetric Swapping | Inhibits mirroring of symmetric characters |
| U+206B | Activate Symmetric Swapping | Activates mirroring of symmetric characters |
| U+206C | Inhibit Arabic Form Shaping | Prevents Arabic letter shaping |
| U+206D | Activate Arabic Form Shaping | Activates Arabic letter shaping |
| U+206E | National Digit Shapes | Activates national digit shapes |
| U+206F | Nominal Digit Shapes | Activates nominal (European) digit shapes |
Verwandte Tools
Über Dieses Tool
So Funktioniert Es
- Durchsucht Text automatisch nach unsichtbaren Null-Breite-Unicode-Zeichen
- Erkennt 22 verschiedene Arten von Null-Breite- und unsichtbaren Unicode-Zeichen
- Zeigt genaue Positionen und Anzahlen für jeden Zeichentyp
- Visualisiert unsichtbare Zeichen mit sichtbaren Markierungen
- Entfernt alle Null-Breite-Zeichen mit einem Klick
Häufige Anwendungsfälle
- Textformatierungsprobleme durch versteckte Zeichen debuggen
- Von Websites und Dokumenten kopierten Text bereinigen
- Verstecktes Tracking oder Wasserzeichen im Text erkennen
- Sicherheitsrisiken durch unsichtbare Zeichen identifizieren
- Text für Datenbanken und strenge Parser vorbereiten
Häufig gestellte Fragen
Was sind Null-Breite-Zeichen und warum sind sie problematisch?
Null-Breite-Zeichen sind unsichtbare Unicode-Zeichen, die visuell nicht angezeigt werden, aber Platz im Text beanspruchen. Sie können Formatierungsprobleme verursachen, Textanalyse unterbrechen, Sicherheitslücken schaffen und Suchen erschweren.
Wie viele Arten von Null-Breite-Zeichen erkennt dieses Tool?
Dieses Tool erkennt 22 verschiedene Arten von unsichtbaren und Null-Breite-Unicode-Zeichen, einschließlich Null-Breite-Leerzeichen, Verbinder, Nicht-Verbinder, direktionale Formatierungszeichen, mathematische Operatoren und andere spezielle unsichtbare Zeichen.
Wie gelangen Null-Breite-Zeichen in meinen Text?
Null-Breite-Zeichen können beim Kopieren von Text aus Websites, Textverarbeitungsprogrammen, PDFs oder anderen formatierten Quellen entstehen. Sie können auch absichtlich für Text-Tracking, Wasserzeichen oder böswillige Zwecke eingefügt werden.
Können Null-Breite-Zeichen ein Sicherheitsrisiko darstellen?
Ja, Null-Breite-Zeichen können Sicherheitsrisiken darstellen. Sie können verwendet werden, um täuschende URLs zu erstellen, Filter und Validierungen zu umgehen, schädlichen Code zu verbergen, visuell identische aber technisch unterschiedliche Zeichenfolgen zu erstellen.
Wird das Entfernen von Null-Breite-Zeichen meine Textformatierung beschädigen?
In den meisten Fällen verbessert das Entfernen von Null-Breite-Zeichen die Textqualität ohne die Formatierung zu beeinträchtigen. Allerdings verwenden einige Sprachen (wie Arabisch, Thai oder Emoji-Kombinationen) ZWJ und ZWNJ legitim für die korrekte Darstellung.
Was ist der Unterschied zwischen visualisiertem und bereinigtem Text?
Visualisierter Text zeigt Null-Breite-Zeichen als sichtbare Markierungen (wie [U+200B]), damit Sie sehen können, wo sie auftreten. Bereinigter Text hat alle Null-Breite-Zeichen vollständig entfernt.
Wie kann ich erkennen, welches Null-Breite-Zeichen mein Problem verursacht?
Das Tool zeigt eine detaillierte Tabelle mit jedem erkannten Zeichentyp, seinem Unicode-Codepunkt, der Anzahl und den genauen Positionen in Ihrem Text. Dies hilft Ihnen zu verstehen, welche spezifischen Zeichen vorhanden sind.
Was sagen mir die Positionsinformationen?
Positionsnummern geben den Zeichenindex an, an dem jedes Null-Breite-Zeichen in Ihrem Text vorkommt (beginnend bei 0). Wenn es viele Vorkommen gibt, zeigt das Tool die ersten 5 Positionen und gibt an, wie viele weitere vorhanden sind.
Kann ich dieses Tool verwenden, um Text vor dem Einfügen in eine Datenbank zu bereinigen?
Absolut! Dies ist einer der Hauptanwendungsfälle. Null-Breite-Zeichen können in Datenbanken unerwartetes Verhalten verursachen, eindeutige Einschränkungen brechen, Suchen beeinträchtigen und Datenqualitätsprobleme erzeugen.
Was ist die Byte-Reihenfolge-Markierung (BOM) und warum ist sie wichtig?
Die Byte-Reihenfolge-Markierung (U+FEFF) ist ein unsichtbares Zeichen, das manchmal am Anfang von Textdateien hinzugefügt wird, um die Kodierung anzugeben. Obwohl manchmal erforderlich, kann sie beim Einfügen von Text Probleme verursachen und Parser stören.
Wie erkenne ich ohne dieses Tool, ob mein Text Null-Breite-Zeichen enthält?
Null-Breite-Zeichen sind visuell kaum zu erkennen. Anzeichen sind: unerwartete Textlänge, Unterschiede beim Kopieren und Einfügen, Fehler bei Suchen und Ersetzen, Analysefehler oder Wortanzahl-Abweichungen.
Können Null-Breite-Zeichen SEO oder Webinhalte beeinflussen?
Ja, Null-Breite-Zeichen in Webinhalten können Suchmaschinen verwirren, das Keyword-Matching beeinflussen, doppelte Inhaltsprobleme verursachen, Analysen stören und die Barrierefreiheit beeinträchtigen.