Unicode-Inspektor
Analysieren Sie Text, um versteckte Zeichen, Unicode-Codepunkte, Zeichenkategorien und Kodierungsinformationen zu enthüllen. Debuggen Sie Textkodierungsprobleme.
29
Gesamtzeichen
20
Eindeutige Zeichen
35
UTF-8-Bytes
58
UTF-16-Bytes
Showing 20 of 20 characters
| Zeichen | Codepunkt | Dezimal | Hex | Kategorie | Block | UTF-8 | Aktionen |
|---|---|---|---|---|---|---|---|
\tCTRL | U+0009 | 9 | 0x0009 | Control Character | Basic Latin | 0x09 | |
\nCTRL | U+000A | 10 | 0x000A | Control Character | Basic Latin | 0x0A | |
␣WS | U+0020 | 32 | 0x0020 | Space Separator | Basic Latin | 0x20 | |
! | U+0021 | 33 | 0x0021 | Other Punctuation | Basic Latin | 0x21 | |
, | U+002C | 44 | 0x002C | Other Punctuation | Basic Latin | 0x2C | |
: | U+003A | 58 | 0x003A | Other Punctuation | Basic Latin | 0x3A | |
H | U+0048 | 72 | 0x0048 | Uppercase Letter | Basic Latin | 0x48 | |
N | U+004E | 78 | 0x004E | Uppercase Letter | Basic Latin | 0x4E | |
T | U+0054 | 84 | 0x0054 | Uppercase Letter | Basic Latin | 0x54 | |
a | U+0061 | 97 | 0x0061 | Lowercase Letter | Basic Latin | 0x61 | |
b | U+0062 | 98 | 0x0062 | Lowercase Letter | Basic Latin | 0x62 | |
e | U+0065 | 101 | 0x0065 | Lowercase Letter | Basic Latin | 0x65 | |
i | U+0069 | 105 | 0x0069 | Lowercase Letter | Basic Latin | 0x69 | |
l | U+006C | 108 | 0x006C | Lowercase Letter | Basic Latin | 0x6C | |
n | U+006E | 110 | 0x006E | Lowercase Letter | Basic Latin | 0x6E | |
o | U+006F | 111 | 0x006F | Lowercase Letter | Basic Latin | 0x6F | |
w | U+0077 | 119 | 0x0077 | Lowercase Letter | Basic Latin | 0x77 | |
世 | U+4E16 | 19990 | 0x4E16 | Unassigned | CJK Unified Ideographs | 0xE4 0xB8 0x96 | |
界 | U+754C | 30028 | 0x754C | Unassigned | CJK Unified Ideographs | 0xE7 0x95 0x8C | |
🌍 | U+1F30D | 127757 | 0x1F30D | Unassigned | Unknown Block | 0xF0 0x9F 0x8C 0x8D |
Zeichenkategorien
Lu
3 characters
Ll
8 characters
Po
3 characters
Zs
1 character
Cn
3 characters
Cc
2 characters
Unicode-Blöcke
Basic Latin
17 characters
CJK Unified Ideographs
2 characters
Unknown Block
1 character
Profi-Tipps:
- Steuerzeichen werden mit Escape-Sequenzen angezeigt (\t für Tabulator, \n für Zeilenumbruch)
- Leerzeichen werden als ␣ und geschützte Leerzeichen als ⍽ zur Sichtbarkeit angezeigt
- Verwenden Sie Filter, um sich auf bestimmte Zeichentypen wie Steuer- oder Nicht-ASCII-Zeichen zu konzentrieren
- UTF-8 und UTF-16 Byte-Darstellungen helfen beim Verständnis der Speicheranforderungen
- Unicode-Blöcke gruppieren verwandte Zeichen aus demselben Schriftsystem oder Zweck
Verwandte Tools
Über den Unicode-Inspektor
So Funktioniert Es
- Analysiert jedes Zeichen in Ihrem Text einzeln
- Enthüllt Unicode-Codepunkte, Kategorien und Eigenschaften
- Zeigt versteckte Steuerzeichen und Leerzeichen an
- Zeigt UTF-8 und UTF-16 Byte-Darstellungen
- Kategorisiert Zeichen nach Unicode-Blöcken und -Typen
Häufige Anwendungsfälle
- Debuggen von Textkodierungs- und Zeichenproblemen
- Identifizieren versteckter oder unsichtbarer Zeichen
- Analysieren von Internationalisierungsproblemen
- Verstehen der Unicode-Zusammensetzung von Text
- Validieren der Zeichenkompatibilität zwischen Systemen
Häufig Gestellte Fragen
Was ist ein Unicode-Inspektor und warum würde ich einen brauchen?
Ein Unicode-Inspektor analysiert Text, um detaillierte Informationen über jedes Zeichen zu enthüllen, einschließlich Unicode-Codepunkte, Kategorien, Kodierungseigenschaften und versteckte Zeichen. Er ist unverzichtbar für das Debuggen von Textkodierungsproblemen.
Wie hilft das Tool beim Identifizieren versteckter oder unsichtbarer Zeichen?
Das Tool zeigt alle Zeichen in Ihrem Text an, einschließlich Steuerzeichen (wie Tabulatoren, Zeilenumbrüche), geschützte Leerzeichen und andere unsichtbare Unicode-Zeichen. Steuerzeichen werden mit Escape-Sequenzen (\t, \n) und speziellen Symbolen angezeigt.
Welche Informationen liefert das Tool für jedes Zeichen?
Für jedes Zeichen zeigt das Tool: das Zeichen selbst, Unicode-Codepunkt (U+xxxx), Dezimal- und Hexadezimalwerte, Unicode-Kategorie und Block, Zeichenname, UTF-8 und UTF-16 Byte-Darstellungen sowie Eigenschaften wie Druckbarkeit, ASCII oder Steuerzeichen.
Was sind Unicode-Kategorien und -Blöcke?
Unicode-Kategorien klassifizieren Zeichen nach ihrem allgemeinen Typ (z.B. Großbuchstabe, Dezimalzahl, Interpunktion). Unicode-Blöcke gruppieren Zeichen nach Schrift oder Zweck (z.B. Grundlegendes Latein, Griechisch und Koptisch, Mathematische Operatoren).
Wie kann ich dieses Tool zum Debuggen von Kodierungsproblemen verwenden?
Das Tool hilft beim Identifizieren von Kodierungsproblemen, indem es unerwartete Zeichen anzeigt, Byte-Sequenzen enthüllt, die nicht der erwarteten Kodierung entsprechen, und Steuerzeichen hervorhebt, die nicht in Ihren Daten vorhanden sein sollten.
Was zeigen die UTF-8 und UTF-16 Byte-Darstellungen?
Sie zeigen, wie jedes Zeichen mit verschiedenen Unicode-Kodierungsschemata im Speicher gespeichert wird. UTF-8 verwendet 1-4 Bytes pro Zeichen, während UTF-16 2 oder 4 Bytes verwendet. Diese Informationen helfen, Speicheranforderungen zu verstehen.
Wie funktionieren die Filter- und Sortieroptionen?
Sie können Zeichen nach Typ filtern (alle, Steuerzeichen, Leerzeichen, druckbare, ASCII, nicht-ASCII), um sich auf bestimmte Zeichensätze zu konzentrieren. Sortieroptionen umfassen nach Unicode-Codepunkt, Zeichendarstellung oder Kategorie.
Kann dieses Tool bei Internationalisierungsproblemen (i18n) helfen?
Ja, das Tool ist hervorragend für i18n-Debugging geeignet. Es hilft, Zeichen aus unerwarteten Schriften zu identifizieren, die richtige Unicode-Komposition für verschiedene Sprachen zu überprüfen und Kodierungsprobleme in mehrsprachigen Texten zu erkennen.
Wie geht das Tool mit verschiedenen Schriftsystemen und Skripten um?
Das Tool unterstützt alle Unicode-Zeichen und -Skripte, einschließlich Latein, Kyrillisch, Arabisch, Chinesisch, Japanisch, Koreanisch, Thailändisch, Hebräisch und viele andere. Es identifiziert korrekt den Unicode-Block für jedes Zeichen.
Was soll ich tun, wenn ich unerwartete Zeichen in meinem Text finde?
Notieren Sie zunächst den Unicode-Codepunkt und die Kategorie der unerwarteten Zeichen. Prüfen Sie, ob es sich um Steuerzeichen handelt, die sicher entfernt werden können, um Kodierungsartefakte, die repariert werden müssen, oder um legitime Zeichen aus einem anderen Skript.
Wie kann ich dieses Tool zur Datenvalidierung und -bereinigung verwenden?
Verwenden Sie das Tool, um unerwünschte Zeichen in Datensätzen zu erkennen, zu überprüfen, ob der Text nur die erwarteten Zeichentypen enthält, und problematische Zeichen für die Entfernung oder den Ersatz zu identifizieren.
Kann ich Zeichen oder ihre Eigenschaften aus der Analyse kopieren?
Ja, jede Zeichenzeile enthält Kopierschaltflächen zum Kopieren des Zeichens selbst oder seines Unicode-Codepunkts. Dies erleichtert das Extrahieren bestimmter Zeichen für Tests, Dokumentation oder weitere Analyse.