Unicode-Inspektor

Analysieren Sie Text, um versteckte Zeichen, Unicode-Codepunkte, Zeichenkategorien und Kodierungsinformationen zu enthüllen. Debuggen Sie Textkodierungsprobleme.

29
Gesamtzeichen
20
Eindeutige Zeichen
35
UTF-8-Bytes
58
UTF-16-Bytes
Showing 20 of 20 characters
ZeichenCodepunktDezimalHexKategorieBlockUTF-8Aktionen
\tCTRL
U+000990x0009Control CharacterBasic Latin0x09
\nCTRL
U+000A100x000AControl CharacterBasic Latin0x0A
WS
U+0020320x0020Space SeparatorBasic Latin0x20
!
U+0021330x0021Other PunctuationBasic Latin0x21
,
U+002C440x002COther PunctuationBasic Latin0x2C
:
U+003A580x003AOther PunctuationBasic Latin0x3A
H
U+0048720x0048Uppercase LetterBasic Latin0x48
N
U+004E780x004EUppercase LetterBasic Latin0x4E
T
U+0054840x0054Uppercase LetterBasic Latin0x54
a
U+0061970x0061Lowercase LetterBasic Latin0x61
b
U+0062980x0062Lowercase LetterBasic Latin0x62
e
U+00651010x0065Lowercase LetterBasic Latin0x65
i
U+00691050x0069Lowercase LetterBasic Latin0x69
l
U+006C1080x006CLowercase LetterBasic Latin0x6C
n
U+006E1100x006ELowercase LetterBasic Latin0x6E
o
U+006F1110x006FLowercase LetterBasic Latin0x6F
w
U+00771190x0077Lowercase LetterBasic Latin0x77
U+4E16199900x4E16UnassignedCJK Unified Ideographs0xE4 0xB8 0x96
U+754C300280x754CUnassignedCJK Unified Ideographs0xE7 0x95 0x8C
🌍
U+1F30D1277570x1F30DUnassignedUnknown Block0xF0 0x9F 0x8C 0x8D

Zeichenkategorien

Lu
3 characters
Ll
8 characters
Po
3 characters
Zs
1 character
Cn
3 characters
Cc
2 characters

Unicode-Blöcke

Basic Latin
17 characters
CJK Unified Ideographs
2 characters
Unknown Block
1 character

Profi-Tipps:

  • Steuerzeichen werden mit Escape-Sequenzen angezeigt (\t für Tabulator, \n für Zeilenumbruch)
  • Leerzeichen werden als ␣ und geschützte Leerzeichen als ⍽ zur Sichtbarkeit angezeigt
  • Verwenden Sie Filter, um sich auf bestimmte Zeichentypen wie Steuer- oder Nicht-ASCII-Zeichen zu konzentrieren
  • UTF-8 und UTF-16 Byte-Darstellungen helfen beim Verständnis der Speicheranforderungen
  • Unicode-Blöcke gruppieren verwandte Zeichen aus demselben Schriftsystem oder Zweck

Share this tool

Help others discover Unicode Inspector

Über den Unicode-Inspektor

So Funktioniert Es

  • Analysiert jedes Zeichen in Ihrem Text einzeln
  • Enthüllt Unicode-Codepunkte, Kategorien und Eigenschaften
  • Zeigt versteckte Steuerzeichen und Leerzeichen an
  • Zeigt UTF-8 und UTF-16 Byte-Darstellungen
  • Kategorisiert Zeichen nach Unicode-Blöcken und -Typen

Häufige Anwendungsfälle

  • Debuggen von Textkodierungs- und Zeichenproblemen
  • Identifizieren versteckter oder unsichtbarer Zeichen
  • Analysieren von Internationalisierungsproblemen
  • Verstehen der Unicode-Zusammensetzung von Text
  • Validieren der Zeichenkompatibilität zwischen Systemen

Häufig Gestellte Fragen

Was ist ein Unicode-Inspektor und warum würde ich einen brauchen?

Ein Unicode-Inspektor analysiert Text, um detaillierte Informationen über jedes Zeichen zu enthüllen, einschließlich Unicode-Codepunkte, Kategorien, Kodierungseigenschaften und versteckte Zeichen. Er ist unverzichtbar für das Debuggen von Textkodierungsproblemen.

Wie hilft das Tool beim Identifizieren versteckter oder unsichtbarer Zeichen?

Das Tool zeigt alle Zeichen in Ihrem Text an, einschließlich Steuerzeichen (wie Tabulatoren, Zeilenumbrüche), geschützte Leerzeichen und andere unsichtbare Unicode-Zeichen. Steuerzeichen werden mit Escape-Sequenzen (\t, \n) und speziellen Symbolen angezeigt.

Welche Informationen liefert das Tool für jedes Zeichen?

Für jedes Zeichen zeigt das Tool: das Zeichen selbst, Unicode-Codepunkt (U+xxxx), Dezimal- und Hexadezimalwerte, Unicode-Kategorie und Block, Zeichenname, UTF-8 und UTF-16 Byte-Darstellungen sowie Eigenschaften wie Druckbarkeit, ASCII oder Steuerzeichen.

Was sind Unicode-Kategorien und -Blöcke?

Unicode-Kategorien klassifizieren Zeichen nach ihrem allgemeinen Typ (z.B. Großbuchstabe, Dezimalzahl, Interpunktion). Unicode-Blöcke gruppieren Zeichen nach Schrift oder Zweck (z.B. Grundlegendes Latein, Griechisch und Koptisch, Mathematische Operatoren).

Wie kann ich dieses Tool zum Debuggen von Kodierungsproblemen verwenden?

Das Tool hilft beim Identifizieren von Kodierungsproblemen, indem es unerwartete Zeichen anzeigt, Byte-Sequenzen enthüllt, die nicht der erwarteten Kodierung entsprechen, und Steuerzeichen hervorhebt, die nicht in Ihren Daten vorhanden sein sollten.

Was zeigen die UTF-8 und UTF-16 Byte-Darstellungen?

Sie zeigen, wie jedes Zeichen mit verschiedenen Unicode-Kodierungsschemata im Speicher gespeichert wird. UTF-8 verwendet 1-4 Bytes pro Zeichen, während UTF-16 2 oder 4 Bytes verwendet. Diese Informationen helfen, Speicheranforderungen zu verstehen.

Wie funktionieren die Filter- und Sortieroptionen?

Sie können Zeichen nach Typ filtern (alle, Steuerzeichen, Leerzeichen, druckbare, ASCII, nicht-ASCII), um sich auf bestimmte Zeichensätze zu konzentrieren. Sortieroptionen umfassen nach Unicode-Codepunkt, Zeichendarstellung oder Kategorie.

Kann dieses Tool bei Internationalisierungsproblemen (i18n) helfen?

Ja, das Tool ist hervorragend für i18n-Debugging geeignet. Es hilft, Zeichen aus unerwarteten Schriften zu identifizieren, die richtige Unicode-Komposition für verschiedene Sprachen zu überprüfen und Kodierungsprobleme in mehrsprachigen Texten zu erkennen.

Wie geht das Tool mit verschiedenen Schriftsystemen und Skripten um?

Das Tool unterstützt alle Unicode-Zeichen und -Skripte, einschließlich Latein, Kyrillisch, Arabisch, Chinesisch, Japanisch, Koreanisch, Thailändisch, Hebräisch und viele andere. Es identifiziert korrekt den Unicode-Block für jedes Zeichen.

Was soll ich tun, wenn ich unerwartete Zeichen in meinem Text finde?

Notieren Sie zunächst den Unicode-Codepunkt und die Kategorie der unerwarteten Zeichen. Prüfen Sie, ob es sich um Steuerzeichen handelt, die sicher entfernt werden können, um Kodierungsartefakte, die repariert werden müssen, oder um legitime Zeichen aus einem anderen Skript.

Wie kann ich dieses Tool zur Datenvalidierung und -bereinigung verwenden?

Verwenden Sie das Tool, um unerwünschte Zeichen in Datensätzen zu erkennen, zu überprüfen, ob der Text nur die erwarteten Zeichentypen enthält, und problematische Zeichen für die Entfernung oder den Ersatz zu identifizieren.

Kann ich Zeichen oder ihre Eigenschaften aus der Analyse kopieren?

Ja, jede Zeichenzeile enthält Kopierschaltflächen zum Kopieren des Zeichens selbst oder seines Unicode-Codepunkts. Dies erleichtert das Extrahieren bestimmter Zeichen für Tests, Dokumentation oder weitere Analyse.

Share ToolsZone

Help others discover these free tools!

Diese Seite teilen

Unicode-Inspektor | Zeichen und Codepunkte analysieren