Unicode-Inspektor

Analysieren Sie Text, um versteckte Zeichen, Unicode-Codepunkte, Zeichenkategorien und Kodierungsinformationen zu enthüllen. Debuggen Sie Textkodierungsprobleme.

Zu analysierender Text

Gesamtzeichen

Eindeutige Zeichen

UTF-8-Bytes

UTF-16-Bytes

Filtern:

Sortieren nach:

Showing 20 of 20 characters

Zeichen	Codepunkt	Dezimal	Hex	Kategorie	Block	UTF-8
\tCTRL	U+0009	9	0x0009	Control Character	Basic Latin	0x09
\nCTRL	U+000A	10	0x000A	Control Character	Basic Latin	0x0A
␣WS	U+0020	32	0x0020	Space Separator	Basic Latin	0x20
!	U+0021	33	0x0021	Other Punctuation	Basic Latin	0x21
,	U+002C	44	0x002C	Other Punctuation	Basic Latin	0x2C
:	U+003A	58	0x003A	Other Punctuation	Basic Latin	0x3A
H	U+0048	72	0x0048	Uppercase Letter	Basic Latin	0x48
N	U+004E	78	0x004E	Uppercase Letter	Basic Latin	0x4E
T	U+0054	84	0x0054	Uppercase Letter	Basic Latin	0x54
a	U+0061	97	0x0061	Lowercase Letter	Basic Latin	0x61
b	U+0062	98	0x0062	Lowercase Letter	Basic Latin	0x62
e	U+0065	101	0x0065	Lowercase Letter	Basic Latin	0x65
i	U+0069	105	0x0069	Lowercase Letter	Basic Latin	0x69
l	U+006C	108	0x006C	Lowercase Letter	Basic Latin	0x6C
n	U+006E	110	0x006E	Lowercase Letter	Basic Latin	0x6E
o	U+006F	111	0x006F	Lowercase Letter	Basic Latin	0x6F
w	U+0077	119	0x0077	Lowercase Letter	Basic Latin	0x77
世	U+4E16	19990	0x4E16	Unassigned	CJK Unified Ideographs	0xE4 0xB8 0x96
界	U+754C	30028	0x754C	Unassigned	CJK Unified Ideographs	0xE7 0x95 0x8C
🌍	U+1F30D	127757	0x1F30D	Unassigned	Unknown Block	0xF0 0x9F 0x8C 0x8D

Zeichenkategorien

3 characters

8 characters

3 characters

1 character

3 characters

2 characters

Unicode-Blöcke

Basic Latin

17 characters

CJK Unified Ideographs

2 characters

Unknown Block

1 character

Profi-Tipps:

Steuerzeichen werden mit Escape-Sequenzen angezeigt (\t für Tabulator, \n für Zeilenumbruch)
Leerzeichen werden als ␣ und geschützte Leerzeichen als ⍽ zur Sichtbarkeit angezeigt
Verwenden Sie Filter, um sich auf bestimmte Zeichentypen wie Steuer- oder Nicht-ASCII-Zeichen zu konzentrieren
UTF-8 und UTF-16 Byte-Darstellungen helfen beim Verständnis der Speicheranforderungen
Unicode-Blöcke gruppieren verwandte Zeichen aus demselben Schriftsystem oder Zweck

Unicode Text Styler

Zero-Width Character Detector

Über den Unicode-Inspektor

So Funktioniert Es

Analysiert jedes Zeichen in Ihrem Text einzeln
Enthüllt Unicode-Codepunkte, Kategorien und Eigenschaften
Zeigt versteckte Steuerzeichen und Leerzeichen an
Zeigt UTF-8 und UTF-16 Byte-Darstellungen
Kategorisiert Zeichen nach Unicode-Blöcken und -Typen

Häufige Anwendungsfälle

Debuggen von Textkodierungs- und Zeichenproblemen
Identifizieren versteckter oder unsichtbarer Zeichen
Analysieren von Internationalisierungsproblemen
Verstehen der Unicode-Zusammensetzung von Text
Validieren der Zeichenkompatibilität zwischen Systemen

Häufig Gestellte Fragen

Was ist ein Unicode-Inspektor und warum würde ich einen brauchen?

Ein Unicode-Inspektor analysiert Text, um detaillierte Informationen über jedes Zeichen zu enthüllen, einschließlich Unicode-Codepunkte, Kategorien, Kodierungseigenschaften und versteckte Zeichen. Er ist unverzichtbar für das Debuggen von Textkodierungsproblemen.

Wie hilft das Tool beim Identifizieren versteckter oder unsichtbarer Zeichen?

Das Tool zeigt alle Zeichen in Ihrem Text an, einschließlich Steuerzeichen (wie Tabulatoren, Zeilenumbrüche), geschützte Leerzeichen und andere unsichtbare Unicode-Zeichen. Steuerzeichen werden mit Escape-Sequenzen (\t, \n) und speziellen Symbolen angezeigt.

Welche Informationen liefert das Tool für jedes Zeichen?

Für jedes Zeichen zeigt das Tool: das Zeichen selbst, Unicode-Codepunkt (U+xxxx), Dezimal- und Hexadezimalwerte, Unicode-Kategorie und Block, Zeichenname, UTF-8 und UTF-16 Byte-Darstellungen sowie Eigenschaften wie Druckbarkeit, ASCII oder Steuerzeichen.

Was sind Unicode-Kategorien und -Blöcke?

Unicode-Kategorien klassifizieren Zeichen nach ihrem allgemeinen Typ (z.B. Großbuchstabe, Dezimalzahl, Interpunktion). Unicode-Blöcke gruppieren Zeichen nach Schrift oder Zweck (z.B. Grundlegendes Latein, Griechisch und Koptisch, Mathematische Operatoren).

Wie kann ich dieses Tool zum Debuggen von Kodierungsproblemen verwenden?

Das Tool hilft beim Identifizieren von Kodierungsproblemen, indem es unerwartete Zeichen anzeigt, Byte-Sequenzen enthüllt, die nicht der erwarteten Kodierung entsprechen, und Steuerzeichen hervorhebt, die nicht in Ihren Daten vorhanden sein sollten.

Was zeigen die UTF-8 und UTF-16 Byte-Darstellungen?

Sie zeigen, wie jedes Zeichen mit verschiedenen Unicode-Kodierungsschemata im Speicher gespeichert wird. UTF-8 verwendet 1-4 Bytes pro Zeichen, während UTF-16 2 oder 4 Bytes verwendet. Diese Informationen helfen, Speicheranforderungen zu verstehen.

Wie funktionieren die Filter- und Sortieroptionen?

Sie können Zeichen nach Typ filtern (alle, Steuerzeichen, Leerzeichen, druckbare, ASCII, nicht-ASCII), um sich auf bestimmte Zeichensätze zu konzentrieren. Sortieroptionen umfassen nach Unicode-Codepunkt, Zeichendarstellung oder Kategorie.

Kann dieses Tool bei Internationalisierungsproblemen (i18n) helfen?

Ja, das Tool ist hervorragend für i18n-Debugging geeignet. Es hilft, Zeichen aus unerwarteten Schriften zu identifizieren, die richtige Unicode-Komposition für verschiedene Sprachen zu überprüfen und Kodierungsprobleme in mehrsprachigen Texten zu erkennen.

Wie geht das Tool mit verschiedenen Schriftsystemen und Skripten um?

Das Tool unterstützt alle Unicode-Zeichen und -Skripte, einschließlich Latein, Kyrillisch, Arabisch, Chinesisch, Japanisch, Koreanisch, Thailändisch, Hebräisch und viele andere. Es identifiziert korrekt den Unicode-Block für jedes Zeichen.

Was soll ich tun, wenn ich unerwartete Zeichen in meinem Text finde?

Notieren Sie zunächst den Unicode-Codepunkt und die Kategorie der unerwarteten Zeichen. Prüfen Sie, ob es sich um Steuerzeichen handelt, die sicher entfernt werden können, um Kodierungsartefakte, die repariert werden müssen, oder um legitime Zeichen aus einem anderen Skript.

Wie kann ich dieses Tool zur Datenvalidierung und -bereinigung verwenden?

Verwenden Sie das Tool, um unerwünschte Zeichen in Datensätzen zu erkennen, zu überprüfen, ob der Text nur die erwarteten Zeichentypen enthält, und problematische Zeichen für die Entfernung oder den Ersatz zu identifizieren.

Kann ich Zeichen oder ihre Eigenschaften aus der Analyse kopieren?

Ja, jede Zeichenzeile enthält Kopierschaltflächen zum Kopieren des Zeichens selbst oder seines Unicode-Codepunkts. Dies erleichtert das Extrahieren bestimmter Zeichen für Tests, Dokumentation oder weitere Analyse.

Unicode-Inspektor

Zeichenkategorien

Unicode-Blöcke

Verwandte Tools

Unicode Text Styler

Character Distribution Analyzer

Text Stats Analyzer

String Escaper

HTML Escape / Unescape

URL Encoder/Decoder

Base64 Encoder/Decoder

Text Encoding Converter

Share this tool

Über den Unicode-Inspektor

So Funktioniert Es

Häufige Anwendungsfälle

Häufig Gestellte Fragen

Was ist ein Unicode-Inspektor und warum würde ich einen brauchen?

Wie hilft das Tool beim Identifizieren versteckter oder unsichtbarer Zeichen?

Welche Informationen liefert das Tool für jedes Zeichen?

Was sind Unicode-Kategorien und -Blöcke?

Wie kann ich dieses Tool zum Debuggen von Kodierungsproblemen verwenden?

Was zeigen die UTF-8 und UTF-16 Byte-Darstellungen?

Wie funktionieren die Filter- und Sortieroptionen?

Kann dieses Tool bei Internationalisierungsproblemen (i18n) helfen?

Wie geht das Tool mit verschiedenen Schriftsystemen und Skripten um?

Was soll ich tun, wenn ich unerwartete Zeichen in meinem Text finde?

Wie kann ich dieses Tool zur Datenvalidierung und -bereinigung verwenden?

Kann ich Zeichen oder ihre Eigenschaften aus der Analyse kopieren?

Share ToolsZone