Inspecteur Unicode

Analysez le texte pour révéler les caractères cachés, les points de code Unicode, les catégories de caractères et les informations d'encodage. Déboguez les problèmes.

29
Total des Caractères
20
Caractères Uniques
35
Octets UTF-8
58
Octets UTF-16
Showing 20 of 20 characters
CaractèrePoint de CodeDécimalHexCatégorieBlocUTF-8Actions
\tCTRL
U+000990x0009Control CharacterBasic Latin0x09
\nCTRL
U+000A100x000AControl CharacterBasic Latin0x0A
WS
U+0020320x0020Space SeparatorBasic Latin0x20
!
U+0021330x0021Other PunctuationBasic Latin0x21
,
U+002C440x002COther PunctuationBasic Latin0x2C
:
U+003A580x003AOther PunctuationBasic Latin0x3A
H
U+0048720x0048Uppercase LetterBasic Latin0x48
N
U+004E780x004EUppercase LetterBasic Latin0x4E
T
U+0054840x0054Uppercase LetterBasic Latin0x54
a
U+0061970x0061Lowercase LetterBasic Latin0x61
b
U+0062980x0062Lowercase LetterBasic Latin0x62
e
U+00651010x0065Lowercase LetterBasic Latin0x65
i
U+00691050x0069Lowercase LetterBasic Latin0x69
l
U+006C1080x006CLowercase LetterBasic Latin0x6C
n
U+006E1100x006ELowercase LetterBasic Latin0x6E
o
U+006F1110x006FLowercase LetterBasic Latin0x6F
w
U+00771190x0077Lowercase LetterBasic Latin0x77
U+4E16199900x4E16UnassignedCJK Unified Ideographs0xE4 0xB8 0x96
U+754C300280x754CUnassignedCJK Unified Ideographs0xE7 0x95 0x8C
🌍
U+1F30D1277570x1F30DUnassignedUnknown Block0xF0 0x9F 0x8C 0x8D

Catégories de Caractères

Lu
3 characters
Ll
8 characters
Po
3 characters
Zs
1 character
Cn
3 characters
Cc
2 characters

Blocs Unicode

Basic Latin
17 characters
CJK Unified Ideographs
2 characters
Unknown Block
1 character

Conseils Pro:

  • Les caractères de contrôle sont affichés avec des séquences d'échappement (\t pour tabulation, \n pour nouvelle ligne)
  • Les espaces sont affichés comme ␣ et les espaces insécables comme ⍽ pour la visibilité
  • Utilisez les filtres pour vous concentrer sur des types de caractères spécifiques comme le contrôle ou non-ASCII
  • Les représentations d'octets UTF-8 et UTF-16 aident à comprendre les besoins de stockage
  • Les blocs Unicode regroupent les caractères apparentés du même système d'écriture ou objectif

Share this tool

Help others discover Unicode Inspector

À Propos de l'Inspecteur Unicode

Comment Ça Marche

  • Analyse chaque caractère dans votre texte individuellement
  • Révèle les points de code Unicode, catégories et propriétés
  • Affiche les caractères de contrôle cachés et les espaces blancs
  • Montre les représentations d'octets UTF-8 et UTF-16
  • Catégorise les caractères par blocs et types Unicode

Cas d'Utilisation Courants

  • Débogage des problèmes d'encodage de texte et de caractères
  • Identification des caractères cachés ou invisibles
  • Analyse des problèmes d'internationalisation
  • Compréhension de la composition Unicode du texte
  • Validation de la compatibilité des caractères entre systèmes

Foire Aux Questions

Qu'est-ce qu'un inspecteur Unicode et pourquoi en aurais-je besoin?

Un inspecteur Unicode analyse le texte pour révéler des informations détaillées sur chaque caractère, y compris les points de code Unicode, les catégories, les propriétés d'encodage et les caractères cachés. Il est essentiel pour déboguer les problèmes d'encodage de texte.

Comment l'outil aide-t-il à identifier les caractères cachés ou invisibles?

L'outil affiche tous les caractères de votre texte, y compris les caractères de contrôle (comme les tabulations, les nouvelles lignes), les espaces insécables et d'autres caractères Unicode invisibles. Les caractères de contrôle sont affichés avec des séquences d'échappement (\t, \n).

Quelles informations l'outil fournit-il pour chaque caractère?

Pour chaque caractère, l'outil affiche: le caractère lui-même, le point de code Unicode (U+xxxx), les valeurs décimales et hexadécimales, la catégorie et le bloc Unicode, le nom du caractère, les représentations d'octets UTF-8 et UTF-16, et des propriétés.

Que sont les catégories et blocs Unicode?

Les catégories Unicode classifient les caractères par leur type général (comme Lettre Majuscule, Nombre Décimal, Ponctuation). Les blocs Unicode regroupent les caractères par script ou par objectif (comme Latin de base, Grec et copte, Opérateurs mathématiques).

Comment puis-je utiliser cet outil pour déboguer les problèmes d'encodage?

L'outil aide à identifier les problèmes d'encodage en affichant les caractères inattendus, en révélant les séquences d'octets qui ne correspondent pas à l'encodage attendu et en mettant en évidence les caractères de contrôle.

Que montrent les représentations d'octets UTF-8 et UTF-16?

Elles montrent comment chaque caractère est stocké en mémoire en utilisant différents schémas d'encodage Unicode. UTF-8 utilise 1 à 4 octets par caractère, tandis qu'UTF-16 utilise 2 ou 4 octets. Ces informations aident à comprendre les besoins de stockage.

Comment fonctionnent les options de filtrage et de tri?

Vous pouvez filtrer les caractères par type (tous, caractères de contrôle, espaces blancs, imprimables, ASCII, non-ASCII) pour vous concentrer sur des ensembles de caractères spécifiques. Les options de tri incluent par point de code Unicode, apparence du caractère ou catégorie.

Cet outil peut-il aider avec les problèmes d'internationalisation (i18n)?

Oui, l'outil est excellent pour le débogage i18n. Il aide à identifier les caractères de scripts inattendus, à vérifier la bonne composition Unicode pour différentes langues et à détecter les problèmes d'encodage dans les textes multilingues.

Comment l'outil gère-t-il les différents systèmes d'écriture et scripts?

L'outil prend en charge tous les caractères et scripts Unicode, y compris Latin, Cyrillique, Arabe, Chinois, Japonais, Coréen, Thaï, Hébreu et bien d'autres. Il identifie correctement le bloc Unicode de chaque caractère.

Que faire si je trouve des caractères inattendus dans mon texte?

D'abord, notez le point de code Unicode et la catégorie des caractères inattendus. Vérifiez s'il s'agit de caractères de contrôle pouvant être supprimés en toute sécurité, d'artefacts d'encodage nécessitant une correction ou de caractères légitimes d'un script différent.

Comment puis-je utiliser cet outil pour la validation et le nettoyage des données?

Utilisez l'outil pour détecter les caractères indésirables dans les ensembles de données, vérifier que le texte ne contient que les types de caractères attendus et identifier les caractères problématiques pour les supprimer ou les remplacer.

Puis-je copier des caractères ou leurs propriétés depuis l'analyse?

Oui, chaque ligne de caractères comprend des boutons de copie pour copier le caractère lui-même ou son point de code Unicode. Cela facilite l'extraction de caractères spécifiques pour les tests, la documentation ou une analyse plus approfondie.

Share ToolsZone

Help others discover these free tools!

Partager cette page

Inspecteur Unicode | Analyser les Caractères et Points de Code