Inspecteur Unicode
Analysez le texte pour révéler les caractères cachés, les points de code Unicode, les catégories de caractères et les informations d'encodage. Déboguez les problèmes.
29
Total des Caractères
20
Caractères Uniques
35
Octets UTF-8
58
Octets UTF-16
Showing 20 of 20 characters
| Caractère | Point de Code | Décimal | Hex | Catégorie | Bloc | UTF-8 | Actions |
|---|---|---|---|---|---|---|---|
\tCTRL | U+0009 | 9 | 0x0009 | Control Character | Basic Latin | 0x09 | |
\nCTRL | U+000A | 10 | 0x000A | Control Character | Basic Latin | 0x0A | |
␣WS | U+0020 | 32 | 0x0020 | Space Separator | Basic Latin | 0x20 | |
! | U+0021 | 33 | 0x0021 | Other Punctuation | Basic Latin | 0x21 | |
, | U+002C | 44 | 0x002C | Other Punctuation | Basic Latin | 0x2C | |
: | U+003A | 58 | 0x003A | Other Punctuation | Basic Latin | 0x3A | |
H | U+0048 | 72 | 0x0048 | Uppercase Letter | Basic Latin | 0x48 | |
N | U+004E | 78 | 0x004E | Uppercase Letter | Basic Latin | 0x4E | |
T | U+0054 | 84 | 0x0054 | Uppercase Letter | Basic Latin | 0x54 | |
a | U+0061 | 97 | 0x0061 | Lowercase Letter | Basic Latin | 0x61 | |
b | U+0062 | 98 | 0x0062 | Lowercase Letter | Basic Latin | 0x62 | |
e | U+0065 | 101 | 0x0065 | Lowercase Letter | Basic Latin | 0x65 | |
i | U+0069 | 105 | 0x0069 | Lowercase Letter | Basic Latin | 0x69 | |
l | U+006C | 108 | 0x006C | Lowercase Letter | Basic Latin | 0x6C | |
n | U+006E | 110 | 0x006E | Lowercase Letter | Basic Latin | 0x6E | |
o | U+006F | 111 | 0x006F | Lowercase Letter | Basic Latin | 0x6F | |
w | U+0077 | 119 | 0x0077 | Lowercase Letter | Basic Latin | 0x77 | |
世 | U+4E16 | 19990 | 0x4E16 | Unassigned | CJK Unified Ideographs | 0xE4 0xB8 0x96 | |
界 | U+754C | 30028 | 0x754C | Unassigned | CJK Unified Ideographs | 0xE7 0x95 0x8C | |
🌍 | U+1F30D | 127757 | 0x1F30D | Unassigned | Unknown Block | 0xF0 0x9F 0x8C 0x8D |
Catégories de Caractères
Lu
3 characters
Ll
8 characters
Po
3 characters
Zs
1 character
Cn
3 characters
Cc
2 characters
Blocs Unicode
Basic Latin
17 characters
CJK Unified Ideographs
2 characters
Unknown Block
1 character
Conseils Pro:
- Les caractères de contrôle sont affichés avec des séquences d'échappement (\t pour tabulation, \n pour nouvelle ligne)
- Les espaces sont affichés comme ␣ et les espaces insécables comme ⍽ pour la visibilité
- Utilisez les filtres pour vous concentrer sur des types de caractères spécifiques comme le contrôle ou non-ASCII
- Les représentations d'octets UTF-8 et UTF-16 aident à comprendre les besoins de stockage
- Les blocs Unicode regroupent les caractères apparentés du même système d'écriture ou objectif
Outils Connexes
À Propos de l'Inspecteur Unicode
Comment Ça Marche
- Analyse chaque caractère dans votre texte individuellement
- Révèle les points de code Unicode, catégories et propriétés
- Affiche les caractères de contrôle cachés et les espaces blancs
- Montre les représentations d'octets UTF-8 et UTF-16
- Catégorise les caractères par blocs et types Unicode
Cas d'Utilisation Courants
- Débogage des problèmes d'encodage de texte et de caractères
- Identification des caractères cachés ou invisibles
- Analyse des problèmes d'internationalisation
- Compréhension de la composition Unicode du texte
- Validation de la compatibilité des caractères entre systèmes
Foire Aux Questions
Qu'est-ce qu'un inspecteur Unicode et pourquoi en aurais-je besoin?
Un inspecteur Unicode analyse le texte pour révéler des informations détaillées sur chaque caractère, y compris les points de code Unicode, les catégories, les propriétés d'encodage et les caractères cachés. Il est essentiel pour déboguer les problèmes d'encodage de texte.
Comment l'outil aide-t-il à identifier les caractères cachés ou invisibles?
L'outil affiche tous les caractères de votre texte, y compris les caractères de contrôle (comme les tabulations, les nouvelles lignes), les espaces insécables et d'autres caractères Unicode invisibles. Les caractères de contrôle sont affichés avec des séquences d'échappement (\t, \n).
Quelles informations l'outil fournit-il pour chaque caractère?
Pour chaque caractère, l'outil affiche: le caractère lui-même, le point de code Unicode (U+xxxx), les valeurs décimales et hexadécimales, la catégorie et le bloc Unicode, le nom du caractère, les représentations d'octets UTF-8 et UTF-16, et des propriétés.
Que sont les catégories et blocs Unicode?
Les catégories Unicode classifient les caractères par leur type général (comme Lettre Majuscule, Nombre Décimal, Ponctuation). Les blocs Unicode regroupent les caractères par script ou par objectif (comme Latin de base, Grec et copte, Opérateurs mathématiques).
Comment puis-je utiliser cet outil pour déboguer les problèmes d'encodage?
L'outil aide à identifier les problèmes d'encodage en affichant les caractères inattendus, en révélant les séquences d'octets qui ne correspondent pas à l'encodage attendu et en mettant en évidence les caractères de contrôle.
Que montrent les représentations d'octets UTF-8 et UTF-16?
Elles montrent comment chaque caractère est stocké en mémoire en utilisant différents schémas d'encodage Unicode. UTF-8 utilise 1 à 4 octets par caractère, tandis qu'UTF-16 utilise 2 ou 4 octets. Ces informations aident à comprendre les besoins de stockage.
Comment fonctionnent les options de filtrage et de tri?
Vous pouvez filtrer les caractères par type (tous, caractères de contrôle, espaces blancs, imprimables, ASCII, non-ASCII) pour vous concentrer sur des ensembles de caractères spécifiques. Les options de tri incluent par point de code Unicode, apparence du caractère ou catégorie.
Cet outil peut-il aider avec les problèmes d'internationalisation (i18n)?
Oui, l'outil est excellent pour le débogage i18n. Il aide à identifier les caractères de scripts inattendus, à vérifier la bonne composition Unicode pour différentes langues et à détecter les problèmes d'encodage dans les textes multilingues.
Comment l'outil gère-t-il les différents systèmes d'écriture et scripts?
L'outil prend en charge tous les caractères et scripts Unicode, y compris Latin, Cyrillique, Arabe, Chinois, Japonais, Coréen, Thaï, Hébreu et bien d'autres. Il identifie correctement le bloc Unicode de chaque caractère.
Que faire si je trouve des caractères inattendus dans mon texte?
D'abord, notez le point de code Unicode et la catégorie des caractères inattendus. Vérifiez s'il s'agit de caractères de contrôle pouvant être supprimés en toute sécurité, d'artefacts d'encodage nécessitant une correction ou de caractères légitimes d'un script différent.
Comment puis-je utiliser cet outil pour la validation et le nettoyage des données?
Utilisez l'outil pour détecter les caractères indésirables dans les ensembles de données, vérifier que le texte ne contient que les types de caractères attendus et identifier les caractères problématiques pour les supprimer ou les remplacer.
Puis-je copier des caractères ou leurs propriétés depuis l'analyse?
Oui, chaque ligne de caractères comprend des boutons de copie pour copier le caractère lui-même ou son point de code Unicode. Cela facilite l'extraction de caractères spécifiques pour les tests, la documentation ou une analyse plus approfondie.