Inspetor Unicode
Analise texto para revelar caracteres ocultos, pontos de código Unicode, categorias de caracteres e informações de codificação. Depure problemas de codificação.
29
Total de Caracteres
20
Caracteres Únicos
35
Bytes UTF-8
58
Bytes UTF-16
Showing 20 of 20 characters
| Caractere | Ponto de Código | Decimal | Hex | Categoria | Bloco | UTF-8 | Ações |
|---|---|---|---|---|---|---|---|
\tCTRL | U+0009 | 9 | 0x0009 | Control Character | Basic Latin | 0x09 | |
\nCTRL | U+000A | 10 | 0x000A | Control Character | Basic Latin | 0x0A | |
␣WS | U+0020 | 32 | 0x0020 | Space Separator | Basic Latin | 0x20 | |
! | U+0021 | 33 | 0x0021 | Other Punctuation | Basic Latin | 0x21 | |
, | U+002C | 44 | 0x002C | Other Punctuation | Basic Latin | 0x2C | |
: | U+003A | 58 | 0x003A | Other Punctuation | Basic Latin | 0x3A | |
H | U+0048 | 72 | 0x0048 | Uppercase Letter | Basic Latin | 0x48 | |
N | U+004E | 78 | 0x004E | Uppercase Letter | Basic Latin | 0x4E | |
T | U+0054 | 84 | 0x0054 | Uppercase Letter | Basic Latin | 0x54 | |
a | U+0061 | 97 | 0x0061 | Lowercase Letter | Basic Latin | 0x61 | |
b | U+0062 | 98 | 0x0062 | Lowercase Letter | Basic Latin | 0x62 | |
e | U+0065 | 101 | 0x0065 | Lowercase Letter | Basic Latin | 0x65 | |
i | U+0069 | 105 | 0x0069 | Lowercase Letter | Basic Latin | 0x69 | |
l | U+006C | 108 | 0x006C | Lowercase Letter | Basic Latin | 0x6C | |
n | U+006E | 110 | 0x006E | Lowercase Letter | Basic Latin | 0x6E | |
o | U+006F | 111 | 0x006F | Lowercase Letter | Basic Latin | 0x6F | |
w | U+0077 | 119 | 0x0077 | Lowercase Letter | Basic Latin | 0x77 | |
世 | U+4E16 | 19990 | 0x4E16 | Unassigned | CJK Unified Ideographs | 0xE4 0xB8 0x96 | |
界 | U+754C | 30028 | 0x754C | Unassigned | CJK Unified Ideographs | 0xE7 0x95 0x8C | |
🌍 | U+1F30D | 127757 | 0x1F30D | Unassigned | Unknown Block | 0xF0 0x9F 0x8C 0x8D |
Categorias de Caracteres
Lu
3 characters
Ll
8 characters
Po
3 characters
Zs
1 character
Cn
3 characters
Cc
2 characters
Blocos Unicode
Basic Latin
17 characters
CJK Unified Ideographs
2 characters
Unknown Block
1 character
Dicas Pro:
- Caracteres de controle são mostrados com sequências de escape (\t para tabulação, \n para nova linha)
- Espaços são mostrados como ␣ e espaços não quebrantes como ⍽ para visibilidade
- Use filtros para focar em tipos específicos de caracteres como controle ou não-ASCII
- Representações de bytes UTF-8 e UTF-16 ajudam a entender os requisitos de armazenamento
- Blocos Unicode agrupam caracteres relacionados do mesmo sistema de escrita ou propósito
Ferramentas Relacionadas
Sobre o Inspetor Unicode
Como Funciona
- Analisa cada caractere no texto individualmente
- Revela pontos de código Unicode, categorias e propriedades
- Mostra caracteres de controle ocultos e espaços em branco
- Exibe representações de bytes UTF-8 e UTF-16
- Categoriza caracteres por blocos e tipos Unicode
Casos de Uso Comuns
- Depuração de problemas de codificação de texto e caracteres
- Identificação de caracteres ocultos ou invisíveis
- Análise de problemas de internacionalização
- Compreensão da composição Unicode do texto
- Validação de compatibilidade de caracteres entre sistemas
Perguntas Frequentes
O que é um inspetor Unicode e por que eu precisaria de um?
Um inspetor Unicode analisa o texto para revelar informações detalhadas sobre cada caractere, incluindo pontos de código Unicode, categorias, propriedades de codificação e caracteres ocultos. É essencial para depurar problemas de codificação de texto e identificar caracteres invisíveis.
Como a ferramenta ajuda a identificar caracteres ocultos ou invisíveis?
A ferramenta exibe todos os caracteres no seu texto, incluindo caracteres de controle (como tabulações, novas linhas), espaços não quebrantes e outros caracteres Unicode invisíveis. Os caracteres de controle são mostrados com sequências de escape (\t, \n) e símbolos especiais.
Que informações a ferramenta fornece para cada caractere?
Para cada caractere, a ferramenta mostra: o próprio caractere, ponto de código Unicode (U+xxxx), valores decimais e hexadecimais, categoria e bloco Unicode, nome do caractere, representações de bytes UTF-8 e UTF-16, e propriedades como se é imprimível, ASCII ou caractere de controle.
O que são categorias e blocos Unicode?
Categorias Unicode classificam os caracteres pelo seu tipo geral (como Letra Maiúscula, Número Decimal, Pontuação). Blocos Unicode agrupam caracteres por script ou propósito (como Latim Básico, Grego e Cóptico, Operadores Matemáticos).
Como posso usar esta ferramenta para depurar problemas de codificação?
A ferramenta ajuda a identificar problemas de codificação mostrando caracteres inesperados, revelando sequências de bytes que não correspondem à codificação esperada e destacando caracteres de controle que não deveriam estar nos seus dados.
O que as representações de bytes UTF-8 e UTF-16 mostram?
Elas mostram como cada caractere é armazenado na memória usando diferentes esquemas de codificação Unicode. UTF-8 usa de 1 a 4 bytes por caractere, enquanto UTF-16 usa 2 ou 4 bytes. Essa informação ajuda a entender os requisitos de armazenamento.
Como as opções de filtragem e classificação funcionam?
Você pode filtrar caracteres por tipo (todos, caracteres de controle, espaços em branco, imprimíveis, ASCII, não-ASCII) para se concentrar em conjuntos específicos. As opções de classificação incluem por ponto de código Unicode, aparência do caractere ou categoria.
Esta ferramenta pode ajudar com problemas de internacionalização (i18n)?
Sim, a ferramenta é excelente para depuração de i18n. Ela ajuda a identificar caracteres de scripts inesperados, verificar a composição Unicode correta para diferentes idiomas e detectar problemas de codificação em texto multilíngue.
Como a ferramenta lida com diferentes sistemas de escrita e scripts?
A ferramenta suporta todos os caracteres e scripts Unicode, incluindo Latim, Cirílico, Árabe, Chinês, Japonês, Coreano, Tailandês, Hebraico e muitos outros. Ela identifica corretamente o bloco Unicode de cada caractere.
O que devo fazer se encontrar caracteres inesperados no meu texto?
Primeiro, anote o ponto de código Unicode e a categoria dos caracteres inesperados. Verifique se são caracteres de controle que podem ser removidos com segurança, artefatos de codificação que precisam de correção ou caracteres legítimos de um script diferente.
Como posso usar esta ferramenta para validação e limpeza de dados?
Use a ferramenta para detectar caracteres indesejados em conjuntos de dados, verificar se o texto contém apenas os tipos de caracteres esperados e identificar caracteres problemáticos para remoção ou substituição.
Posso copiar caracteres ou suas propriedades da análise?
Sim, cada linha de caracteres inclui botões de cópia para copiar o próprio caractere ou seu ponto de código Unicode. Isso facilita extrair caracteres específicos para testes, documentação ou análise adicional.