Inspetor Unicode

Analise texto para revelar caracteres ocultos, pontos de código Unicode, categorias de caracteres e informações de codificação. Depure problemas de codificação.

29
Total de Caracteres
20
Caracteres Únicos
35
Bytes UTF-8
58
Bytes UTF-16
Showing 20 of 20 characters
CaracterePonto de CódigoDecimalHexCategoriaBlocoUTF-8Ações
\tCTRL
U+000990x0009Control CharacterBasic Latin0x09
\nCTRL
U+000A100x000AControl CharacterBasic Latin0x0A
WS
U+0020320x0020Space SeparatorBasic Latin0x20
!
U+0021330x0021Other PunctuationBasic Latin0x21
,
U+002C440x002COther PunctuationBasic Latin0x2C
:
U+003A580x003AOther PunctuationBasic Latin0x3A
H
U+0048720x0048Uppercase LetterBasic Latin0x48
N
U+004E780x004EUppercase LetterBasic Latin0x4E
T
U+0054840x0054Uppercase LetterBasic Latin0x54
a
U+0061970x0061Lowercase LetterBasic Latin0x61
b
U+0062980x0062Lowercase LetterBasic Latin0x62
e
U+00651010x0065Lowercase LetterBasic Latin0x65
i
U+00691050x0069Lowercase LetterBasic Latin0x69
l
U+006C1080x006CLowercase LetterBasic Latin0x6C
n
U+006E1100x006ELowercase LetterBasic Latin0x6E
o
U+006F1110x006FLowercase LetterBasic Latin0x6F
w
U+00771190x0077Lowercase LetterBasic Latin0x77
U+4E16199900x4E16UnassignedCJK Unified Ideographs0xE4 0xB8 0x96
U+754C300280x754CUnassignedCJK Unified Ideographs0xE7 0x95 0x8C
🌍
U+1F30D1277570x1F30DUnassignedUnknown Block0xF0 0x9F 0x8C 0x8D

Categorias de Caracteres

Lu
3 characters
Ll
8 characters
Po
3 characters
Zs
1 character
Cn
3 characters
Cc
2 characters

Blocos Unicode

Basic Latin
17 characters
CJK Unified Ideographs
2 characters
Unknown Block
1 character

Dicas Pro:

  • Caracteres de controle são mostrados com sequências de escape (\t para tabulação, \n para nova linha)
  • Espaços são mostrados como ␣ e espaços não quebrantes como ⍽ para visibilidade
  • Use filtros para focar em tipos específicos de caracteres como controle ou não-ASCII
  • Representações de bytes UTF-8 e UTF-16 ajudam a entender os requisitos de armazenamento
  • Blocos Unicode agrupam caracteres relacionados do mesmo sistema de escrita ou propósito

Share this tool

Help others discover Unicode Inspector

Sobre o Inspetor Unicode

Como Funciona

  • Analisa cada caractere no texto individualmente
  • Revela pontos de código Unicode, categorias e propriedades
  • Mostra caracteres de controle ocultos e espaços em branco
  • Exibe representações de bytes UTF-8 e UTF-16
  • Categoriza caracteres por blocos e tipos Unicode

Casos de Uso Comuns

  • Depuração de problemas de codificação de texto e caracteres
  • Identificação de caracteres ocultos ou invisíveis
  • Análise de problemas de internacionalização
  • Compreensão da composição Unicode do texto
  • Validação de compatibilidade de caracteres entre sistemas

Perguntas Frequentes

O que é um inspetor Unicode e por que eu precisaria de um?

Um inspetor Unicode analisa o texto para revelar informações detalhadas sobre cada caractere, incluindo pontos de código Unicode, categorias, propriedades de codificação e caracteres ocultos. É essencial para depurar problemas de codificação de texto e identificar caracteres invisíveis.

Como a ferramenta ajuda a identificar caracteres ocultos ou invisíveis?

A ferramenta exibe todos os caracteres no seu texto, incluindo caracteres de controle (como tabulações, novas linhas), espaços não quebrantes e outros caracteres Unicode invisíveis. Os caracteres de controle são mostrados com sequências de escape (\t, \n) e símbolos especiais.

Que informações a ferramenta fornece para cada caractere?

Para cada caractere, a ferramenta mostra: o próprio caractere, ponto de código Unicode (U+xxxx), valores decimais e hexadecimais, categoria e bloco Unicode, nome do caractere, representações de bytes UTF-8 e UTF-16, e propriedades como se é imprimível, ASCII ou caractere de controle.

O que são categorias e blocos Unicode?

Categorias Unicode classificam os caracteres pelo seu tipo geral (como Letra Maiúscula, Número Decimal, Pontuação). Blocos Unicode agrupam caracteres por script ou propósito (como Latim Básico, Grego e Cóptico, Operadores Matemáticos).

Como posso usar esta ferramenta para depurar problemas de codificação?

A ferramenta ajuda a identificar problemas de codificação mostrando caracteres inesperados, revelando sequências de bytes que não correspondem à codificação esperada e destacando caracteres de controle que não deveriam estar nos seus dados.

O que as representações de bytes UTF-8 e UTF-16 mostram?

Elas mostram como cada caractere é armazenado na memória usando diferentes esquemas de codificação Unicode. UTF-8 usa de 1 a 4 bytes por caractere, enquanto UTF-16 usa 2 ou 4 bytes. Essa informação ajuda a entender os requisitos de armazenamento.

Como as opções de filtragem e classificação funcionam?

Você pode filtrar caracteres por tipo (todos, caracteres de controle, espaços em branco, imprimíveis, ASCII, não-ASCII) para se concentrar em conjuntos específicos. As opções de classificação incluem por ponto de código Unicode, aparência do caractere ou categoria.

Esta ferramenta pode ajudar com problemas de internacionalização (i18n)?

Sim, a ferramenta é excelente para depuração de i18n. Ela ajuda a identificar caracteres de scripts inesperados, verificar a composição Unicode correta para diferentes idiomas e detectar problemas de codificação em texto multilíngue.

Como a ferramenta lida com diferentes sistemas de escrita e scripts?

A ferramenta suporta todos os caracteres e scripts Unicode, incluindo Latim, Cirílico, Árabe, Chinês, Japonês, Coreano, Tailandês, Hebraico e muitos outros. Ela identifica corretamente o bloco Unicode de cada caractere.

O que devo fazer se encontrar caracteres inesperados no meu texto?

Primeiro, anote o ponto de código Unicode e a categoria dos caracteres inesperados. Verifique se são caracteres de controle que podem ser removidos com segurança, artefatos de codificação que precisam de correção ou caracteres legítimos de um script diferente.

Como posso usar esta ferramenta para validação e limpeza de dados?

Use a ferramenta para detectar caracteres indesejados em conjuntos de dados, verificar se o texto contém apenas os tipos de caracteres esperados e identificar caracteres problemáticos para remoção ou substituição.

Posso copiar caracteres ou suas propriedades da análise?

Sim, cada linha de caracteres inclui botões de cópia para copiar o próprio caractere ou seu ponto de código Unicode. Isso facilita extrair caracteres específicos para testes, documentação ou análise adicional.

Share ToolsZone

Help others discover these free tools!

Compartilhar esta página

Inspetor Unicode | Analisar Caracteres e Pontos de Código