Inspetor Unicode

Analise texto para revelar caracteres ocultos, pontos de código Unicode, categorias de caracteres e informações de codificação. Depure problemas de codificação.

Texto para Analisar

Total de Caracteres

Caracteres Únicos

Bytes UTF-8

Bytes UTF-16

Filtrar:

Ordenar por:

Showing 20 of 20 characters

Caractere	Ponto de Código	Decimal	Hex	Categoria	Bloco	UTF-8
\tCTRL	U+0009	9	0x0009	Control Character	Basic Latin	0x09
\nCTRL	U+000A	10	0x000A	Control Character	Basic Latin	0x0A
␣WS	U+0020	32	0x0020	Space Separator	Basic Latin	0x20
!	U+0021	33	0x0021	Other Punctuation	Basic Latin	0x21
,	U+002C	44	0x002C	Other Punctuation	Basic Latin	0x2C
:	U+003A	58	0x003A	Other Punctuation	Basic Latin	0x3A
H	U+0048	72	0x0048	Uppercase Letter	Basic Latin	0x48
N	U+004E	78	0x004E	Uppercase Letter	Basic Latin	0x4E
T	U+0054	84	0x0054	Uppercase Letter	Basic Latin	0x54
a	U+0061	97	0x0061	Lowercase Letter	Basic Latin	0x61
b	U+0062	98	0x0062	Lowercase Letter	Basic Latin	0x62
e	U+0065	101	0x0065	Lowercase Letter	Basic Latin	0x65
i	U+0069	105	0x0069	Lowercase Letter	Basic Latin	0x69
l	U+006C	108	0x006C	Lowercase Letter	Basic Latin	0x6C
n	U+006E	110	0x006E	Lowercase Letter	Basic Latin	0x6E
o	U+006F	111	0x006F	Lowercase Letter	Basic Latin	0x6F
w	U+0077	119	0x0077	Lowercase Letter	Basic Latin	0x77
世	U+4E16	19990	0x4E16	Unassigned	CJK Unified Ideographs	0xE4 0xB8 0x96
界	U+754C	30028	0x754C	Unassigned	CJK Unified Ideographs	0xE7 0x95 0x8C
🌍	U+1F30D	127757	0x1F30D	Unassigned	Unknown Block	0xF0 0x9F 0x8C 0x8D

Categorias de Caracteres

3 characters

8 characters

3 characters

1 character

3 characters

2 characters

Blocos Unicode

Basic Latin

17 characters

CJK Unified Ideographs

2 characters

Unknown Block

1 character

Dicas Pro:

Caracteres de controle são mostrados com sequências de escape (\t para tabulação, \n para nova linha)
Espaços são mostrados como ␣ e espaços não quebrantes como ⍽ para visibilidade
Use filtros para focar em tipos específicos de caracteres como controle ou não-ASCII
Representações de bytes UTF-8 e UTF-16 ajudam a entender os requisitos de armazenamento
Blocos Unicode agrupam caracteres relacionados do mesmo sistema de escrita ou propósito

Unicode Text Styler

Zero-Width Character Detector

Ferramentas Relacionadas

Unicode Text Styler

Character Distribution Analyzer

Text Stats Analyzer

String Escaper

HTML Escape / Unescape

URL Encoder/Decoder

Base64 Encoder/Decoder

Text Encoding Converter

Share this tool

Help others discover Unicode Inspector

Sobre o Inspetor Unicode

Como Funciona

Analisa cada caractere no texto individualmente
Revela pontos de código Unicode, categorias e propriedades
Mostra caracteres de controle ocultos e espaços em branco
Exibe representações de bytes UTF-8 e UTF-16
Categoriza caracteres por blocos e tipos Unicode

Casos de Uso Comuns

Depuração de problemas de codificação de texto e caracteres
Identificação de caracteres ocultos ou invisíveis
Análise de problemas de internacionalização
Compreensão da composição Unicode do texto
Validação de compatibilidade de caracteres entre sistemas

Perguntas Frequentes

O que é um inspetor Unicode e por que eu precisaria de um?

Um inspetor Unicode analisa o texto para revelar informações detalhadas sobre cada caractere, incluindo pontos de código Unicode, categorias, propriedades de codificação e caracteres ocultos. É essencial para depurar problemas de codificação de texto e identificar caracteres invisíveis.

Como a ferramenta ajuda a identificar caracteres ocultos ou invisíveis?

A ferramenta exibe todos os caracteres no seu texto, incluindo caracteres de controle (como tabulações, novas linhas), espaços não quebrantes e outros caracteres Unicode invisíveis. Os caracteres de controle são mostrados com sequências de escape (\t, \n) e símbolos especiais.

Que informações a ferramenta fornece para cada caractere?

Para cada caractere, a ferramenta mostra: o próprio caractere, ponto de código Unicode (U+xxxx), valores decimais e hexadecimais, categoria e bloco Unicode, nome do caractere, representações de bytes UTF-8 e UTF-16, e propriedades como se é imprimível, ASCII ou caractere de controle.

O que são categorias e blocos Unicode?

Categorias Unicode classificam os caracteres pelo seu tipo geral (como Letra Maiúscula, Número Decimal, Pontuação). Blocos Unicode agrupam caracteres por script ou propósito (como Latim Básico, Grego e Cóptico, Operadores Matemáticos).

Como posso usar esta ferramenta para depurar problemas de codificação?

A ferramenta ajuda a identificar problemas de codificação mostrando caracteres inesperados, revelando sequências de bytes que não correspondem à codificação esperada e destacando caracteres de controle que não deveriam estar nos seus dados.

O que as representações de bytes UTF-8 e UTF-16 mostram?

Elas mostram como cada caractere é armazenado na memória usando diferentes esquemas de codificação Unicode. UTF-8 usa de 1 a 4 bytes por caractere, enquanto UTF-16 usa 2 ou 4 bytes. Essa informação ajuda a entender os requisitos de armazenamento.

Como as opções de filtragem e classificação funcionam?

Você pode filtrar caracteres por tipo (todos, caracteres de controle, espaços em branco, imprimíveis, ASCII, não-ASCII) para se concentrar em conjuntos específicos. As opções de classificação incluem por ponto de código Unicode, aparência do caractere ou categoria.

Esta ferramenta pode ajudar com problemas de internacionalização (i18n)?

Sim, a ferramenta é excelente para depuração de i18n. Ela ajuda a identificar caracteres de scripts inesperados, verificar a composição Unicode correta para diferentes idiomas e detectar problemas de codificação em texto multilíngue.

Como a ferramenta lida com diferentes sistemas de escrita e scripts?

A ferramenta suporta todos os caracteres e scripts Unicode, incluindo Latim, Cirílico, Árabe, Chinês, Japonês, Coreano, Tailandês, Hebraico e muitos outros. Ela identifica corretamente o bloco Unicode de cada caractere.

O que devo fazer se encontrar caracteres inesperados no meu texto?

Primeiro, anote o ponto de código Unicode e a categoria dos caracteres inesperados. Verifique se são caracteres de controle que podem ser removidos com segurança, artefatos de codificação que precisam de correção ou caracteres legítimos de um script diferente.

Como posso usar esta ferramenta para validação e limpeza de dados?

Use a ferramenta para detectar caracteres indesejados em conjuntos de dados, verificar se o texto contém apenas os tipos de caracteres esperados e identificar caracteres problemáticos para remoção ou substituição.

Posso copiar caracteres ou suas propriedades da análise?

Sim, cada linha de caracteres inclui botões de cópia para copiar o próprio caractere ou seu ponto de código Unicode. Isso facilita extrair caracteres específicos para testes, documentação ou análise adicional.

Inspetor Unicode

Categorias de Caracteres

Blocos Unicode

Ferramentas Relacionadas

Unicode Text Styler

Character Distribution Analyzer

Text Stats Analyzer

String Escaper

HTML Escape / Unescape

URL Encoder/Decoder

Base64 Encoder/Decoder

Text Encoding Converter

Share this tool

Sobre o Inspetor Unicode

Como Funciona

Casos de Uso Comuns

Perguntas Frequentes

O que é um inspetor Unicode e por que eu precisaria de um?

Como a ferramenta ajuda a identificar caracteres ocultos ou invisíveis?

Que informações a ferramenta fornece para cada caractere?

O que são categorias e blocos Unicode?

Como posso usar esta ferramenta para depurar problemas de codificação?

O que as representações de bytes UTF-8 e UTF-16 mostram?

Como as opções de filtragem e classificação funcionam?

Esta ferramenta pode ajudar com problemas de internacionalização (i18n)?

Como a ferramenta lida com diferentes sistemas de escrita e scripts?

O que devo fazer se encontrar caracteres inesperados no meu texto?

Como posso usar esta ferramenta para validação e limpeza de dados?

Posso copiar caracteres ou suas propriedades da análise?

Share ToolsZone