Detector de Caracteres de Largura Zero
Detecte e remova caracteres Unicode invisíveis de largura zero (ZWJ, ZWNJ, ZWSP, BOM) do texto. Encontre caracteres ocultos que causam problemas de formatação ou segurança.
0 characters
O que são caracteres de largura zero?
Caracteres de largura zero são caracteres Unicode invisíveis que não aparecem visualmente, mas podem causar problemas de formatação, problemas de segurança e erros de análise. Esta ferramenta detecta 22 tipos diferentes incluindo:
- Espaço de Largura Zero (U+200B)
- Conector de Largura Zero (U+200D)
- Não-Conector de Largura Zero (U+200C)
- Marca de Ordem de Byte / BOM (U+FEFF)
- Marcas de formatação direcional
- E mais 17 caracteres invisíveis
Referência de Caracteres de Largura Zero
| Ponto de Código | Nome do Caractere | Descrição |
|---|---|---|
| U+200B | Zero Width Space (ZWSP) | Used for line breaking opportunities in long words |
| U+200C | Zero Width Non-Joiner (ZWNJ) | Prevents joining of adjacent characters in some scripts |
| U+200D | Zero Width Joiner (ZWJ) | Forces joining of adjacent characters (e.g., emoji combinations) |
| U+FEFF | Zero Width No-Break Space (BOM) | Byte Order Mark, often used at start of files |
| U+200E | Left-to-Right Mark | Forces left-to-right text direction |
| U+200F | Right-to-Left Mark | Forces right-to-left text direction |
| U+202A | Left-to-Right Embedding | Treats following text as left-to-right |
| U+202B | Right-to-Left Embedding | Treats following text as right-to-left |
| U+202C | Pop Directional Formatting | Terminates directional formatting |
| U+202D | Left-to-Right Override | Forces left-to-right direction override |
| U+202E | Right-to-Left Override | Forces right-to-left direction override |
| U+2060 | Word Joiner | Prevents line breaks between characters |
| U+2061 | Function Application | Mathematical function application |
| U+2062 | Invisible Times | Mathematical multiplication |
| U+2063 | Invisible Separator | Mathematical separator |
| U+2064 | Invisible Plus | Mathematical addition |
| U+206A | Inhibit Symmetric Swapping | Inhibits mirroring of symmetric characters |
| U+206B | Activate Symmetric Swapping | Activates mirroring of symmetric characters |
| U+206C | Inhibit Arabic Form Shaping | Prevents Arabic letter shaping |
| U+206D | Activate Arabic Form Shaping | Activates Arabic letter shaping |
| U+206E | National Digit Shapes | Activates national digit shapes |
| U+206F | Nominal Digit Shapes | Activates nominal (European) digit shapes |
Ferramentas Relacionadas
Sobre Esta Ferramenta
Como Funciona
- Verifica automaticamente o texto em busca de caracteres Unicode invisíveis de largura zero
- Detecta 22 tipos diferentes de caracteres Unicode invisíveis e de largura zero
- Mostra posições exatas e contagens para cada tipo de caractere
- Visualiza caracteres invisíveis com marcadores visíveis
- Remove todos os caracteres de largura zero com um clique
Casos de Uso Comuns
- Depurar problemas de formatação de texto causados por caracteres ocultos
- Limpar texto copiado de sites e documentos
- Detectar rastreamento oculto ou marcas d'água no texto
- Identificar riscos de segurança de caracteres invisíveis
- Preparar texto para bancos de dados e parsers estritos
Perguntas Frequentes
O que são caracteres de largura zero e por que são problemáticos?
Caracteres de largura zero são caracteres Unicode invisíveis que não aparecem visualmente, mas ocupam espaço no texto. Eles podem causar problemas de formatação, quebrar a análise de texto, criar vulnerabilidades de segurança, interferir em pesquisas e dificultar a depuração.
Quantos tipos de caracteres de largura zero esta ferramenta detecta?
Esta ferramenta detecta 22 tipos diferentes de caracteres Unicode invisíveis e de largura zero, incluindo espaços de largura zero, conectores, não-conectores, marcas de formatação direcional, operadores matemáticos e outros caracteres invisíveis especiais.
Como os caracteres de largura zero chegam ao meu texto?
Caracteres de largura zero podem vir de copiar texto de sites, processadores de texto, PDFs ou outras fontes formatadas. Eles também podem ser inseridos intencionalmente para rastreamento de texto, marcas d'água ou propósitos maliciosos.
Caracteres de largura zero podem ser um risco de segurança?
Sim, caracteres de largura zero podem representar riscos de segurança. Eles podem ser usados para criar URLs enganosas, contornar filtros e validações, ocultar código malicioso, criar strings visualmente idênticas mas tecnicamente diferentes e rastrear distribuição de texto.
Remover caracteres de largura zero vai quebrar a formatação do meu texto?
Na maioria dos casos, remover caracteres de largura zero melhora a qualidade do texto sem quebrar a formatação. No entanto, alguns idiomas (como árabe, tailandês ou combinações de emoji) usam legitimamente ZWJ e ZWNJ para exibição correta.
Qual é a diferença entre texto visualizado e texto limpo?
O texto visualizado mostra os caracteres de largura zero como marcadores visíveis (como [U+200B]) para que você possa ver onde eles ocorrem. O texto limpo tem todos os caracteres de largura zero completamente removidos.
Como posso identificar qual caractere de largura zero está causando meu problema?
A ferramenta exibe uma tabela detalhada mostrando cada tipo de caractere detectado, seu ponto de código Unicode, contagem e posições exatas em seu texto. Isso ajuda a entender quais caracteres específicos estão presentes.
O que as informações de posição me dizem?
Os números de posição indicam o índice do caractere onde cada caractere de largura zero aparece no texto (começando em 0). Se houver muitas ocorrências, a ferramenta mostra as primeiras 5 posições e indica quantas mais existem.
Posso usar esta ferramenta para limpar texto antes da inserção no banco de dados?
Com certeza! Este é um dos casos de uso principais. Caracteres de largura zero podem causar comportamento inesperado em bancos de dados, quebrar restrições únicas, interferir em pesquisas e criar problemas de qualidade de dados.
O que é a Marca de Ordem de Byte (BOM) e por que ela importa?
A Marca de Ordem de Byte (U+FEFF) é um caractere invisível às vezes adicionado no início de arquivos de texto para indicar a codificação. Embora às vezes necessária, pode causar problemas ao colar texto e interferir com parsers.
Como saber se meu texto tem caracteres de largura zero sem usar esta ferramenta?
Caracteres de largura zero são quase impossíveis de detectar visualmente. Sinais incluem: comprimento de texto inesperado, diferenças de comportamento ao copiar e colar, falhas de localizar e substituir, erros de análise ou discrepâncias na contagem de palavras.
Caracteres de largura zero podem afetar o SEO ou o conteúdo web?
Sim, caracteres de largura zero no conteúdo web podem confundir mecanismos de busca, afetar a correspondência de palavras-chave, criar problemas de conteúdo duplicado, interferir em análises e impactar a acessibilidade.