Detector de Caracteres de Largura Zero

Detecte e remova caracteres Unicode invisíveis de largura zero (ZWJ, ZWNJ, ZWSP, BOM) do texto. Encontre caracteres ocultos que causam problemas de formatação ou segurança.

0 characters

O que são caracteres de largura zero?

Caracteres de largura zero são caracteres Unicode invisíveis que não aparecem visualmente, mas podem causar problemas de formatação, problemas de segurança e erros de análise. Esta ferramenta detecta 22 tipos diferentes incluindo:

  • Espaço de Largura Zero (U+200B)
  • Conector de Largura Zero (U+200D)
  • Não-Conector de Largura Zero (U+200C)
  • Marca de Ordem de Byte / BOM (U+FEFF)
  • Marcas de formatação direcional
  • E mais 17 caracteres invisíveis

Referência de Caracteres de Largura Zero

Ponto de CódigoNome do CaractereDescrição
U+200BZero Width Space (ZWSP)Used for line breaking opportunities in long words
U+200CZero Width Non-Joiner (ZWNJ)Prevents joining of adjacent characters in some scripts
U+200DZero Width Joiner (ZWJ)Forces joining of adjacent characters (e.g., emoji combinations)
U+FEFFZero Width No-Break Space (BOM)Byte Order Mark, often used at start of files
U+200ELeft-to-Right MarkForces left-to-right text direction
U+200FRight-to-Left MarkForces right-to-left text direction
U+202ALeft-to-Right EmbeddingTreats following text as left-to-right
U+202BRight-to-Left EmbeddingTreats following text as right-to-left
U+202CPop Directional FormattingTerminates directional formatting
U+202DLeft-to-Right OverrideForces left-to-right direction override
U+202ERight-to-Left OverrideForces right-to-left direction override
U+2060Word JoinerPrevents line breaks between characters
U+2061Function ApplicationMathematical function application
U+2062Invisible TimesMathematical multiplication
U+2063Invisible SeparatorMathematical separator
U+2064Invisible PlusMathematical addition
U+206AInhibit Symmetric SwappingInhibits mirroring of symmetric characters
U+206BActivate Symmetric SwappingActivates mirroring of symmetric characters
U+206CInhibit Arabic Form ShapingPrevents Arabic letter shaping
U+206DActivate Arabic Form ShapingActivates Arabic letter shaping
U+206ENational Digit ShapesActivates national digit shapes
U+206FNominal Digit ShapesActivates nominal (European) digit shapes

Share this tool

Help others discover Zero-Width Character Detector

Sobre Esta Ferramenta

Como Funciona

  • Verifica automaticamente o texto em busca de caracteres Unicode invisíveis de largura zero
  • Detecta 22 tipos diferentes de caracteres Unicode invisíveis e de largura zero
  • Mostra posições exatas e contagens para cada tipo de caractere
  • Visualiza caracteres invisíveis com marcadores visíveis
  • Remove todos os caracteres de largura zero com um clique

Casos de Uso Comuns

  • Depurar problemas de formatação de texto causados por caracteres ocultos
  • Limpar texto copiado de sites e documentos
  • Detectar rastreamento oculto ou marcas d'água no texto
  • Identificar riscos de segurança de caracteres invisíveis
  • Preparar texto para bancos de dados e parsers estritos

Perguntas Frequentes

O que são caracteres de largura zero e por que são problemáticos?

Caracteres de largura zero são caracteres Unicode invisíveis que não aparecem visualmente, mas ocupam espaço no texto. Eles podem causar problemas de formatação, quebrar a análise de texto, criar vulnerabilidades de segurança, interferir em pesquisas e dificultar a depuração.

Quantos tipos de caracteres de largura zero esta ferramenta detecta?

Esta ferramenta detecta 22 tipos diferentes de caracteres Unicode invisíveis e de largura zero, incluindo espaços de largura zero, conectores, não-conectores, marcas de formatação direcional, operadores matemáticos e outros caracteres invisíveis especiais.

Como os caracteres de largura zero chegam ao meu texto?

Caracteres de largura zero podem vir de copiar texto de sites, processadores de texto, PDFs ou outras fontes formatadas. Eles também podem ser inseridos intencionalmente para rastreamento de texto, marcas d'água ou propósitos maliciosos.

Caracteres de largura zero podem ser um risco de segurança?

Sim, caracteres de largura zero podem representar riscos de segurança. Eles podem ser usados para criar URLs enganosas, contornar filtros e validações, ocultar código malicioso, criar strings visualmente idênticas mas tecnicamente diferentes e rastrear distribuição de texto.

Remover caracteres de largura zero vai quebrar a formatação do meu texto?

Na maioria dos casos, remover caracteres de largura zero melhora a qualidade do texto sem quebrar a formatação. No entanto, alguns idiomas (como árabe, tailandês ou combinações de emoji) usam legitimamente ZWJ e ZWNJ para exibição correta.

Qual é a diferença entre texto visualizado e texto limpo?

O texto visualizado mostra os caracteres de largura zero como marcadores visíveis (como [U+200B]) para que você possa ver onde eles ocorrem. O texto limpo tem todos os caracteres de largura zero completamente removidos.

Como posso identificar qual caractere de largura zero está causando meu problema?

A ferramenta exibe uma tabela detalhada mostrando cada tipo de caractere detectado, seu ponto de código Unicode, contagem e posições exatas em seu texto. Isso ajuda a entender quais caracteres específicos estão presentes.

O que as informações de posição me dizem?

Os números de posição indicam o índice do caractere onde cada caractere de largura zero aparece no texto (começando em 0). Se houver muitas ocorrências, a ferramenta mostra as primeiras 5 posições e indica quantas mais existem.

Posso usar esta ferramenta para limpar texto antes da inserção no banco de dados?

Com certeza! Este é um dos casos de uso principais. Caracteres de largura zero podem causar comportamento inesperado em bancos de dados, quebrar restrições únicas, interferir em pesquisas e criar problemas de qualidade de dados.

O que é a Marca de Ordem de Byte (BOM) e por que ela importa?

A Marca de Ordem de Byte (U+FEFF) é um caractere invisível às vezes adicionado no início de arquivos de texto para indicar a codificação. Embora às vezes necessária, pode causar problemas ao colar texto e interferir com parsers.

Como saber se meu texto tem caracteres de largura zero sem usar esta ferramenta?

Caracteres de largura zero são quase impossíveis de detectar visualmente. Sinais incluem: comprimento de texto inesperado, diferenças de comportamento ao copiar e colar, falhas de localizar e substituir, erros de análise ou discrepâncias na contagem de palavras.

Caracteres de largura zero podem afetar o SEO ou o conteúdo web?

Sim, caracteres de largura zero no conteúdo web podem confundir mecanismos de busca, afetar a correspondência de palavras-chave, criar problemas de conteúdo duplicado, interferir em análises e impactar a acessibilidade.

Share ToolsZone

Help others discover these free tools!

Compartilhar esta página

Detector de Caracteres de Largura Zero | Remover Chars Invisíveis