Conversor de Codificação de Texto
Converta texto entre UTF-8, UTF-16, ASCII, ISO-8859-1, Base64 e Hex. Veja representações de bytes e depure problemas de codificação.
Como usar
- Envie um arquivo (recomendado) ou insira o texto manualmente
- Se enviar um arquivo, selecione a codificação de origem (ou use detecção automática)
- Selecione a codificação de saída desejada
- A conversão ocorre automaticamente quando você faz alterações
- Use os botões Copiar ou Baixar para obter o texto convertido
Ferramentas Relacionadas
Sobre o Conversor de Codificação de Texto
Como Funciona
- Envie um arquivo ou insira o texto manualmente
- Escolha as codificações de origem e destino
- Conversão automática em qualquer alteração
- Baixe ou copie o resultado convertido
Casos de Uso Comuns
- Converter arquivos entre diferentes codificações
- Preparar texto para sistemas legados
- Depurar problemas relacionados à codificação
- Converter texto para aplicações web
Perguntas Frequentes
O que é codificação de texto e por que é importante?
A codificação de texto é a forma como os computadores armazenam e representam caracteres de texto como números. Diferentes codificações suportam diferentes conjuntos de caracteres. UTF-8 suporta todos os caracteres Unicode, enquanto ASCII só suporta caracteres latinos básicos. Entender a codificação é crucial para lidar com texto internacional e evitar corrupção de caracteres.
Qual é a diferença entre UTF-8 e UTF-16?
UTF-8 usa de 1 a 4 bytes por caractere e é compatível com ASCII. UTF-16 usa de 2 a 4 bytes por caractere. UTF-8 é mais eficiente para texto com principalmente caracteres ASCII, enquanto UTF-16 pode ser mais eficiente para textos com muitos caracteres não ASCII.
Quando devo usar a codificação ASCII?
ASCII só deve ser usado quando você precisa de compatibilidade com sistemas muito antigos ou quando tem certeza de que seu texto contém apenas caracteres latinos básicos (A-Z, a-z, 0-9 e pontuação básica). ASCII não pode representar caracteres acentuados, emojis ou scripts não latinos.
O que é a codificação ISO-8859-1 (Latin-1)?
ISO-8859-1, também conhecida como Latin-1, estende o ASCII para incluir caracteres da Europa Ocidental com acentos. Usa 1 byte por caractere e pode representar 256 caracteres diferentes. É comumente usada em sistemas legados, mas foi amplamente substituída pelo UTF-8.
Por que recebo erros de codificação para alguns caracteres?
Erros de codificação ocorrem quando você tenta converter texto contendo caracteres não suportados pela codificação de destino. Por exemplo, emojis não podem ser representados em ASCII ou Latin-1. Sempre verifique se seu texto é compatível com a codificação pretendida antes da conversão.
O que as representações de bytes mostram?
As representações de bytes mostram como cada caractere é armazenado na memória do computador para essa codificação. Isso é útil para depurar problemas de codificação, entender tamanhos de arquivo e ao trabalhar com dados binários ou programação de baixo nível.
Como funciona a codificação Base64?
A codificação Base64 converte dados binários (incluindo texto) em caracteres ASCII usando 64 caracteres imprimíveis. É comumente usada para incorporar dados binários em formatos de texto como e-mail ou JSON. O texto codificado em Base64 é aproximadamente 33% maior que o original.
Para que serve a codificação URL?
A codificação URL (codificação percentual) converte caracteres que têm significado especial em URLs em um formato seguro. Caracteres especiais são substituídos por % seguido de sua representação hexadecimal. Isso garante que as URLs funcionem corretamente independentemente dos caracteres que contêm.
Quando devo usar a codificação de entidades HTML?
A codificação de entidades HTML converte caracteres especiais em representações seguras para HTML. Use-a ao exibir conteúdo gerado pelo usuário em HTML para prevenir ataques XSS e garantir a exibição correta de caracteres especiais como <, >, & e aspas.
Posso converter texto de volta dessas codificações?
Sim, a maioria das codificações é reversível. No entanto, essa ferramenta foca em converter DE texto PARA várias codificações. Para decodificar Base64, URL codificada ou entidades HTML de volta para texto, use as ferramentas de decodificação específicas disponíveis na plataforma.
Como escolho a codificação correta para meu projeto?
Use UTF-8 para aplicações modernas, pois suporta todos os caracteres e é amplamente compatível. Use ASCII apenas para texto em inglês simples em sistemas legados. Use codificação URL para parâmetros web, Base64 para dados binários em formatos de texto e entidades HTML para exibir conteúdo de usuários com segurança em páginas web.
O que acontece com emojis e caracteres Unicode especiais?
Emojis e caracteres Unicode especiais funcionam perfeitamente com as codificações UTF-8 e UTF-16. Eles não podem ser representados em ASCII ou Latin-1 e causarão erros de conversão. Na codificação de entidades HTML, eles são convertidos em referências de caracteres numéricas (por exemplo, 😀 para 😀).