Unicode 检查器
分析文本以揭示隐藏字符、Unicode 代码点、字符类别和编码信息。调试文本编码问题,检查不可见字符。
29
总字符数
20
唯一字符数
35
UTF-8 字节
58
UTF-16 字节
Showing 20 of 20 characters
| 字符 | 代码点 | 十进制 | 十六进制 | 类别 | 块 | UTF-8 | 操作 |
|---|---|---|---|---|---|---|---|
\tCTRL | U+0009 | 9 | 0x0009 | Control Character | Basic Latin | 0x09 | |
\nCTRL | U+000A | 10 | 0x000A | Control Character | Basic Latin | 0x0A | |
␣WS | U+0020 | 32 | 0x0020 | Space Separator | Basic Latin | 0x20 | |
! | U+0021 | 33 | 0x0021 | Other Punctuation | Basic Latin | 0x21 | |
, | U+002C | 44 | 0x002C | Other Punctuation | Basic Latin | 0x2C | |
: | U+003A | 58 | 0x003A | Other Punctuation | Basic Latin | 0x3A | |
H | U+0048 | 72 | 0x0048 | Uppercase Letter | Basic Latin | 0x48 | |
N | U+004E | 78 | 0x004E | Uppercase Letter | Basic Latin | 0x4E | |
T | U+0054 | 84 | 0x0054 | Uppercase Letter | Basic Latin | 0x54 | |
a | U+0061 | 97 | 0x0061 | Lowercase Letter | Basic Latin | 0x61 | |
b | U+0062 | 98 | 0x0062 | Lowercase Letter | Basic Latin | 0x62 | |
e | U+0065 | 101 | 0x0065 | Lowercase Letter | Basic Latin | 0x65 | |
i | U+0069 | 105 | 0x0069 | Lowercase Letter | Basic Latin | 0x69 | |
l | U+006C | 108 | 0x006C | Lowercase Letter | Basic Latin | 0x6C | |
n | U+006E | 110 | 0x006E | Lowercase Letter | Basic Latin | 0x6E | |
o | U+006F | 111 | 0x006F | Lowercase Letter | Basic Latin | 0x6F | |
w | U+0077 | 119 | 0x0077 | Lowercase Letter | Basic Latin | 0x77 | |
世 | U+4E16 | 19990 | 0x4E16 | Unassigned | CJK Unified Ideographs | 0xE4 0xB8 0x96 | |
界 | U+754C | 30028 | 0x754C | Unassigned | CJK Unified Ideographs | 0xE7 0x95 0x8C | |
🌍 | U+1F30D | 127757 | 0x1F30D | Unassigned | Unknown Block | 0xF0 0x9F 0x8C 0x8D |
字符类别
Lu
3 characters
Ll
8 characters
Po
3 characters
Zs
1 character
Cn
3 characters
Cc
2 characters
Unicode 块
Basic Latin
17 characters
CJK Unified Ideographs
2 characters
Unknown Block
1 character
专业提示:
- 控制字符以转义序列显示(\t 为制表符,\n 为换行符)
- 空格显示为 ␣,不间断空格显示为 ⍽,以提高可见性
- 使用过滤器专注于特定字符类型,如控制字符或非 ASCII 字符
- UTF-8 和 UTF-16 字节表示有助于了解存储要求
- Unicode 块将来自同一书写系统或用途的相关字符分组
相关工具
关于 Unicode 检查器
工作原理
- 逐个分析文本中的每个字符
- 揭示 Unicode 代码点、类别和属性
- 显示隐藏的控制字符和空白字符
- 展示 UTF-8 和 UTF-16 字节表示
- 按 Unicode 块和类型对字符进行分类
常见使用场景
- 调试文本编码和字符问题
- 识别隐藏或不可见字符
- 分析国际化问题
- 了解文本的 Unicode 组成
- 验证跨系统的字符兼容性
常见问题
什么是 Unicode 检查器?为什么需要它?
Unicode 检查器分析文本以揭示每个字符的详细信息,包括 Unicode 代码点、类别、编码属性和隐藏字符。它对于调试文本编码问题、识别导致问题的不可见字符以及了解文本在 Unicode 层面的构成至关重要。
该工具如何帮助识别隐藏或不可见字符?
该工具显示文本中的所有字符,包括控制字符(如制表符、换行符)、不间断空格和其他可能导致格式或处理问题的不可见 Unicode 字符。控制字符以转义序列(\t、\n)和特殊符号显示,以提高可见性。
该工具为每个字符提供哪些信息?
对于每个字符,工具显示:字符本身、Unicode 代码点(U+xxxx)、十进制和十六进制值、Unicode 类别和块、字符名称、UTF-8 和 UTF-16 字节表示,以及是否可打印、ASCII、控制字符或空白等属性。
什么是 Unicode 类别和块?
Unicode 类别按字符的一般类型对其进行分类(如大写字母、十进制数字、标点符号)。Unicode 块按脚本或用途将字符分组(如基本拉丁文、希腊文和科普特文、数学运算符)。
如何使用此工具调试编码问题?
该工具通过显示意外字符、揭示与预期编码不匹配的字节序列、显示来自错误 Unicode 块的字符以及突出显示不应该出现在数据中的控制字符来帮助识别编码问题。
UTF-8 和 UTF-16 字节表示显示什么?
它们显示每个字符如何使用不同的 Unicode 编码方案存储在内存中。UTF-8 每个字符使用 1-4 个字节,而 UTF-16 使用 2 或 4 个字节。此信息有助于了解存储要求和系统间的编码兼容性。
过滤和排序选项如何工作?
您可以按类型过滤字符(全部、控制字符、空白、可打印、ASCII、非 ASCII)以专注于特定字符集。排序选项包括按 Unicode 代码点、字符外观或类别排序。
此工具能帮助解决国际化(i18n)问题吗?
是的,该工具非常适合 i18n 调试。它帮助识别来自意外脚本的字符,验证不同语言的正确 Unicode 组合,检测多语言文本中的编码问题,并确保跨系统和区域的字符兼容性。
该工具如何处理不同的书写系统和脚本?
该工具支持所有 Unicode 字符和脚本,包括拉丁文、西里尔文、阿拉伯文、中文、日文、韩文、泰文、希伯来文等。它正确识别每个字符的 Unicode 块,帮助您了解文本中存在哪些书写系统。
如果我在文本中发现意外字符该怎么办?
首先,记下意外字符的 Unicode 代码点和类别。检查它们是否是可以安全删除的控制字符、需要修复的编码产物,还是来自不同脚本的合法字符。
如何使用此工具进行数据验证和清理?
使用该工具检测数据集中不需要的字符,验证文本仅包含预期的字符类型,识别和定位有问题的字符以进行删除或替换,并确保数据满足特定的 Unicode 要求。
我可以从分析中复制字符或其属性吗?
是的,每个字符行都包含复制按钮,用于复制字符本身或其 Unicode 代码点。这使得提取特定字符以进行测试、文档记录或在其他工具中进一步分析变得容易。