Unicode निरीक्षक
छिपे हुए अक्षरों, Unicode कोड पॉइंट, अक्षर श्रेणियों और एन्कोडिंग जानकारी के लिए टेक्स्ट का विश्लेषण करें। टेक्स्ट एन्कोडिंग समस्याएं डीबग करें।
29
कुल अक्षर
20
अद्वितीय अक्षर
35
UTF-8 बाइट्स
58
UTF-16 बाइट्स
Showing 20 of 20 characters
| अक्षर | कोड पॉइंट | दशमलव | हेक्स | श्रेणी | ब्लॉक | UTF-8 | क्रियाएं |
|---|---|---|---|---|---|---|---|
\tCTRL | U+0009 | 9 | 0x0009 | Control Character | Basic Latin | 0x09 | |
\nCTRL | U+000A | 10 | 0x000A | Control Character | Basic Latin | 0x0A | |
␣WS | U+0020 | 32 | 0x0020 | Space Separator | Basic Latin | 0x20 | |
! | U+0021 | 33 | 0x0021 | Other Punctuation | Basic Latin | 0x21 | |
, | U+002C | 44 | 0x002C | Other Punctuation | Basic Latin | 0x2C | |
: | U+003A | 58 | 0x003A | Other Punctuation | Basic Latin | 0x3A | |
H | U+0048 | 72 | 0x0048 | Uppercase Letter | Basic Latin | 0x48 | |
N | U+004E | 78 | 0x004E | Uppercase Letter | Basic Latin | 0x4E | |
T | U+0054 | 84 | 0x0054 | Uppercase Letter | Basic Latin | 0x54 | |
a | U+0061 | 97 | 0x0061 | Lowercase Letter | Basic Latin | 0x61 | |
b | U+0062 | 98 | 0x0062 | Lowercase Letter | Basic Latin | 0x62 | |
e | U+0065 | 101 | 0x0065 | Lowercase Letter | Basic Latin | 0x65 | |
i | U+0069 | 105 | 0x0069 | Lowercase Letter | Basic Latin | 0x69 | |
l | U+006C | 108 | 0x006C | Lowercase Letter | Basic Latin | 0x6C | |
n | U+006E | 110 | 0x006E | Lowercase Letter | Basic Latin | 0x6E | |
o | U+006F | 111 | 0x006F | Lowercase Letter | Basic Latin | 0x6F | |
w | U+0077 | 119 | 0x0077 | Lowercase Letter | Basic Latin | 0x77 | |
世 | U+4E16 | 19990 | 0x4E16 | Unassigned | CJK Unified Ideographs | 0xE4 0xB8 0x96 | |
界 | U+754C | 30028 | 0x754C | Unassigned | CJK Unified Ideographs | 0xE7 0x95 0x8C | |
🌍 | U+1F30D | 127757 | 0x1F30D | Unassigned | Unknown Block | 0xF0 0x9F 0x8C 0x8D |
अक्षर श्रेणियां
Lu
3 characters
Ll
8 characters
Po
3 characters
Zs
1 character
Cn
3 characters
Cc
2 characters
Unicode ब्लॉक
Basic Latin
17 characters
CJK Unified Ideographs
2 characters
Unknown Block
1 character
प्रो टिप्स:
- नियंत्रण अक्षरों को escape sequences के साथ दिखाया जाता है (\t टैब के लिए, \n नई लाइन के लिए)
- स्पेस को ␣ के रूप में और नॉन-ब्रेकिंग स्पेस को ⍽ के रूप में दिखाया जाता है
- नियंत्रण या गैर-ASCII जैसे विशिष्ट अक्षर प्रकारों पर ध्यान केंद्रित करने के लिए फ़िल्टर का उपयोग करें
- UTF-8 और UTF-16 बाइट प्रतिनिधित्व संग्रहण आवश्यकताओं को समझने में मदद करते हैं
- Unicode ब्लॉक एक ही लेखन प्रणाली या उद्देश्य के संबंधित अक्षरों को समूहित करते हैं
संबंधित टूल
Unicode निरीक्षक के बारे में
यह कैसे काम करता है
- आपके टेक्स्ट में प्रत्येक अक्षर का व्यक्तिगत रूप से विश्लेषण करता है
- Unicode कोड पॉइंट, श्रेणियां और गुण प्रकट करता है
- छिपे हुए नियंत्रण अक्षर और व्हाइटस्पेस दिखाता है
- UTF-8 और UTF-16 बाइट प्रतिनिधित्व प्रदर्शित करता है
- Unicode ब्लॉक और प्रकारों के अनुसार अक्षरों को वर्गीकृत करता है
सामान्य उपयोग मामले
- टेक्स्ट एन्कोडिंग और अक्षर समस्याओं को डीबग करना
- छिपे हुए या अदृश्य अक्षरों की पहचान करना
- अंतर्राष्ट्रीयकरण समस्याओं का विश्लेषण
- टेक्स्ट की Unicode संरचना को समझना
- सिस्टम के पार अक्षर संगतता सत्यापन
अक्सर पूछे जाने वाले प्रश्न
Unicode निरीक्षक क्या है और मुझे इसकी आवश्यकता क्यों होगी?
Unicode निरीक्षक प्रत्येक अक्षर के बारे में विस्तृत जानकारी प्रकट करने के लिए टेक्स्ट का विश्लेषण करता है, जिसमें Unicode कोड पॉइंट, श्रेणियां, एन्कोडिंग गुण और छिपे हुए अक्षर शामिल हैं। यह टेक्स्ट एन्कोडिंग समस्याओं को डीबग करने के लिए आवश्यक है।
टूल छिपे हुए या अदृश्य अक्षरों की पहचान करने में कैसे मदद करता है?
टूल आपके टेक्स्ट के सभी अक्षर प्रदर्शित करता है, जिसमें नियंत्रण अक्षर (जैसे टैब, नई लाइन), नॉन-ब्रेकिंग स्पेस और अन्य अदृश्य Unicode अक्षर शामिल हैं। नियंत्रण अक्षरों को escape sequences (\t, \n) के साथ दिखाया जाता है।
टूल प्रत्येक अक्षर के लिए क्या जानकारी प्रदान करता है?
प्रत्येक अक्षर के लिए, टूल दिखाता है: अक्षर स्वयं, Unicode कोड पॉइंट (U+xxxx), दशमलव और हेक्साडेसिमल मान, Unicode श्रेणी और ब्लॉक, अक्षर का नाम, UTF-8 और UTF-16 बाइट प्रतिनिधित्व, और क्या यह प्रिंट करने योग्य, ASCII या नियंत्रण अक्षर है।
Unicode श्रेणियां और ब्लॉक क्या हैं?
Unicode श्रेणियां अक्षरों को उनके सामान्य प्रकार (जैसे बड़े अक्षर, दशमलव संख्या, विराम चिह्न) के आधार पर वर्गीकृत करती हैं। Unicode ब्लॉक अक्षरों को script या उद्देश्य के आधार पर समूहित करते हैं।
मैं एन्कोडिंग समस्याओं को डीबग करने के लिए इस टूल का उपयोग कैसे कर सकता हूं?
टूल अप्रत्याशित अक्षर दिखाकर, उम्मीद की गई एन्कोडिंग से मेल न खाने वाले बाइट sequences प्रकट करके और नियंत्रण अक्षरों को उजागर करके एन्कोडिंग समस्याओं की पहचान करने में मदद करता है।
UTF-8 और UTF-16 बाइट प्रतिनिधित्व क्या दिखाते हैं?
ये दिखाते हैं कि विभिन्न Unicode एन्कोडिंग योजनाओं का उपयोग करके प्रत्येक अक्षर मेमोरी में कैसे संग्रहीत किया जाता है। UTF-8 प्रति अक्षर 1-4 बाइट्स का उपयोग करता है, जबकि UTF-16 2 या 4 बाइट्स का उपयोग करता है।
फ़िल्टरिंग और सॉर्टिंग विकल्प कैसे काम करते हैं?
आप विशिष्ट अक्षर sets पर ध्यान केंद्रित करने के लिए अक्षरों को प्रकार (सभी, नियंत्रण अक्षर, व्हाइटस्पेस, प्रिंट करने योग्य, ASCII, गैर-ASCII) द्वारा फ़िल्टर कर सकते हैं।
क्या यह टूल अंतर्राष्ट्रीयकरण (i18n) समस्याओं में मदद कर सकता है?
हां, टूल i18n डीबगिंग के लिए उत्कृष्ट है। यह अप्रत्याशित scripts से अक्षरों की पहचान करने, विभिन्न भाषाओं के लिए सही Unicode संरचना सत्यापित करने में मदद करता है।
टूल विभिन्न लेखन प्रणालियों और scripts को कैसे संभालता है?
टूल सभी Unicode अक्षरों और scripts का समर्थन करता है, जिसमें लैटिन, सिरिलिक, अरबी, चीनी, जापानी, कोरियाई, थाई, हिब्रू और कई अन्य शामिल हैं।
यदि मुझे अपने टेक्स्ट में अप्रत्याशित अक्षर मिलते हैं तो मुझे क्या करना चाहिए?
पहले, अप्रत्याशित अक्षरों का Unicode कोड पॉइंट और श्रेणी नोट करें। जांचें कि क्या वे नियंत्रण अक्षर हैं जिन्हें सुरक्षित रूप से हटाया जा सकता है या एन्कोडिंग artifacts हैं।
मैं डेटा सत्यापन और सफाई के लिए इस टूल का उपयोग कैसे कर सकता हूं?
डेटासेट में अवांछित अक्षरों का पता लगाने, यह सत्यापित करने कि टेक्स्ट में केवल अपेक्षित अक्षर प्रकार हैं, और हटाने या प्रतिस्थापन के लिए समस्याग्रस्त अक्षरों की पहचान करने के लिए टूल का उपयोग करें।
क्या मैं विश्लेषण से अक्षर या उनके गुण कॉपी कर सकता हूं?
हां, प्रत्येक अक्षर पंक्ति में अक्षर स्वयं या उसके Unicode कोड पॉइंट को कॉपी करने के लिए कॉपी बटन शामिल हैं।