محوّل ترميز النصوص
حوّل النصوص بين UTF-8 وUTF-16 وASCII وISO-8859-1 وBase64 والنظام الست عشري. اعرض تمثيلات البايت وصحّح مشاكل الترميز.
كيفية الاستخدام
- ارفع ملفاً (مُوصى به) أو أدخل النص يدوياً
- إذا رفعت ملفاً، حدد ترميز المصدر (أو استخدم الاكتشاف التلقائي)
- حدد ترميز الإخراج المطلوب
- يحدث التحويل تلقائياً عند إجراء التغييرات
- استخدم زرَّي النسخ أو التنزيل للحصول على النص المحوَّل
الأدوات ذات الصلة
حول محوّل ترميز النصوص
كيف يعمل
- ارفع ملفاً أو أدخل النص يدوياً
- اختر ترميزات المصدر والهدف
- تحويل تلقائي عند أي تغيير
- نزّل أو انسخ النتيجة المحوَّلة
حالات الاستخدام الشائعة
- تحويل الملفات بين ترميزات مختلفة
- إعداد النصوص للأنظمة القديمة
- تصحيح المشاكل المتعلقة بالترميز
- تحويل النصوص لتطبيقات الويب
الأسئلة الشائعة
ما هو ترميز النصوص ولماذا هو مهم؟
ترميز النصوص هو الطريقة التي تخزن بها الحواسيب وتمثل أحرف النصوص كأرقام. تدعم الترميزات المختلفة مجموعات أحرف مختلفة. يدعم UTF-8 جميع أحرف Unicode، بينما يدعم ASCII فقط الأحرف اللاتينية الأساسية. يُعدّ فهم الترميز أمراً بالغ الأهمية للتعامل مع النصوص الدولية وتجنب تلف الأحرف.
ما الفرق بين UTF-8 وUTF-16؟
يستخدم UTF-8 من 1 إلى 4 بايت لكل حرف وهو متوافق مع ASCII. يستخدم UTF-16 من 2 إلى 4 بايت لكل حرف. يكون UTF-8 أكثر كفاءة للنصوص التي تحتوي أساساً على أحرف ASCII، بينما قد يكون UTF-16 أكثر كفاءة للنصوص التي تحتوي على الكثير من الأحرف غير ASCII.
متى يجب استخدام ترميز ASCII؟
يجب استخدام ASCII فقط عند الحاجة إلى التوافق مع الأنظمة القديمة جداً أو عند التأكد من أن النص يحتوي فقط على الأحرف اللاتينية الأساسية (A-Z وa-z و0-9 وعلامات الترقيم الأساسية). لا يستطيع ASCII تمثيل الأحرف المُعلَّمة أو الرموز التعبيرية أو النصوص غير اللاتينية.
ما هو ترميز ISO-8859-1 (Latin-1)؟
يُوسِّع ISO-8859-1، المعروف أيضاً بـ Latin-1، معيار ASCII ليشمل أحرف أوروبا الغربية المُعلَّمة. يستخدم بايتاً واحداً لكل حرف ويمكنه تمثيل 256 حرفاً مختلفاً. يُستخدم شائعاً في الأنظمة القديمة، لكنه استُبدل إلى حد بعيد بـ UTF-8.
لماذا أحصل على أخطاء ترميز لبعض الأحرف؟
تحدث أخطاء الترميز عند محاولة تحويل نص يحتوي على أحرف غير مدعومة في الترميز المستهدف. على سبيل المثال، لا يمكن تمثيل الرموز التعبيرية في ASCII أو Latin-1. تحقق دائماً مما إذا كان نصك متوافقاً مع الترميز المقصود قبل التحويل.
ماذا تُظهر تمثيلات البايت؟
تُظهر تمثيلات البايت كيفية تخزين كل حرف في ذاكرة الحاسوب لذلك الترميز. هذا مفيد لتصحيح مشاكل الترميز وفهم أحجام الملفات والعمل مع البيانات الثنائية أو البرمجة على المستوى المنخفض.
كيف يعمل ترميز Base64؟
يحوّل ترميز Base64 البيانات الثنائية (بما في ذلك النصوص) إلى أحرف ASCII باستخدام 64 حرفاً قابلاً للطباعة. يُستخدم شائعاً لتضمين البيانات الثنائية في تنسيقات النصوص مثل البريد الإلكتروني أو JSON. يكون النص المُرمَّز بـ Base64 أكبر بحوالي 33% من الأصل.
لماذا يُستخدم ترميز URL؟
يحوّل ترميز URL (الترميز بالنسبة المئوية) الأحرف ذات المعنى الخاص في عناوين URL إلى تنسيق آمن. تُستبدل الأحرف الخاصة بـ % متبوعاً بتمثيلها الست عشري. هذا يضمن عمل عناوين URL بشكل صحيح بغض النظر عن الأحرف التي تحتوي عليها.
متى يجب استخدام ترميز كيانات HTML؟
يحوّل ترميز كيانات HTML الأحرف الخاصة إلى تمثيلات آمنة لـ HTML. استخدمه عند عرض المحتوى الذي ينشئه المستخدمون في HTML لمنع هجمات XSS وضمان العرض الصحيح للأحرف الخاصة مثل < و> و& والاقتباسات.
هل يمكنني تحويل النص مرة أخرى من هذه الترميزات؟
نعم، معظم الترميزات قابلة للعكس. لكن هذه الأداة تركز على التحويل من النص إلى ترميزات مختلفة. لفك ترميز Base64 أو URL المُرمَّزة أو كيانات HTML مرة أخرى إلى نص، استخدم أدوات فك الترميز المحددة المتاحة على المنصة.
كيف أختار الترميز الصحيح لمشروعي؟
استخدم UTF-8 للتطبيقات الحديثة لأنه يدعم جميع الأحرف وهو متوافق على نطاق واسع. استخدم ASCII فقط للنصوص الإنجليزية البسيطة في الأنظمة القديمة. استخدم ترميز URL لمعاملات الويب، وBase64 للبيانات الثنائية في تنسيقات النصوص، وكيانات HTML لعرض محتوى المستخدمين بأمان في صفحات الويب.
ما الذي يحدث للرموز التعبيرية والأحرف Unicode الخاصة؟
تعمل الرموز التعبيرية والأحرف Unicode الخاصة بشكل مثالي مع ترميزات UTF-8 وUTF-16. لا يمكن تمثيلها في ASCII أو Latin-1 وستسبب أخطاء تحويل. في ترميز كيانات HTML، تُحوَّل إلى مراجع أحرف رقمية (مثلاً، 😀 للرمز 😀).