از امروز: نشانی اینترنتی با حروف فارسی
۱۳۸۶ مهر ۲۳, دوشنبهآزمایش نگاشتن آدرسها به زبانهای غیرلاتینی
امروز (۱۵ اکتبر) برای نخستین بار در تاریخ اینترنت آزمایشی راهگشا برای به کار بردن حروف غیرلاتین برای نامگذاری دامنههای اینترنتی انجام میگیرد. زبانهایی که موضوع آزمایش نامگذاری دامنه اینترنتی هستند، عبارتاند از: چینی، روسی، هندی، یونانی، کرهای، هندی، ژاپنی، تامیل، عربی و فارسی.
آدرس اینترنتی کنونی سایت فارسی دویچهوله در حال حاضر دارای جزء اصلی زیر است:
dw-world.de/persian
آزمایش ۱۵ اکتبر این امکان را میدهد که در آیندهی نزدیک مثلاً از طریق زیر نیز بتوان به سایت فارسی دویچهوله دسترسی داشت:
دویچهوله/فارسی
نحوهی انجام آزمایش
آزمایش را نهادی پیش میبرد که کار مدیریت آدرسها را برعهده دارد. عنوان این نهاد به انگلیسی چنین است:
Internet Corporation for Assigned Names and Numbers - ICANN
آن را به فارسی ازجمله "شرکت شمارهها و نامهای اختصاصی اینترنت" خواندهاند.
آزمایش به این صورت انجام میشود که آدرس اینترنتیای به صورت example.test به زبانهای موضوع آزمایش نگاشته شده و دیده میشود که چگونه میتوان به سایت مرجع آن آدرس دسترسی پیدا کرد. شیوهی دسترسی به این صورت است که آدرس نخست به عبارتی متشکل از حروف و اعداد استاندارد لاتین ترجمه میشود و سپس یابش آن در شبکه انجام میگیرد. بنابر این مرورگرهایی توانایی فهم آدرس به حروف غیر لاتینی را دارند که بتوانند این تبدیل را انجام دهند. هم اینک فقط مرورگر موسوم به Opera از عهده کدگذاری Punycode به صورت کامل برمیآید. فراگرد Punycode استاندارد تبدیل حروف غیرلاتینی به عبارتهای معادلی متشکل از حروف و ارقام انگلیسی است.
در ادامهی تحولی که "یونیکد" پدید آورد
بنابر این هنوز اینترنت در اساس خود انگلیسی زبان است و به طور مستقیم حتّا حروف ویژهی آلمانی مثل Ä یا ß را نمیفهمد. آنچه میفهمد متشکل از حروف A تا Z و اعداد 1 تا 9 به لاتین است.
امکان استفاده عمومی از حروف غیرلاتین در نشانیهای اینرنتی در پایان سال ۲۰۰۸ میسر خواهد شد. این تحول در ادامهی تحولی است که استفاده از یونیکد (unicode) در پردازش الکترونیکی متنها به زبانهای مختلف دنیا به دنبال آورد. استاندارد یونیکد این امکان را فراهم آورد که کدبندی حروف شامل همهی خطهای رایج در جهان شود. پیش از یونیکد مثلاً برای نوشتن متنی فراهمآمده از عبارات لاتین و عبارات فارسی در یک واژهپرداز کامپیوتری از دو قلم استفاده میکردیم. اکنون اما قلمهای طراحی شده بر پایهی یونیکد چنان اند که با آنها میتوان به زبانهای مختلف نگاشت. قلم رایجی مثل Arial در نسخهی یونیکدی آن شامل حروف لاتین، روسی، یونانی، عبری، عربی، فارسی و حروف و نشانههای دیگر است. مضمون تحول در نگاشتن آدرسهای اینترنتی به زبانهای غیرلاتین در واقع استفاده از یونیکد در نگارش آدرسهاست.
مشکل خط-نگارش فارسی
یونیکد گامبهگام تکمیل شد و به استاندارد تبدیل شد. در نسخهی آغازین آن به فارسی بیتوجهی شده و در اصل تفاوت آن با عربی در نظر گرفته نشده بود. بیتوجهی به زبان فارسی در شرکتها و نهادهای تعیینکننده در جهان دادهپردازی کامپیوتری تا حدی بود که "ویندوز" (محصول شرکت "مایکروسفت") در آغاز از فارسی پشتیبانی نمیکرد و آنگاه که در نظر گرفت چنین زبانی هم وجود دارد، برای نگارش حروف فارسی آرایشی بر روی تختهکلید منظور کرد که با استاندارد ماشین تحریر فارسی نمیخواند و غیرمنطقی و توجیهناپذیر بود. هنوز هم مشکل ایرانیان با آرایش صفحهکلید حل نشده است.
استاندارد جدید یونیکد نیز هنوز در میان فارسیزبانان جا نیفتاده است. به عنوان مثال هنوز سایتهای خبرگزاریها و روزنامههای اصلی ایرانی از کدبندی عربی استفاده میکنند. این آشفتگی کار جستجو در اینترنت را مشکل میکند. مثلاً اگر بخواهیم دنبال نام "کریم" بگردیم، باید درنظر گیریم که یک بار از "ک" فارسی و "ی" فارسی استفاده کنیم و یک بار از "ك" عربی و "ي" عربی. با توجه به این موضوع و نیز این که هنوز مشکل فاصلهی کوتاه در کلمات مرکب و نیز جدانویسی یا سرهمنویسی به شکلی استاندارد و مورد پذیرش همگان حل نشده است، این پرسش مطرح میشود که در نگاشتن آدرسهای اینترنتی به فارسی چه هنجاری پیگرفته میشود؟ به عنوان مثلاً اگر اسم "کریم" در یک آدرس اینترنتی فارسی بیاید، آن را چگونه باید نوشت؟
ر