خط فارسی‐عربی یکی از پرکاربردترین خطهای جهان میباشد که زبانهای بسیاری با الفباها و قلمهای گوناگون با آن نگارش میشوند و به همین دلیل قواعد و استثناءهای متنوعی برای آن بهوجود آمده است. کدگذاریِ معناییِ این خط و راهکارهای نمایش متن در رایانهها نیز پیچیدگیهایی به این خط افزوده است، تا حدّی که درک و استفاده از این خط در محیطهای رایانهای را دچار مشکل کرده است. در اینجا به تعریف اصولِ نوشتهنگاریِ خط فارسی‐عربی و نحوهی تعریف آنها در محیطهای رایانهای میپردازیم. سپس ایراداتِ راهکارهای فعلی را بررسی کرده و به مسائلِ کاربردیای میپردازیم که با راهکارهای موجود قابل رفع نمیباشند. در انتها مدلِ انتزاعیِ نوشتهنگاری را برای خط فارسی‐عربی تعریف کرده و با آن به حل مسائل کاربردی میپردازیم.
2. چالشهای خط فارسی‐عربی
زبانها و قلمها
گردش اطالعات بین کاربر و محیط رایانهای
مشکالت فعلی
تیرماه ۱۹۳۱ مدلِ انتزاعیِ نوشتهنگاری برای خط فارسی‐عربی 2
3. زبانها و قلمها
0 تعداد زیاد زبانها (از جنوب و غرب آسیا تا شمال و غرب آفریقا)
0 هر زبانی حروفی را تغییر داده یا حروف جدیدی اضافه کرده است
0 بیش از ۰۰۲ حرف در آخرین نسخهی استانداردها
0 قلمها یا شیوههای نگارش متفاوت
کوفی، نسخ، ثلث، محقق، ریحان، رقاع، توقیع، دیوانی، تعلیق، نستعلیق و شکستهنستعلیق
0 وابستگی به منطقهی جغرافیایی و زبان مردم
ا ّا عناصر مشترکی در همهی این قلمها وجود دارد
م
که خط فارسی‐عربی را تعریف میکنند!
تیرماه ۱۹۳۱ مدلِ انتزاعیِ نوشتهنگاری برای خط فارسی‐عربی 3
4. گردش اطالعات بین کاربر و محیط رایانهای
۲) نمایش متن ۱) ذخیره
۴) ورود متن ۳) متن نوشتهشده
تیرماه ۱۹۳۱ مدلِ انتزاعیِ نوشتهنگاری برای خط فارسی‐عربی 4
5. مشکالت فعلی
0 آشنایی کاربران با تعداد محدودی از الفباها
0 اطالعات ناقص برای طراحی و پیادهسازیِ فونت
0 تکزبانه یا چندزبانه
0 همنشینیِ زبانها و الفباها در محیطهای رایانهای
(مانند نامهای دامنههای اینترنتی) 0 نامها در کاربردها، وبگاهها و فضاهای نامگذاری
0 نبود روش مناسب برای مقایسهی ظاهری کلمات
0 نمیتوان از مقایسهی حروف به تشابه کلمات پی برد
ردت ترد مهلک کلمه
ردن نرد کمهل ملکه
تیرماه ۱۹۳۱ مدلِ انتزاعیِ نوشتهنگاری برای خط فارسی‐عربی 5
6. اصول نوشتهنگاری خط فارسی‐عربی
شکلگیری کلمه
انواع حروف در خط
تنوع حروف در الفباها
انواع اتصال و انفصال
شکلهای پایه و کمکی
نشانههای آوانمایی
تیرماه ۱۹۳۱ مدلِ انتزاعیِ نوشتهنگاری برای خط فارسی‐عربی 6
11. شکلهای پایه و کمکی
شکلهای کمکی
تیرماه ۱۹۳۱ مدلِ انتزاعیِ نوشتهنگاری برای خط فارسی‐عربی 11
12. نشانههای آوانمایی
0 در باال یا پایین حروف قرار میگیرند
0 ممکن است با هم ترکیب شوند
ّ + ً = ًّ
0 گاهی نشانههای آوانمایی با حروف ترکیب شده و حروف جدیدی میسازند
و+ ُ=ۇ
تیرماه ۱۹۳۱ مدلِ انتزاعیِ نوشتهنگاری برای خط فارسی‐عربی 21
13. کدگذاری خط فارسی‐عربی
کدگذاریهای شکلی و معنایی
خط فارسی‐عربی در یونیکد
مشخصههای نویسهها
پیچیدگیهای مدل یونیکد
تیرماه ۱۹۳۱ مدلِ انتزاعیِ نوشتهنگاری برای خط فارسی‐عربی 31
14. کدگذاریهای شکلی و معنایی
نویسه ← نمود یا شکل 0 کدگذاریهای شکلی
0 روش قدیمی. بر اساس استانداردها و دوفاکتوهای ماشینهای تحریر
0 پیچیدگیِ بیشتر در هنگام پردازشِ متن
← 0xDAس / س
← 0xDBس/ س
نویسه ← حرف یا نشانه 0 کدگذاریهای معنایی
0 روش فعلی. ذخیره و انتقال حروف به ترتیب معنایی (منطقی)
0 تشخیص نمود بر اساس مشخصههای حرف و نویسههای قبل و بعدش
0 نیاز به نویسههای تنظیم انفصال و اتصال
3360 ← 0xس / س / س/ س
تیرماه ۱۹۳۱ مدلِ انتزاعیِ نوشتهنگاری برای خط فارسی‐عربی 41
15. خط فارسی‐عربی در یونیکد
0 الگوریتمها و مشخصهها برای نمایش متن
جهت ذخیرهسازی داده گامها:
س م ال ۱‐ کدگذاری معنایی
م سل ا ۲‐ الگوریتم دوجهته
م س ل ا ۳‐ الگوریتم اتصال
م س ال ۴‐ جایگزینی لیگاتورها
تیرماه ۱۹۳۱ مدلِ انتزاعیِ نوشتهنگاری برای خط فارسی‐عربی 51
16. مشخصههای نویسهها
0 نوع اتصال نویسه
فاصل، راستوصل، دووصل نویسههای حرفی
شفاف نویسههای نشانههای آوانمایی
واصل نویسههای اتصال مجازی
فاصل نویسههای فاصلهی مجازی
0 گروه اتصال نویسه
0 شکل پایهی یکسان در همهی نمودها
تیرماه ۱۹۳۱ مدلِ انتزاعیِ نوشتهنگاری برای خط فارسی‐عربی 61
17. پیچیدگیهای مدل یونیکد
0 خط فارسی‐عربی در یونیکد از الفباهای زیادی پشتیبانی میکند
۱) نویسههایی وجود دارند که در چند نمود خاص کامالً همشکل میباشند
یای فارسی و یای عربی در دو نمود پیشپاره و میانپاره همشکلاند
۲) نویسههایی وجود دارند که (در همهی نمودهایشان) در الفبایی معادلِ یک حرف واحد
میباشند، ولی در الفبایی دیگر معادل دو حرف میباشند
یا و یای بری اردو در الفبای فارسی معادل یک حرفاند
۳) یک نویسه ممکن است در قلمی/زبانی خاص به شکلی دیگر نمایش داده شود
حرف یای کشمیری در نمود تهپاره یا تکپاره به شکلِ یک یای فارسی با حلقهای در زیرش ظاهر میشود، در
قلم نستعلیق به شکل یک یای فارسی میباشد که انتهای آن بریده شده است
۴) ترکیب یک نویسهی حرفی با یک نویسهی آوانمایی ممکن است به تغییر ظاهر نویسهی
حرفی بیانجامد
حرف یای عربی هنگامی که با نشانهی همزهی باال همراه شود باید بدون نقطه ظاهر شود
تیرماه ۱۹۳۱ مدلِ انتزاعیِ نوشتهنگاری برای خط فارسی‐عربی 71
18. پیچیدگیهای مدل یونیکد (۲)
۵) نویسههای حرفیای وجود دارند که از نظر شکل با ترکیب یک نویسهی حرفی و یک
نشانهی آوانمایی کامالً یکسان میباشند، امّا از نظر یونیکد همارز شناخته نمیشوند
ح با همزهی باال همارز با دنبالهی حرف «ح» و همزهی باال «ـٔ» نمیباشد
0 روش توصیف شکلهای نویسهها، گروه اتصال، دارای چند ایراد بنیادی است
۶) تنها به شکل پایهی حروف اهمیت داده است و هیچ اطالعی از جزئیات ظاهری حروف
در اختیار نمیگذارد
نویسههای گروههای Yehو Farsi_Yeh
۷) اطالع کمی از شکلهای پایه میدهد
گروههای Yeh ،Noon ،Behو Farsi_Yehنمودهای ابتدایی و میانی یکسان دارند
۸) اضافه شدن نویسههای جدید در نسخههای متوالی یونیکد
تعداد گروههای اتصال همیشه در حال افزایش است، اما شکل پایهی جدیدی تعریف نمیشود
تیرماه ۱۹۳۱ مدلِ انتزاعیِ نوشتهنگاری برای خط فارسی‐عربی 81
19. مسائل کاربردی
طراحی و پیادهسازی فونت
محیطهای چندزبانه
نیازها
تیرماه ۱۹۳۱ مدلِ انتزاعیِ نوشتهنگاری برای خط فارسی‐عربی 91
20. طراحی و پیادهسازی فونت
0 عدم وجود اطالعات کافی برای سازندگان فونتها
0 عدم وجود روشی برای بررسی صحت فونتها
0 کمبود اطالعات ساختیافته برای نویسههای فارسی‐عربی
0 شکل مرجع برای نمودهای تکپاره
0 یادداشتهایی برای برخی از نویسهها
0 توضیحاتی در مورد استثناءها
0 طراحان فونت با مشکل مواجه هستند
0 رفتار فونتهای موجود ناهمگون است
تیرماه ۱۹۳۱ مدلِ انتزاعیِ نوشتهنگاری برای خط فارسی‐عربی 02
21. شکلهای ممکن برای نمودهای حروف خانوادهی «ها»
تیرماه ۱۹۳۱ مدلِ انتزاعیِ نوشتهنگاری برای خط فارسی‐عربی 12
22. محیطهای چندزبانه
0 مشکالت در تشخیص و واردکردن متن
0 کاربر با همهی نویسهها آشنا نیست
0 هیچگاه سامانه برای نمایش و ورود درست همهی الفباها آماده نیست
0 استفادهپذیری و امنیتی
کاربر فارسیزبان
<ق ,ی ,ق ,د> دقیق <ق ,ی ,ق ,د>
ورود متن نمایش متن
<ق ,ي ,ق ,د> دقیق <ق ,ي ,ق ,د>
کاربر عربیزبان
تیرماه ۱۹۳۱ مدلِ انتزاعیِ نوشتهنگاری برای خط فارسی‐عربی 22
23. نیازها
0 اطالعات شکلی تمامی نویسههای حرفی و آوانمایی خط
0 اطالعات ساختیافتهی کافی در مورد جزئیات شکلهای نمودها
0 توصیف جزئیات شکلها مستقل از قلم
0 هر شکل (از یک نمود) در کدام زبانها یا قلمها کاربرد دارد
تیرماه ۱۹۳۱ مدلِ انتزاعیِ نوشتهنگاری برای خط فارسی‐عربی 32
24. مدل انتزاعی نوشتهنگاری
شکلهای انتزاعی
رابطهی شکلهای انتزاعی پایه و نویسهها
دنبالههای شکلی
کلمات همشکل و مشابه
تیرماه ۱۹۳۱ مدلِ انتزاعیِ نوشتهنگاری برای خط فارسی‐عربی 42
25. شکلهای انتزاعی
0 هر نمود از حروف دارای حداقل یک شکل پایه است
تکپاره (۵۲) 0 چهار گروه: پیشپاره (۱۱) میانپاره(۱۱) تهپاره (۴۲)
0 برخی از نمودها دارای شکلهای کمکی نیز میباشند
0 نویسههای آوانمایی دقیقا یک شکل کمکی دارند
روی (۲) پایین (۰۲) انتها (۳) 0 چهار گروه: باال (۲۳)
0 هر نمود حرفی یا نویسهی آوانمایی یک یا چند دنبالهی شکل دارد
0 لیگاتورها در این مدل نیاز به تعریفِ شکلهای انتزاعی ندارند
تیرماه ۱۹۳۱ مدلِ انتزاعیِ نوشتهنگاری برای خط فارسی‐عربی 52
26. رابطهی شکلهای انتزاعی پایه و نویسهها
تیرماه ۱۹۳۱ مدلِ انتزاعیِ نوشتهنگاری برای خط فارسی‐عربی 62
27. »دنبالههای شکلی برای چند نویسهی حرفیِ نمونه از خانوادهی «یا
دنبالهی شکلی انتزاعی گروه قلمها زبانها )نام نویسه(ها )کد نویسه(ها
YehIsol تکپاره
YehFina تهپاره ARABIC LETTER
U+0649
BehInit پیشپاره ALEF MAKSURA
BehMedi میانپاره
YehIsol, TwoDotsBelow تکپاره
YehFina, TwoDotsBelow تهپاره ARABIC LETTER
U+064A
BehInit, TwoDotsBelow پیشپاره YEH
BehMedi, TwoDotsBelow میانپاره
YehIsol تکپاره
YehFina تهپاره ARABIC LETTER
U+06CC
BehInit, TwoDotsBelow پیشپاره FARSI YEH
BehMedi, TwoDotsBelow میانپاره
YehIsol, TailEnd تکپاره ARABIC LETTER
U+06CD
YehFina, TailEnd تهپاره YEH WITH TAIL
۱۳۹۱ تیرماه مدلِ انتزاعیِ نوشتهنگاری برای خط فارسی‐عربی 27
28. »دنبالههای شکلی برای چند نویسهی حرفیِ نمونه از خانوادهی «کاف
دنبالهی شکلی انتزاعی گروه قلمها زبانها )نام نویسه(ها )کد نویسه(ها
KafIsol, KafchehAbove تکپاره
KafFina, KafchehAbove تهپاره ARABIC LETTER
U+0643
KehInit پیشپاره KAF
KehMedi میانپاره
KehIsol تکپاره
KehFina تهپاره ARABIC LETTER
U+06A9
KehInit پیشپاره KEHEH
KehMedi میانپاره
SwashKafIsol تکپاره
SwashKafFina تهپاره ARABIC LETTER
FA, AR U+06A9
SwashKafInit پیشپاره KEHEH
SwashKafMedi میانپاره
SwashKafIsol تکپاره
SwashKafFina تهپاره ARABIC LETTER
U+06AA
SwashKafInit پیشپاره SWASH KAF
SwashKafMedi میانپاره
۱۳۹۱ تیرماه مدلِ انتزاعیِ نوشتهنگاری برای خط فارسی‐عربی 28
29. دنبالههای شکلی
0 برای هر کلمه نیز دنبالههای شکلیای تعریف میشود
0 توالیِ دنبالههای شکلیِ نویسهها کلمه (حرفی و آوانمایی)
0 رشتههای نویسهای برای یک دنبالهی شکلی
0 پیدا کردن رشتههای نویسهای به طوری که دنبالهی شکلی آنها برابر با
ِ
دنبالهی شکلیِ مطلوب باشد
تیرماه ۱۹۳۱ مدلِ انتزاعیِ نوشتهنگاری برای خط فارسی‐عربی 92
30. کلمات همشکل و مشابه
0 کلمات همشکل
0 با تبدیل رشتهی نویسههای یک کلمه به دنبالههای شکلِ آن، و تبدیل
دوبارهی دنبالههای شکلی به رشتههای نویسهایِ آنها
0 کلمات مشابه
0 با تعریف یک تابع متریک برای دنبالههای شکلی
0 شکلهای پایه را با یکدیگر مقایسه کرده و شکلهای کمکی را با یکدیگر
تیرماه ۱۹۳۱ مدلِ انتزاعیِ نوشتهنگاری برای خط فارسی‐عربی 03
31. کاربردهای مدل انتزاعی
سیب
تیرماه ۱۹۳۱ مدلِ انتزاعیِ نوشتهنگاری برای خط فارسی‐عربی 13
32. کاربردهای مدل انتزاعی
0 اطالعات ساختیافته برای همهی نمودهای نویسههای حرفی
0 جزئیات کافی در مورد زبانها و قلمها
⇐ میتواند مرجعی کافی برای طراحی فونت باشد
0 میتوان کلمات همشکل یا مشابه را شناسایی کرد
0 مسائل امنیتی و استفادهپذیری قابل پیشگیری خواهند بود
تیرماه ۱۹۳۱ مدلِ انتزاعیِ نوشتهنگاری برای خط فارسی‐عربی 23