2900

 

 

كد تبادل اطلاعات بزبان فارسي

 

 

 

 

چاپ دوم


موسسه استاندارد و تحقيقات صنعتي ايران

موسسه استاندارد و تحقيقات صنعتي ايران تنها سازماني است در ايران كه بر طبق قانون ميتواند استاندارد رسمي فرآورده‏ها را تعيين و تدوين و اجراي آنها را با كسب موافقت شورايعالي استاندارد اجباري اعلام نمايد. وظايف و هدفهاي موسسه عبارتست از:

(تعيين، تدوين و نشر استانداردهاي ملي – انجام تحقيقات بمنظور تدوين استاندارد بالا بردن كيفيت كالاهاي داخلي، كمك به بهبود روشهاي توليد و افزايش كارائي صنايع در جهت خودكفائي كشور - ترويج استانداردهاي ملي – نظارت بر اجراي استانداردهاي اجباري – كنترل كيفي كالاهاي صادراتي مشمول استاندارد اجباري و جلوگيري از صدور كالاهاي نامرغوب بمنظور فراهم نمودن امكانات رقابت با كالاهاي مشابه خارجي و حفظ بازارهاي بين المللي كنترل كيفي كالاهاي وارداتي مشمول استاندارد اجباري بمنظور حمايت از مصرف كنندگان و توليدكنندگان داخلي و جلوگيري از ورود كالاهاي نامرغوب خارجي راهنمائي علمي و فني توليدكنندگان، توزيع كنندگان و مصرف كنندگان – مطالعه و تحقيق درباره روشهاي توليد، نگهداري، بسته بندي و ترابري كالاهاي مختلف – ترويج سيستم متريك و كاليبراسيون وسايل سنجش – آزمايش و تطبيق نمونه كالاها با استانداردهاي مربوط، اعلام مشخصات و اظهارنظر مقايسه اي و صدور گواهينامه هاي لازم).

موسسه استاندارد از اعضاء سازمان بين المللي استاندارد ميباشد و لذا در اجراي وظايف خود هم از آخرين پيشرفتهاي علمي و فني و صنعتي جهان استفاده مينمايد و هم شرايط كلي و نيازمنديهاي خاص كشور را مورد توجه قرار ميدهد.

اجراي استانداردهاي ملي ايران بنفع تمام مردم و اقتصاد كشور است و باعث افزايش صادرات و فروش داخلي و تأمين ايمني و بهداشت مصرف كنندگان و صرفه جوئي در وقت و هزينه‏ها و در نتيجه موجب افزايش درآمد ملي و رفاه عمومي و كاهش قيمتها ميشود.


 

كميسيون فني استاندارد كامپيوتر

 

 

رئيس

شركت نرم‏افزاري سينا

 دكتراي كامپيوتر

صنعتي - محمد

 

اعضاء

شركت داده‏پردازي ايران

 ليسانس مهندسي كامپيوتر

ارسنجاني  - علي

شركت جنرال سيستمز

 ليسانس

اشكان - حميدرضا

مركز كامپيوتر شهرداري

 

اشعريون -  محسن

شركت پارس الكتريك

 ليسانس مهندسي الكترونيك

باقري - ابراهيم

دفتر خدمات ماشيني وزارت فرهنگ و آموزش عالي

 ليسانس مهندسي كامپيوتر

بنائي كاشاني  - بهروز

شوراي عالي انفورماتيك كشور و مركز تحقيقات مخابرات

 فوق ليسانس مهندسي كامپيوتر

جابري پور - قاسم

وزارت صنايع

 ليسانس كامپيوتر

صناعي - رضا

بانك ملت

 ليسانس

كاتبي

شركت ايران ارقام

 فوق ليسانس كامپيوتر

كسرائي - عبدالله

شركت دي پي اف ئي

 ليسانس ترجمه انگليسي

مسرور - حسين

شركت انفورماتيك

 فوق ليسانس مهندسي كامپيوتر و فوق ليسانس مهندسي الكتريك

ميرزا عبداللهي - محمد

بانك صنعت و معدن

 ليسانس آمار و كامپيوتر

ميري - سيدمهدي

 

دبير

مؤسسه استاندارد و تحقيقات صنعتي ايران

 فوق ليسانس مهندسي سيستمها

روحاني سراجي - علي


فهرست مطالب

 

هدف

دامنه كاربرد

تعاريف و اصطلاحات

ويژگيهاي مجموعه نمادهاي كد شده

اصول كار


 

بسمه تعالي

پيشگفتار

 استاندارد كد تبادل اطلاعات به زبان فارسي كه به وسيله كميسيون فني استاندارد كامپيوتر تهيه و تدوين شده و در كميته ملي استاندارد كامپيوتر مورخ 67/4/14 مورد تأييد قرار گرفته , اينك به اسناد ماده يك قانون مواد الحاقي به قانون تأسيس مؤسسه استاندارد و تحقيقات صنعتي ايران مصوب آذر ماه 1349 به عنوان استاندارد رسمي ايران منتشر مي‏گردد .

 براي حفظ هماهنگي و همگامي با پيشرفتهاي ملي و جهاني در زمينه صنايع و علوم , استانداردهاي ايران در مواقع لزوم مورد تجديدنظر قرار خواهند گرفت و هرگونه پيشنهادي كه براي اصلاح يا تكميل اين استانداردها برسد در هنگام تجديدنظر در كميسيون فني مربوط مورد توجه واقع خواهد شد .

 بنابراين براي مراجعه به استانداردهاي ايران بايد همواره از آخرين چاپ و تجديدنظر آنها استفاده نمود .

 در تهيه و تدوين اين استاندارد سعي شده است كه ضمن توجه به شرايط موجود و نيازهاي جامعه حتي المقدور بين اين استاندارد و استاندارد كشورهاي صنعتي و پيشرفته هماهنگي ايجاد شود .

 لذا با بررسي امكانات و مهارتهاي موجود و اجراي آزمايشهاي لازم اين استاندارد با استفاده از منابع زير تهيه گرديده است :

 

ISO 646

ISO 2002

 

 مقدمه

 تبادل اطلاعات در گسترش و پيشرفت دانش و يافته‏هاي بشري نقش بسزائي ايفا نموده است . زبانهاي اقوام و ملل مختلف در طول تاريخ ابتدا جهت رفع نيازهاي روزمره زندگي اجتماعي آنان ابداع و مورد استفاده قرار گرفت . به دنبال آن پس از اختراع خط و امكان ثبت و تبادل اطلاعات نقش اساسي تبادل اطلاعات در جوامع بشري حائز اهميت شد .

 خط در هر زبان چيزي جز يك قرارداد " تبادل اطلاعات " بين افرادي كه به آن زبان تكلم مي‏كنند نيست . در بعضي از زبانهاي مورد استفاده بشر جوامع اوليه , شكل هر شي‏ء علامتي بوده كه بيننده را به معني آن هدايت مي‏نمود و براي مفاهيم انتزاعي اشكال , قراردادي يا اعتباري مورد استفاده قرار مي‏گرفت . در بعضي از زبانها مانند زبان چيني براي هر مفهوم , يك شكل مستقل ( كلمه ) در نظر مي‏گيرند در حاليكه در بسياري از زبانها براي نشان دادن اصوات بكار رفته از " الفبا " كه به تنهائي معني و مفهوم خاصي ندارند استفاده شده است ولي هر مفهوم به كمك يك يا چند علامت ( الفبا , ارقام و ديگر علائم ) كد مي‏شود . اين روش كدگذاري بسيار دقيق بوده و همه از آن به يك صوت استفاده مي‏كنند يا به عبارت ديگر " استاندارد " شده است . به عنوان مثال در الفباي زبان فارسي " م " به عنوان كد اولين صداي كلمه " محبت " در نظر گرفته شده كه ممكن است بسته به موقعيت آن در كلمه مورد استفاده يا در رسم الخطهاي مختلف به اشكال گوناگوني ظاهر گردد وليكن آنچه ثابت و استاندارد است اختصاص حرف بيست و هشتم از الفباي فارسي به صداي " م‏م "... مي‏باشد .

 با پيشرفت تكنولوژي و به وجود آمدن كامپيوتر , قلمرو تبادل اطلاعات كامپيوتري از نظر كاربرد همه ابعاد اداري , تجاري , علمي , آموزشي , تحقيقاتي , خدماتي و ... را در بر گرفته است . اين ارتباطات , از اتصال دو دستگاه در يك دفتر كار توسط كابل تا ارتباطات راه دور ماهواره‏اي را شامل مي‏شود كه ميزان استفاده از آن شاخصي براي بهره‏برداري مؤثر از امكانات كامپيوتري در يك جامعه بشر مي‏آيد .

 ساختار سخت‏افزاري كامپيوترها به نحوي است كه فقط قادر به انجام اطلاعات بسيار ساده عددي مي‏باشند و هركاري كه توسط كامپيوتر انجام مي‏شود نتيجه اجراي حجم زيادي از عمليات عددي ساده توسط سخت‏افزار است . ضبط اطلاعات در حافظه كامپيوتر نيز بايد به صورت عددي باشد تا سخت‏افزار بتواند روي آن اطلاعات عمل نمايد . لذا , كدهاي مورد استفاده در پردازنده و حافظه كامپيوتري عددي مي‏باشد .

 منظور از استاندارد نمودن مجموعه كد علائم اين است كه همانگونه كه با ديدن اشكال مختلف حرف " سين " ( سـ , س ) در اندازه‏هاي مختلف يك صدا از آن تداعي مي‏گردد و يا با ديدن يكي از علائم ,"/" ":" و "-" با هر اندازه , رنگ و انحنائي مفهوم عمل تقسيم درك مي‏شود , كامپيوترهاي گوناگون نيز به كمك دستگاههاي ورودي خود بتوانند مثلا از دريافت نشانه‏اي از حرف " سين ," علامت تقسيم همگي يك كد براي هر يك از مفاهيم موردنظر را در حافظه خود ذخيره نمايند . هرچند كه نحوه ورود علائم به دستگاههاي ورودي هريك و يا دستگاههاي ورودي گوناگون يكي از آنها كاملا متفاوت باشد . به همين ترتيب در مورد نمايش اطلاعات در دستگاههاي خروجي , همه آنها يك كد را از كامپيوتر خود دريافت نمايند وليكن احتمالا شكل نمايش آن كد براي آنها تفاوت داشته باشد .

 همانطور كه براي هر زبان و يا گروهي از زبانها , الفبا و علائم ( مجموعه كد ) خاصي تعريف شده و در تبادل اطلاعات بكار مي‏رود براي كامپيوتر نيز به منظور تبادل اطلاعات در محدوده يك زبان , يك مجموعه كد استاندارد خاص آن زبان تعريف و تدوين مي‏گردد . با توجه به اين نكته براساس مقررات سازمان جهاني استاندارد , (ISO) كه كد استاندارد حاضر از آن تبعيت مي‏نمايد , مجموعه كدهاي صفر تا يكصد و بيست و هفت براي استانداردهاي تبادل اطلاعات محلي به منظور استفاده در محيطهاي كامپيوتري هفت بيتي و نيز مجموعه كدهاي 128 تا 255 براي توسعه استاندارد تبادلات اطلاعات بين المللي ( به طوري كه شامل استاندارد تبادل اطلاعات محلي نيز شود ) براي استفاده در محيطهاي كامپيوتري هشت بيتي و كاربردهاي دو زبانه در نظر گرفته شده‏اند .

 بدين ترتيب آنچه كه در صفحات بعد مي‏آيد شرح نحوه انطباق كدهاي صفر تا 127 و يا متناظرا 128 تا 255 بر مجموع علائم زبان فارسي شامل حروف , ارقام و همچنين علائم نقطه‏گذاري , محاسباتي و كنترلي به همراه توصيف و تشريح كامل مفهوم يكايك آنها خواهد بود . نمادهاي مورد استفاده در اين استاندارد صرفأ به منظور تسهيل شناسائي مفهوم علائم مذكور بوده و جزئي از اين استاندارد نمي‏باشد . لذا استفاده از آنها اجباري نيست و براي هر محيط كامپيوتري و دستگاه ورودي / خروجي مستقلا قابل تعريف خواهند بود وليكن استفاده از كدهاي تعيين شده براي آنان اجباري است .

 اهميت اين استاندارد براي ايجاد هماهنگي از نظر تبادل اطلاعات زبان فارسي بين سيستمهاي مختلف كامپيوتري احتياج به تأكيد ندارد . در مورد كاربردهاي كامپيوتري و لزوم وجود استاندارد مربوطه بررسي نقطه نظرهاي زير حائز اهميت است . [1]

 1- از نظر سازندگان كامپيوتر , براي حذف اطلاعات تكراري هنگام طرح سيستمهاي جديد و ارائه محصولات متنوع .

 2- از نظر استفاده كنندگان : براي حفظ سازگاري (compatibility) بين سيستمهاي مختلف , آزادي بيشتر در انتخاب اجزاي مورد نياز هر سيستم و امكان اشتراك مساعي از طريق استفاده از نتايج كار ديگران .

 3- از نظر متخصصين كامپيوتر , براي ايجاد يكنواختي در سيستمها و روشهاي استفاده از آنها , امكان استفاده از محصولات پيش ساخته و عدم نياز به مطالعه خواص منحصر به فرد در هر سيستم جديد .

 به طور كلي در هر زمينه , پيدايش استانداردها به دنبال استفاده نسبي از كاربردهاي مختلف و ايجاد آگاهي كافي به مسائل موجود و به منظور جلوگيري از هرج و مرج و اتلاف منافع و امكانات شروع مي‏شود . در ايران نيز پس از پيروزي انقلاب اسلامي و جهش به سوي خود كفائي و استفاده هرچه مؤثرتر از منابع و امكانات موجود و جلوگيري از دوبار كاري‏ها , ضرورت تدوين چنين استانداردهائي كاملا مشهود مي‏نمايد .

 منافع حاصل از تبعيت اينگونه استانداردها به دو دسته قابل تقسيم هستند :

 1- منافع ملي : نشان دادن رشد تكنولوژي انفورماتيك و كاربردهاي آن در كشور , تقليل درجه وابستگي به سازندگان سيستمهاي كامپيوتري خاص , و پايه‏گذاري صنايع داخلي انفورماتيك به طريق صحيح .

 2- منافع اقتصادي : عدم نياز به مطالعات تكراري و برنامه نويسي مجدد در طرح سيستمهاي جديد , جلب نظر سازندگان داخلي و ايجاد انگيزه رقابت بين آنها , و امكان انتخاب با صرفه‏ترين اجزاء در سيستمهاي كامپيوتري .

 اساسي‏ترين استاندارد براي شروع كار در اين زمينه مربوط به كد تبادل اطلاعات زبان فارسي است . استفاده از يك كد استاندارد در كليه مواردي كه اطلاعات فارسي بين سيستمهاي مختلف رد و بدل مي‏شود به ما اين امكان را خواهد داد كه بدون نياز به دانستن مشخصات سيستمهاي فرستنده و گيرنده اطلاعات , بتوانيم اطلاعات ارسالي را به صورت واحدي تعبير نمائيم . ايجاد اين نوع ارتباط بين سيستمهاي مختلف در حال حاضر توسط برنامه‏هاي مترجم مخصوص صورت مي‏گيرد . بديهي است كه با ازدياد روز افزون انواع سيستمهاي مختلف , اين نحوه عمل داراي بازده بسيار كمي بوده و باعث اتلاف نيرو مي‏شود زيرا هر سيستم بايد برنامه مترجم مخصوص كليه مواردي كه اطلاعات صرفأ در داخل يك سيستم ( كه نيازي به تبادل اطلاعات با سيستمهاي ديگر ندارد ) رد و بدل مي‏شوند تبعيت از يك كد استاندارد لازم نيست اگرچه استفاده از چنين كدي توسعه و ارتباطهاي بعدي را با سيستمهاي ديگر ساده‏تر خواهد ساخت .

 بايد توجه داشت كه وضع نمودن استانداردها در تمام زمينه‏ها با اشكالاتي روبرو مي‏شود كه از آن جمله مي‏توان وجود سيستمهاي غيراستاندارد و سرمايه‏گذاري‏هاي وسيع در ايجاد اين سيستمها و تكنلوژي‏هاي وابسته به آنها را نام برد .

 از آنجائي كه استاندارد تهيه شده مي‏بايد براي مدت طولاني مورد استفاده قرار گيرد و از سوي ديگر تكنولوژي مربوطه يعني كامپيوتر , نيز به سرعت در حال تغيير و تحول مي‏باشد , اهميت عدم وابستگي اين استاندارد به تكنولوژي ( هاي ) خاص موجود آشكار مي‏گردد . با توجه به اين امر اصول كلي كه در تدوين اين استاندارد مورد توجه قرار گرفته است به شرح زير مي‏باشد : [2]

 1- كد استاندارد علائم بايد قابليت انتقال اطلاعات را به طور صحيح دارا باشد . بدين ترتيب كه در انتقال اطلاعات از نقطه‏اي به نقطه ديگر هيچگونه خدشه‏اي وارد نشود .

 2- در تدوين كد استاندارد براي تبادل اطلاعات اين اصل بايد مورد توجه قرار گيرد كه استقلال كامل آن از تكنولوژيهاي ويژه و يا سيستمهاي كامپيوتري خاص حفظ گردد . گذري به تاريخ كوتاه كامپيوتر و مشاهده تغيير سريع تكنولوژي آن در اين مدت كوتاه , اهميت اين اصل را آشكار مي‏سازد . وابستگي استاندارد به تكنولوژي خاص نه تنها آن را با گذشت زمان بي‏اهميت مي‏كند , بلكه باعث عدم پذيرش عمومي آن توسط سازندگان و جامعه استفاده كننده از كامپيوتر مي‏شود .

 3- كد استاندارد بايد شامل مجموعه‏اي كامل باشد . اين مجموعه بايد كليه علائم متداول در زبان فارسي را دارا باشد به طوريكه كاربرد كد تبادل اطلاعات در متونهاي فارسي به آن گونه كه مرسوم است , امكان‏پذير گردد .

 4- در تدوين كد استاندارد بايد به ترتيب قرار گرفتن علائم در جدول رمز , اهميت فوق العاده‏اي داده شود تا مرتب سازي اطلاعات به سهولت انجام‏پذير باشد . حفظ ترتيب الفبائي علائم در جدول كدها يكي از اصول ارزنده كد استاندارد مي‏باشد .

 5- در تدوين كد استاندارد بايد سهولت استفاده از آن در كاربردهاي نرم‏افزاري تا حد امكان مورد توجه قرار گيرد . چند نمونه از اين موارد عبارتند از :

 - حفظ تبادل يك به يك بين علائم و كد آنها در جدول كدها .

 - دسته‏بندي علائم بر حسب كاربرد آنها مانند علائم الفبا , علائم عددي , علائم رياضي و غيره .

 - ترتيب علائم در جدول كدها به نحوي كه تشخيص علائم هم نوع , مانند ارقام , از ساير علائم به سهولت امكان‏پذير باشد .

 الفباي زبان فارسي عمومأ داراي چهارگونه " تنها ," " اول ," " وسط " و " آخر " مي‏باشد . گونه‏هاي مختلف حروف را مي‏توان با استفاده از يك الگوريتم منتنج از قواعد املائي به كمك حروف قبلي و بعدي تعيين كرد . بنابراين براي تبادل اطلاعات احتياجي به گنجاندن گونه‏هاي مختلف حروف در جدول كدها نيست . [2][3]

 از سوي ديگر , استفاده از كد تك نمادي براي مبادله اطلاعات متون فارسي خالي از اشكال نيست . به عبارت ديگر تنها با استفاده از الگوريتم املائي نمي‏توان متون فارسي را كه با كد تك نمادي نمايش داده شده‏اند به صورت اصلي بازسازي كرد . براي مثال كلمات " صومعه‏سرا " و " لك لك " را در نظر بگيريد . اين كلمات با استفاده از كد تك گونه‏اي به صورت " ص و م ع ه س ر ا " و " ل ك ل ك " در مي‏آيند كه در موقع نمايش در دستگاههاي خروجي با به كاربردن الگوريتم املائي به صورت " مومعهسرا " و " لكلك " ظاهر مي‏شوند .

 با توجه به ازدياد كلمات مركب در زبان فارسي , اشكال فوق استفاده از كد تك گونه‏اي براي تبادل اطلاعات را غيرممكن مي‏سازد . حل اين مشكل با استفاده از علامت فاصله , يا فاصله مجازي (Pseudo Space) براي جدا كردن اجزاء كلمه ممكن نيست . اين راه حل نه تنها باعث ازدياد طول متن مي‏شود بلكه نظام الفبائي كلمات را نيز بهم زده و كار مرتب سازي اطلاعات را دچار اشكال مي‏نمايد .

 براي حل اين مشكل بايد قادر باشيم در صورت تمايل , در جاهائي كه حرفي امكان چسبيدن به حرف بعدي را دارد , آن حرف را جدا بنويسيم . براي اين منظور كد دو گونه‏اي را در نظر مي‏گيريم . در اين كد براي هر حرف از الفبا دو گونه اصلي و مبدله (Shift Code) تعريف شده است . از كد مبدله فقط در مواقعي استفاده مي‏شود كه عمدا بخواهيم از چسبيدن حرفي به حرف بعديش , برخلاف الگوريتم املائي , جلوگيري شود . بدين منظور در دستگاههاي خروجي در هنگام برخورد با كد مبدله يك حرف , گونه مناسب آن ( آخر يا تنها ) نمايش داده مي‏شود . اين راه حل تغييري در طول متون نمي‏دهد .

 همان طور كه نشان خواهيم داد با جاگذاري مناسب كدهاي دو گونه‏اي در جدول كد , نظام الفبائي اطلاعات كاملا حفظ شده و با يك عمل ساده , كد مبدله به كد اصلي آن تبديل مي‏شود كه كار مرتب سازي اطلاعات را دچار هيچگونه اشكالي نخواهد كرد .

 

كد تبادل اطلاعات در زبان فارسي

  1- هدف

 هدف از تدوين اين استاندارد تعيين كد مشخص شده براي مجموعه علائم زبان فارسي جهت ضبط و پردازش آن در كامپيوتر ( و يا هر پردازنده ديگر ) و تبادل اطلاعات بين اين نوع پردازنده‏ها مي‏باشد .

  2- دامنه كاربرد

 دامنه كاربرد اين استاندارد در دستگاههائي خواهد بود كه قابليت ضبط , بازخواني و انتقال اطلاعات فارسي را داشته باشند مانند :

 - انواع كامپيوترها

 - شبكه‏هاي انتقال اطلاعات

 - انواع دستگاههاي ورودي اطلاعات ( مانند علامت خوان , كارت خوان , ديسك و نوار گردان , صفحه كليد , تجزيه صوت و غيره )

 - انواع دستگاههاي خروجي اطلاعات ( مانند چاپگر , صفحه نمايس ديسك گردان , نوار گردن و غيره )

 اطلاعات به رمز درآمده جهت پنهان سازي اطلاعات از اين استاندارد مستثني هستند .

  3- تعاريف و اصطلاحات

 3-1- داده 1:

 مجموعه‏اي از يافته‏ها است كه امكان دارد در ابتدا به صورت نامنظم باشد .

 3-2- اطلاع 2:

 حاوي بيان ارتباط بين اشيأ , امور و پديده‏هاي جهان هستي است . هر پديده , رويداد , وضعيت و تغيير حالتي ميتواند توليد اطلاع نمايد .

 3-3- پردازش 3:

 مجموعه‏اي از عمليات است كه روي دادها انجام مي‏گيرد و آنها را تبديل به اطلاعات مفيد مي‏سازد .

 3-4- مجموعه علائم زبان فارسي :

 شامل حرف الفبا , ارقام دهدهي , نمادهاي نقطه‏گذاري رياضي , جدول بندي , و نمادهاي كنترلي مي‏باشند .

 مشخصه‏هاي مربوط به عملكرد نمادهاي كنترلي و بعضي از تعاريف اين قسمت به صورت كلي بيان شده است , كه براي كسب اطلاعات بيشتر مي‏توان به انتشارات ISO مراجعه كرد .

 3-5- تركيب بيتي : 4:

 مجموعه مرتب شده‏اي از بيتها كه براي نماياندن نمادها به كار مي‏رود .

 3-6- نماد 5:

 عضوي از مجموعه عناصر است كه براي سازماندهي , كنترل يا نماياندن داده به كار مي‏رود .

 3-7- مجموعه نمادهاي كد شده : كد : 6

 مجموعه‏اي از قواعد مشخص است كه مجموعه نمادها و رابطه يك به يك ميان هر نماد با تركيب بيتي‏اش را بنا مي‏كند .

 3-8- گسترش كد 7:

 شيوه‏اي كه براي كدگذاري نمادهائي كه در مجموعه نمادهاي كد شده معيني نيستند استفاده مي‏گردد .

 3-9- جدول كدها 8:

 جدولي كه نماد اختصاص يافته به هر تركيب بيتي را نشان مي‏دهد .

 3-10- نماد كنترل 9:

 تابع كنترلي است كه نمايش كد شده آن از يك تركيب بيتي منفرد تشكيل يافته باشد .

 3-11- تابع كنترل 10:

 عملي است كه بر ثبت پردازش , انتقال يا تفسير داده تأثير مي‏گذارد و داراي نمايش كد شده مشتمل بر يك يا چند تركيب بيتي مي‏باشد .

 3-12- نماد ترسيمي 11:

 نمادي , غير از تابع كنترلي است , كه داراي يك نمايش عيني بوده و معمولا به صورت دست نوشته , چاپي يا تصويري مي‏باشد .

 3-13- نهش 12:

 قسمتي از جدول كدها كه به وسيله ستون و رديف مربوطه‏اش مشخص مي‏گردد .

 3-14- تقسيم‏بندي كلي نمادهاي كنترل :

 نمادهاي عمومي كنترل به چهار قسم مشخص به شرح زير تعريف مي‏گردند :

 3-15-1- نمادهاي كنترل كننده انتقال 13

 اين نمادها به منظور كنترل يا سهولت انتقال اطلاعات در شبكه‏هاي ارتباطي به كار مي‏روند كه عبارتند از :

 ETB ,SYN ,NAK ,DLE ,ACK ,ENQ ,EOT ,ETX ,STX ,SOH

 3-15-1-1- آغاز سرفصل 14:

 يك نماد كنترل كننده انتقال است كه به عنوان اولين نماد يك سر فصل حاوي پيام اطلاعاتي بكار مي‏رود .

 3-15-1-2 آغاز متن 15:

 يك نماد كنترل كننده انتقال است كه قبل از يك متن مي‏آيد و براي ختم سر فصل بكار مي‏رود .

 3-15-1-3- نماد پايان متن 16:

يك نماد كنترل كننده انتقال است كه يك متن را خاتمه ميدهد

3-15-1-4- نماد پايان انتقال 17

يك نماد كنترل كننده انتقال است كه براي مشخص كردن پايان انتقال يك يا چند متن بكار مي‏رود .

 3-15-1-5- نماد پرسش 18:

 يك نماد كنترل كننده انتقال است كه بهنگام درخواست پاسخ از يك ايستگاه راه دور بكار مي‏رود . پاسخ ممكن است شامل هويت و يا وضعيت ايستگاه باشد . هنگامي كه بكارگيري تابع " شما كه هستيد " در شبكه عمومي انتقال سويچي ضروري باشد اولين استفاده از ENQ پس از برقراري ارتباط به منزله " شما كه هستيد " ( تعيين هويت ايستگاه ) تلقي مي‏گردد .

 استفاده بعدي ENQ ممكن است بر اساس توافق شامل " شما كه هستيد " باشد يا نباشد .

 3-15-1-6- نماد تصديق 19:

 يك نماد كنترل كننده انتقال است كه توسط گيرنده به عنوان پاسخ مثبت فرستنده ارسال مي‏گردد .

 3-15-1-7- نماد گيرنده ورودي 20:

 يك نماد كنترل كننده انتقال است كه معني تعداد محدودي از نمادهاي مجاور بعدي را عوض مي‏نمايد . اين نماد به طور انحصاري براي تأمين توابع تكميلي كنترل كننده انتقال بكار مي رود . تنها نمادهاي ترسيمي و كنترل كننده انتقال مي‏توانند در دنباله‏هاي DLE مورد استفاده قرار گيرند .

 3-15-1-8- نماد عدم تصديق 21:

يك نماد كنترل كننده انتقال است كه توسط گيرنده بمنزله پاسخ منفي به فرستنده ارسال ميگردد .

3-15-1-9- نماد عاطل براي حفظ هماهنگي 22:

 يك نماد كنترل كننده انتقال است كه توسط سيستم انتقال دهنده از نوع هماهنگ‏ساز در نبود ساير نمادها ( در وضعيت بيكاري ) براي حفظ و تأمين نشانه هماهنگي بين سيستم و پايانه بكار مي‏رود .

 3-15-1-10- نماد پايان انتقال توده‏اي از داده 23:

 اين نماد پايان انتقال توده‏اي از داده كه به منظور انتقال به چنين توده‏هائي تقسيم شده‏اند را مشخص مي‏نمايد .

 3-16- نمادهاي شكل‏بندي 24:

 نمادهاي كنترلي فوق بيشتر به منظور كنترل شكل و چگونگي قرار دادن اطلاعات بر روي چاپگر يا صفحه نمايش بكار مي‏روند . تعاريف " نمادهاي شكل بندي " مربوط به دستگاه چاپگر , شامل دستگاه صفحه نمايش نيز مي‏باشد كه ذيلا تنها به دستگاههاي چاپگر اشاره شده است .

 نمادهاي شكل بندي از مفاهيم زير استفاده مي‏كنند

 - صفحه , كه از تعدادي از خطوط متشكل از نمادها ساخته شده است .

 - نمادهائي كه يك خط را تشكيل مي‏دهند مي‏توانند در نهش‏هائي كه " نهش نماد " ناميده مي‏شوند قرار گيرند .

 - " نهش مولد " نهشي است كه در صورت چاپ , نماد مربوطه در نهش آن ظاهر مي‏شود , نهش‏هاي مولد به صورت پي‏درپي مي‏گيرد .

 " نمادهاي شكل بندي " عبارتند از :

 3-16-1- نماد برگشت به عقب 25:

 يك نماد شكل بندي است كه موجب مي‏شود نهش مولد به اندازه نهش يك نماد به عقب رانده شود .

 3-16-2- نماد جدول بندي افقي 26:

 يك نماد شكل بندي است كه موجب مي‏شود نهش مولد به نهش نماد معين بعدي به جلو رانده شود .

 3-16-3- نماد جدول بندي عمودي 27:

 يك نماد شكل‏بندي است كه موجب مي‏شود نهش مولد به نهش نماد متناظر در خط معين بعدي به جلو رانده شود .

 3-16-4- نماد خط بعد 28:

 يك نماد شكل بندي است كه موجب مي‏شود نهش مولد به نهش نماد متناظر در خط بعدي به جلو رانده شود .

 3-16-5- نماد فرم بعد 29:

 يك نماد شكل بندي است كه موجب مي‏شود نهش مولد به نهش نماد متناظر در خط معيني از فرم يا صفحه بعدي به جلو رانده شود .

 3-16-6- نماد برگشت به سر خط 30:

 يك نماد شكل بندي است كه موجب مي‏شود نهش مولد به نهش اولين نماد در همان خط رانده شود .

 3-17- نمادهاي كنترل گسترش كد عبارتند از :

 3-17-1- نماد انتقال از حالت اوليه به ثانويه 31:

 يك نماد كنترل كننده است كه به همراه IN - Shift و Escape براي گسترش مجموعه نمادهاي ترسيمي كد بكار مي‏رود . اين نماد ممكن است معني تركيبات بيتي ستون 2 تا 7 ( به استثناي اولين عنصر ستون 2 و آخرين عنصر ستون 7) كد را تا رسيدن به نماد IN - Shift تغيير دهد .

 اثرات اين نماد به هنگام استفاده از تكنيكهاي گسترش كد در استاندارد 2022 ISO تشريح شده است .

 3-17-2- نماد انتقال از حالت ثانويه به اوليه 32:

 يك نماد كنترل كننده است كه به همراه  out - Shift و Escape براي گسترش مجموعه نمادهاي ترسيمي كد به كار مي‏رود . اين نماد ممكن است معاني استاندارد تركيبات بيتي كه به دنبالش مي‏آيند را دوباره برقرار نمايد . تأثير اين نماد بهنگام استفاده از تكنيكهاي گسترش كد در استاندارد 2022 ISO شرح داده شده است .

 3-17-3- نماد گريز 33:

 يك نماد كنترل كننده است كه براي فراهم آوردن نمادهاي اضافي بكار مي‏رود . اين نماد ممكن است معني تعداد محدودي از تركيبات بيتي مجاور و به دنبال را عوض كند . استفاده از اين نماد در استاندارد 2024 ISO مشخص شده است .

 3-18- نمادهاي كنترل كننده دستگاه 34:

 اين نمادها براي كنترل دستگاه ( يا دستگاههاي ) فرعي محلي يا دور دست متصل به يك پردازشگر و يا سيستم ارتباط اطلاعاتي راه دور مورد استفاده قرار مي‏گيرد . اين نمادها براي كنترل سيستم‏هاي ارتباطاتي در نظر گرفته نشده است بلكه چنين عملي را مي‏توان با استفاده از نمادهاي كنترل كننده انتقال صورت داد .

 3-18-1- نماد كنترل كننده دستگاه 1 35:

 - يك نماد كنترل كننده دستگاه است كه در اصل براي روشن نمودن و يا آغاز ساختن يك دستگاه فرعي در نظر گرفته شده است , چنانچه براي اين منظور موردنياز نباشد ممكن است براي برگرداندن دستگاه به حالت اوليه عمليات (DC2 و DC3 را نيز ملاحظه فرمائيد ) يا براي هر يك از ساير توابع كنترل كننده دستگاه كه توسط ديگر DC ها فراهم نشده باشد مورد استفاده قرار مي‏گيرد .

 3-18-2- نماد كنترل كننده دستگاه 2 36:

 - يك نماد كنترل كننده دستگاه است كه در اصل براي روشن نمودن و يا آغاز ساختن يك دستگاه فرعي در نظر گرفته شده است . چنانچه براي اين منظور موردنياز نباشد ممكن است براي قرار دادن يك دستگاه در حالت ويژه ( كه در اين حالت DC1 براي برگرداندن دستگاه به حالت اوليه بكار مي‏رود ) يا براي هر يك از ساير توابع كنترل كننده دستگاه كه توسط DC هاي ديگر فراهم نشده باشد مورد استفاده قرار مي‏گيرد .

 3-18-3- نماد كنترل كننده دستگاه 3 37:

 - يك نماد كنترل كننده دستگاه است كه در اصل براي خاموش نمودن يا ايستادن يك دستگاه فرعي در نظر گرفته شده است , اين عمل ممكن است يك ايست تراز دوم باشد . به عنوان مثال صبر , مكث , گوش بزنگ , توقف ( كه در اين حالت DC1 براي از سرگيري عمليات عادي بكار مي‏رود .) چنانچه براي اين منظور موردنياز نباشد ممكن است براي ساير توابع كنترل كننده دستگاههاي فرعي كه توسط ديگر DC ها فراهم نشده باشد مورد استفاده قرار گيرد .

 3-18-4- نماد كنترل كننده دستگاه 4 38:

 يك نماد كنترل كننده دستگاه است كه در اصل براي خاموش نمودن , ايستادن يا ايجاد وقفه در يك دستگاه فرعي در نظر گرفته شده است . چنانچه براي اين منظور موردنياز نباشد ممكن است براي ساير توابع كنترل كننده دستگاه كه توسط ساير DC ها فراهم نشده‏اند مورد استفاده قرار مي‏گيرند .

 3-19- نمادهاي جدا كنند اطلاعات 39:

 نمادهائي هستند كه براي جداسازي و تنظيم منطقي اطلاعات بكار مي‏روند . اين نمادها بر چهار گونه‏اند كه ممكن است به دو ترتيب سلسله مراتبي يا غير سلسله مراتبي مورد استفاده قرار گيرد . در طريق دوم معاني خاص آنها به نوع كاربردشان بستگي دارد .

 اگر به طريق سلسله مراتبي بكار برده شوند ترتيب صعودي آنها از چپ به راست عبارتند از :

 FS ,GS ,RS ,US

 در اين حالت عمومأ اطلاعاتي كه به وسيله يك جدا كننده خاص مرز بندي شده است نمي‏تواند به وسيله يك جدا كننده با ترتيب بالاتر جدا شود اما مي‏تواند بوسيله هر جدا كننده مرتبه بالاتري مرز بندي گردد .

 3-19-1- نماد جدا كننده اطلاعات 1 40:

 يك نماد كنترل كننده است كه براي جداسازي و تنظيم منطقي اطلاعات بكار مي‏رود . معني ويژه آن مي‏بايد براي هر كاربردي تعريف شود . همانگونه كه در شرح كلي نمادهاي جداكننده اطلاعات گفته شد اگر اين نماد به صورت سلسله مراتبي بكار رود بخشي از داده به نام واحد (Unit) را مرز بندي مي‏نمايد .

 3-19-2- نماد جدا كننده اطلاعات 2 41:

 يك نماد كنترل كننده است كه براي جداسازي و تنظيم منطقي اطلاعات بكار مي‏رود . معني ويژه آن مي‏بايد براي هر كاربردي تعريف شود . همانگونه كه در شرح كلي نمادهاي جدا كننده اطلاعات گفته شد اگر اين نماد به صورت سلسله مراتبي بكار رود بخشي از داده به نام ركورد (Record) را مرز بندي مي‏كند .

 3-19-3- نماد جدا كننده اطلاعات 3 42:

 يك نماد كنترل است كه براي جداسازي و تنظيم منطقي اطلاعات بكار مي‏رود . معني ويژه آن مي‏بايد براي هر كاربردي تعريف شود . همانگونه كه در شرح كلي نمادهاي جداكننده اطلاعات گفته شد اگر اين نماد به صورت سلسله مراتبي بكار رود بخشي از داده به نام گروه (Group) را مرز بندي مي‏نمايد .

 3-19-4- نماد جداكننده اطلاعات 4 43:

 يك نماد كنترل كننده است كه براي جداسازي و تنظيم منطقي اطلاعات بكار مي‏رود . معني ويژه آن مي‏بايد براي هر كاربردي تعريف شود . همانگونه كه در شرح كلي نمادهاي جداكننده اطلاعات گفته شد اگر اين نماد به صورت سلسله مراتبي بكار رود بخشي از داده بنام پرونده (File) را مرز بندي مي‏نمايد .

 3-20- ساير نمادهاي كنترل كننده :

 اينها نمادهائي هستند كه خارج از طبقه بنديها ذكر شده ( تعاريف 3-15-1 تا 3-19-4) قرار دارند و عبارتند از :

 3-20-1- نماد زنگ 44:

 يك نماد كنترل كننده است كه هنگامي بكار مي‏رود كه نياز به جلب توجه باشد و ممكن است زنگ يا دستگاه‏هاي آگاه كننده را كنترل نمايد .

 3-20-2- نماد تهي 45:

 يك نماد كنترل كننده است كه براي پر كردن فاصله زماني يا رسانه‏ها بكار مي‏رود . نمادهاي NUL مي‏توانند بدون تأثير بر محتويات اطلاعاتي رشته‏اي از داده‏ها در بين آن درج و يا از آن خارج شود . هرچند كه چنين عملي ممكن است بر شكل و چهارچوب اطلاعات و يا نحوه كنترل تجهيزات تأثير گذارد .

 3-20-3- نماد ابطال 46:

 يك نماد , يا اولين نماد از يك رشته است كه مشخص مي‏كند داده قبلي اشتباه است . در نتيجه , اين داده مي‏بايد ناديده گرفته شود .

 معني خاص اين نماد مي‏بايد در هر كاربردي و يا ميان فرستنده و دريافت كننده تعيين گردد .

 3-20-4- نماد انتهاي واسطه 47:

 يك نماد كنترل كننده است كه ممكن است جهت تعيين و تشخيص پايان فيزيكي و يا پايان بخش استفاده شده از يك واسطه بكار رود . اين نماد را مي‏توان در انتهاي يك بخش خواسته شده از اطلاعات ضبط شده بر روي يك واسطه نيز استفاده نمود . نهش اين نماد لزومأ بستگي به خاتمه فيزيكي واسطه ندارد .

 3-20-5- نماد جانشين 48:

 يك نماد كنترل كننده است كه بجاي نمادي كه اشتباه است و يا بي‏اعتبار تشخيص داده شده بكار مي‏رود . SUB جهت معرفي توسط وسائل خودكار در نظر گرفته شده است .

 3-20-6- نماد حذف 49:

 يك نماد كنترل كننده است كه در اصل براي حذف يا پاك كردن يك نماد اشتباهي يا ناخواسته در نوار سوراخ شده (Punched Tape) بكار مي‏رود . نماد DEL ممكن است براي پر كردن فاصله زماني يا رسانه‏ها استفاده گردد . اين نمادها مي‏توانند بدون تأثير بر محتويات اطلاعاتي رشته‏اي از داده‏ها در بين آن درج و يا از آن خارج شود , هرچند كه چنين عملي ممكن است بر شكل و چهار چوب اطلاعات و يا نحوه كنترل تجهيزات اثر گذارد .

 3-21- نمادهاي ويژه كنترل كننده 50:

 گاهي اوقات نمادهاي كنترل كننده توسط اسم , تقسيم‏بندي شده و يك زيرنويس ( براي مثال SCT) و در بعضي اوقات به وسيله نام خاص مشخص كننده آن ( براي مثال ENQ) نامگذاري مي‏شوند .

 ممكن است معاني مختلف اما مربوط بهم به بعضي از نمادهاي كنترل تعلق گيرد و معمولا تبادل اطلاعات مبتني بر اين موضوع بين فرستنده و گيرنده توافق مي‏شود .

 3-22- نماد فاصله 51:

 يك نماد است كه در قبل و بعد از " نهش مولد " هر نماد در همان خط بكار مي‏رود . به اين نماد يك نماد غيرقابل چاپ و ترسيم نيز گفته مي‏شود .

  4- ويژگيهاي مجموعه نمادهاي كد شده

 بيت‏هاي تركيبات بيتي محيط 7 بيتي كد عبارتند از :

 b1 ,b2 ,b3 ,b4 ,b5 ,b6 ,b7

 b7 داراي بيشترين مرتبه و b1 داراي كمترين مرتبه مي‏باشد . تركيبات بيت را مي‏توان بدينگونه تفسير نمود كه اعداد صحيح در محدوده ده صفر تا 127 در محيط دودوئي است كه به نسبت وزن هر كدام جداگانه به شكل جدول زير مشخص مي‏شوند :

 در استاندارد بين المللي تركيبات بيتي بوسيله فرم y/x معرفي مي‏شوند كه x از صفر تا 7 و y از صفر تا 15 مي‏توانند مقدار بگيرند . ارتباط ما بين تركيبات بيتي از b7 تا b1 و فرم y/x بشرح زير است :

 - x عددي است كه بوسيله b7 ,b6 ,b5 معرفي مي‏گردد وقتي كه اين بيت‏ها داراي اوزان معيني داده شده به ترتيب 4 و 2 و 1 باشند .

 - y عددي است كه بوسيله b4 ,b3 ,b2 ,b1 معرفي مي‏گردد وقتي كه اين بيت‏ها داراي اوزان معيني به ترتيب 8 و 4 و 2 و 1 باشند .

 فرم Y/X با در نظر گرفتن X براي شماره ستون و Y براي شماره سطر نيز براي تشخيص نهش كدها در جدول كدهاي تبادل اطلاعات زبان فارسي بكار مي‏رود .

 تركيبات 128 بيت در محيط 7 بيتي كد , بوسيله نمادهاي كنترل كننده و ترسيمي مشخص مي‏شوند . اختصاص نمادها به تركيبات بيتي براساس اصول زير است :

 - تركيبات بيت 0/0 تا 1/15 معرف 32 نماد كنترل كننده مي‏باشد .

 - تركيب بيت 2/0 معرف نماد Space است كه مي‏تواند هم يك نماد كنترل كننده و هم يك نماد ترسيمي تلقي گردد .

 - تركيبات بيتي 2/1 تا 7/14 معرف حداكثر 94 نماد ترسيمي است كه يا چند تركيب آن مي‏تواند بدون استفاده اعلام گردد .

 ترتيب قرار گرفتن نمادها در تركيبات بيتي محيط 7 بيتي در جدولهاي شماره 8 و 9 آمده است .

  4- اصول كار

 4-1- نمادهاي كنترل كننده :

 نمادهاي كنترل كننده در محيط 7 بيتي عبارتند از :

 4-1-1- نمادهاي كنترل كننده انتقال :

 جدول شماره 2 فهرست , نام و محل كدهاي مربوط به نمادهاي كنترل انتقال را مشخص مي‏نمايد .

4-1-2- نمادهاي شكل بندي :

 جدول شماره 3 فهرست , نام و محل كدهاي مربوط به نمادهاي شكل بندي را مشخص مي‏نمايد .

4-1-3- نمادهاي كنترل كننده گسترش كد :

نمادهاي كنترل كننده گسترش در جدول شماره 4 معرفي شده اند .

4-1-4- نمادهاي كنترل كننده دستگاه :

نمادهاي كنترل كننده دستگاه در جدول شماره 5 معرفي شده اند .

 4-1-5- نمادهاي جداكننده اطلاعات :

 نمادهاي جدا كننده اطلاعات در جدول شماره 6 معرفي شده‏اند .

 نام‏هاي ويژه اين نمادها هنگامي مورد استفاده قرار مي‏گيرند كه به صورت سلسله مراتبي و به طريق زير به طور صعودي از چپ به راست استقرار يابند :

FS ,GS ,RS ,US

 اطلاعاتي كه به وسيله يك جدا كننده خاص جدا مي‏شود , نمي‏تواند بوسيله جدا كننده با مرتبه بالاتر ديگر جدا گردد اما مي‏توان آن را جدا شده به وسيله جدا كننده با مرتبه بالاتر تلقي نمود .

 4-2- ساير نمادهاي كنترل كننده :

 نمادهاي كنترل كننده خارج از بخشهاي فوق در جدول شماره 7 معرفي شده‏اند .

 4-2-1- نماد فاصله 52:

 حرف اختصاري نماد فاصله (Space) بصورت SP مي‏باشد و در جدول در محل 2/0 قرار مي‏گيرد .

 4-2-2- محل استقرار نمادهاي ترسيمي :

 محل استقرار نمادهاي ترسيمي در جدول شماره 8 مشخص شده است .

 مراجعات

 الف - مقدمه :

 1- اقتباس از مقدمه جزوه پيشنهادي كد تبادل اطلاعات وزارت برنامه و بودجه سال 59

 2- گزارش كامپيوتر - ارديبهشت 65 - مقاله 6 - دكتر محمد صنعتي

ب - تعاريف اصطلاحات :

 ايزو 646

 

 

 

 

 

1- Data

2- Information

3- Processing

4- Bit Combination

5- Character

6- Coded Character set ; coded

7- Code Extension

8- Code Table

9- Control Character

10- Control Function

11- Graphic Character

12- Position

13- TC - (Transimission Control Characters )

14- SOH (START OF HEADING )

15- STX - (Start of Text )

16- ETX - ( End of Text )

17- EOT - (End of transmission )

18- ENQ - ( Enquiry )

19- ACK - ( Acknowledge )

20- DLE  - ( Data Link Escape )

21- NAK - ( Negative Acknowledge )

22- SYN - ( Synchronous Idle )

23- ETB - ( End of Transmission Block )

24- FE - ( Format Effectors )

25- BS - ( Backspace )

26- HT - ( Horizontal tabulation )

27- VT - ( Vertical Tabulation )

28- LF - ( Line Feed )

29- FF - ( Form Feed )

30- CR - ( Carriage Return )

31- SO - ( Shift - Out )

32- SI - ( Shift - In )

33- ESC - ( Escape )

34- DC - ( Device Control Characters )

35- DC1

36- DC2

37- DC3

38- DC4

39- IS - ( Information Separators )

40- IS 1 ( US : Unit Separator )

41- IS 2 ( RS : Record Separator )

42- IS 3 ( GS : Group Separator )

43- IS 4 ( FS : File Separator )

44- BEL - (BELL)

45- NUL - (NULL)

46- CAN - (CANCEL)

47- EM - ( END OF MEDIUM )

48- SUB - ( SUBSTITUDE CHARACTER )

49- DEL - ( DELETE )

50- SPECIFIC CONTROL CHARACTERS

51- SP - ( SPACE )

52- Space


 

ISLAMIC REPUBLIC OF IRAN

 

Institute of Standards and Industrial Research of Iran

 

ISIRI NUMBER

 

2900

 

 

IRANIAN STANDARD CODE FOR INFORMATION INTERCHANGE

 

 

 

Second Edition