|
|
|
|
|
|
2900 |
|
|
|
كد تبادل اطلاعات بزبان فارسي |
|
|
|
چاپ دوم |
موسسه استاندارد و تحقيقات صنعتي ايران
موسسه
استاندارد و تحقيقات صنعتي ايران تنها سازماني است در ايران كه بر طبق قانون
ميتواند استاندارد رسمي فرآوردهها را تعيين و تدوين و اجراي آنها را با كسب
موافقت شورايعالي استاندارد اجباري اعلام نمايد. وظايف و هدفهاي موسسه عبارتست از:
(تعيين، تدوين و نشر استانداردهاي ملي – انجام تحقيقات بمنظور تدوين استاندارد بالا بردن كيفيت كالاهاي داخلي، كمك به بهبود روشهاي توليد و افزايش كارائي صنايع در جهت خودكفائي كشور - ترويج استانداردهاي ملي – نظارت بر اجراي استانداردهاي اجباري – كنترل كيفي كالاهاي صادراتي مشمول استاندارد اجباري و جلوگيري از صدور كالاهاي نامرغوب بمنظور فراهم نمودن امكانات رقابت با كالاهاي مشابه خارجي و حفظ بازارهاي بين المللي كنترل كيفي كالاهاي وارداتي مشمول استاندارد اجباري بمنظور حمايت از مصرف كنندگان و توليدكنندگان داخلي و جلوگيري از ورود كالاهاي نامرغوب خارجي راهنمائي علمي و فني توليدكنندگان، توزيع كنندگان و مصرف كنندگان – مطالعه و تحقيق درباره روشهاي توليد، نگهداري، بسته بندي و ترابري كالاهاي مختلف – ترويج سيستم متريك و كاليبراسيون وسايل سنجش – آزمايش و تطبيق نمونه كالاها با استانداردهاي مربوط، اعلام مشخصات و اظهارنظر مقايسه اي و صدور گواهينامه هاي لازم).
موسسه
استاندارد از اعضاء سازمان بين المللي استاندارد ميباشد و لذا در اجراي وظايف خود
هم از آخرين پيشرفتهاي علمي و فني و صنعتي جهان استفاده مينمايد و هم شرايط كلي و
نيازمنديهاي خاص كشور را مورد توجه قرار ميدهد.
اجراي
استانداردهاي ملي ايران بنفع تمام مردم و اقتصاد كشور است و باعث افزايش صادرات و
فروش داخلي و تأمين ايمني و بهداشت مصرف كنندگان و صرفه جوئي در وقت و هزينهها و
در نتيجه موجب افزايش درآمد ملي و رفاه عمومي و كاهش قيمتها ميشود.
كميسيون فني استاندارد كامپيوتر |
||
رئيس |
||
شركت نرمافزاري سينا |
دكتراي كامپيوتر |
صنعتي - محمد |
اعضاء |
||
شركت دادهپردازي ايران |
ليسانس مهندسي كامپيوتر |
ارسنجاني - علي |
شركت جنرال سيستمز |
ليسانس |
اشكان - حميدرضا |
مركز كامپيوتر شهرداري |
|
اشعريون - محسن |
شركت پارس الكتريك |
ليسانس مهندسي الكترونيك |
باقري - ابراهيم |
دفتر خدمات ماشيني وزارت فرهنگ و آموزش عالي |
ليسانس مهندسي كامپيوتر |
بنائي كاشاني - بهروز |
شوراي عالي انفورماتيك كشور و مركز تحقيقات مخابرات |
فوق ليسانس مهندسي كامپيوتر |
جابري پور - قاسم |
وزارت صنايع |
ليسانس كامپيوتر |
صناعي - رضا |
بانك ملت |
ليسانس |
كاتبي |
شركت ايران ارقام |
فوق ليسانس كامپيوتر |
كسرائي - عبدالله |
شركت دي پي اف ئي |
ليسانس ترجمه انگليسي |
مسرور - حسين |
شركت انفورماتيك |
فوق ليسانس مهندسي كامپيوتر و فوق ليسانس مهندسي الكتريك |
ميرزا عبداللهي - محمد |
بانك صنعت و معدن |
ليسانس آمار و كامپيوتر |
ميري - سيدمهدي |
دبير |
||
مؤسسه استاندارد و تحقيقات صنعتي ايران |
فوق ليسانس مهندسي سيستمها |
روحاني سراجي - علي |
فهرست مطالب
ويژگيهاي مجموعه نمادهاي كد شده
بسمه تعالي
پيشگفتار
استاندارد كد تبادل اطلاعات به زبان فارسي
كه به وسيله كميسيون فني استاندارد كامپيوتر تهيه و تدوين شده و در كميته ملي
استاندارد كامپيوتر مورخ 67/4/14 مورد تأييد قرار گرفته , اينك به
اسناد ماده يك قانون مواد الحاقي به قانون تأسيس مؤسسه استاندارد و تحقيقات صنعتي
ايران مصوب آذر ماه 1349
به عنوان استاندارد رسمي ايران منتشر ميگردد .
براي حفظ هماهنگي و همگامي با پيشرفتهاي
ملي و جهاني در زمينه صنايع و علوم , استانداردهاي ايران در مواقع لزوم مورد
تجديدنظر قرار خواهند گرفت و هرگونه پيشنهادي كه براي اصلاح يا تكميل اين
استانداردها برسد در هنگام تجديدنظر در كميسيون فني مربوط مورد توجه واقع خواهد شد
.
بنابراين براي مراجعه به استانداردهاي
ايران بايد همواره از آخرين چاپ و تجديدنظر آنها استفاده نمود .
در تهيه و تدوين اين استاندارد سعي شده
است كه ضمن توجه به شرايط موجود و نيازهاي جامعه حتي المقدور بين اين استاندارد و
استاندارد كشورهاي صنعتي و پيشرفته هماهنگي ايجاد شود .
لذا با بررسي امكانات و مهارتهاي موجود و
اجراي آزمايشهاي لازم اين استاندارد با استفاده از منابع زير تهيه گرديده است :
ISO 646
ISO 2002
مقدمه
تبادل اطلاعات در گسترش و پيشرفت دانش و
يافتههاي بشري نقش بسزائي ايفا نموده است . زبانهاي اقوام و ملل مختلف در طول
تاريخ ابتدا جهت رفع نيازهاي روزمره زندگي اجتماعي آنان ابداع و مورد استفاده قرار
گرفت . به دنبال آن پس از اختراع خط و امكان ثبت و تبادل اطلاعات نقش اساسي تبادل
اطلاعات در جوامع بشري حائز اهميت شد .
خط در هر زبان چيزي جز يك قرارداد "
تبادل اطلاعات " بين افرادي كه به آن زبان تكلم ميكنند نيست . در بعضي از
زبانهاي مورد استفاده بشر جوامع اوليه , شكل هر شيء علامتي بوده كه بيننده را به معني
آن هدايت مينمود و براي مفاهيم انتزاعي اشكال , قراردادي يا اعتباري مورد استفاده
قرار ميگرفت . در بعضي از زبانها مانند زبان چيني براي هر مفهوم , يك شكل مستقل (
كلمه ) در نظر ميگيرند در حاليكه در بسياري از زبانها براي نشان دادن اصوات بكار
رفته از " الفبا " كه به تنهائي معني و مفهوم خاصي ندارند استفاده شده
است ولي هر مفهوم به كمك يك يا چند علامت ( الفبا , ارقام و ديگر علائم ) كد
ميشود . اين روش كدگذاري بسيار دقيق بوده و همه از آن به يك صوت استفاده ميكنند
يا به عبارت ديگر " استاندارد " شده است . به عنوان مثال در الفباي زبان
فارسي " م " به عنوان كد اولين صداي كلمه " محبت " در نظر
گرفته شده كه ممكن است بسته به موقعيت آن در كلمه مورد استفاده يا در رسم الخطهاي
مختلف به اشكال گوناگوني ظاهر گردد وليكن آنچه ثابت و استاندارد است اختصاص حرف
بيست و هشتم از الفباي فارسي به صداي " مم "... ميباشد .
با پيشرفت تكنولوژي و به وجود آمدن
كامپيوتر , قلمرو تبادل اطلاعات كامپيوتري از نظر كاربرد همه ابعاد اداري , تجاري
, علمي , آموزشي , تحقيقاتي , خدماتي و ... را در بر گرفته است . اين ارتباطات ,
از اتصال دو دستگاه در يك دفتر كار توسط كابل تا ارتباطات راه دور ماهوارهاي را
شامل ميشود كه ميزان استفاده از آن شاخصي براي بهرهبرداري مؤثر از امكانات
كامپيوتري در يك جامعه بشر ميآيد .
ساختار سختافزاري كامپيوترها به نحوي است
كه فقط قادر به انجام اطلاعات بسيار ساده عددي ميباشند و هركاري كه توسط كامپيوتر
انجام ميشود نتيجه اجراي حجم زيادي از عمليات عددي ساده توسط سختافزار است . ضبط
اطلاعات در حافظه كامپيوتر نيز بايد به صورت عددي باشد تا سختافزار بتواند روي آن
اطلاعات عمل نمايد . لذا , كدهاي مورد استفاده در پردازنده و حافظه كامپيوتري عددي
ميباشد .
منظور از استاندارد نمودن مجموعه كد علائم
اين است كه همانگونه كه با ديدن اشكال مختلف حرف " سين " ( سـ , س ) در
اندازههاي مختلف يك صدا از آن تداعي ميگردد و يا با ديدن يكي از علائم
,"/" ":" و "-" با هر اندازه , رنگ و انحنائي مفهوم
عمل تقسيم درك ميشود , كامپيوترهاي گوناگون نيز به كمك دستگاههاي ورودي خود
بتوانند مثلا از دريافت نشانهاي از حرف " سين ," علامت تقسيم همگي يك
كد براي هر يك از مفاهيم موردنظر را در حافظه خود ذخيره نمايند . هرچند كه نحوه
ورود علائم به دستگاههاي ورودي هريك و يا دستگاههاي ورودي گوناگون يكي از آنها
كاملا متفاوت باشد . به همين ترتيب در مورد نمايش اطلاعات در دستگاههاي خروجي ,
همه آنها يك كد را از كامپيوتر خود دريافت نمايند وليكن احتمالا شكل نمايش آن كد
براي آنها تفاوت داشته باشد .
همانطور كه براي هر زبان و يا گروهي از زبانها
, الفبا و علائم ( مجموعه كد ) خاصي تعريف شده و در تبادل اطلاعات بكار ميرود
براي كامپيوتر نيز به منظور تبادل اطلاعات در محدوده يك زبان , يك مجموعه كد
استاندارد خاص آن زبان تعريف و تدوين ميگردد . با توجه به اين نكته براساس مقررات
سازمان جهاني استاندارد , (ISO) كه كد استاندارد
حاضر از آن تبعيت مينمايد , مجموعه كدهاي صفر تا يكصد و بيست و هفت براي
استانداردهاي تبادل اطلاعات محلي به منظور استفاده در محيطهاي كامپيوتري هفت بيتي
و نيز مجموعه كدهاي 128
تا 255
براي توسعه استاندارد تبادلات اطلاعات بين المللي ( به طوري كه شامل استاندارد
تبادل اطلاعات محلي نيز شود ) براي استفاده در محيطهاي كامپيوتري هشت بيتي و
كاربردهاي دو زبانه در نظر گرفته شدهاند .
بدين ترتيب آنچه كه در صفحات بعد ميآيد
شرح نحوه انطباق كدهاي صفر تا 127 و يا متناظرا 128 تا 255 بر مجموع علائم زبان
فارسي شامل حروف , ارقام و همچنين علائم نقطهگذاري , محاسباتي و كنترلي به همراه
توصيف و تشريح كامل مفهوم يكايك آنها خواهد بود . نمادهاي مورد استفاده در اين
استاندارد صرفأ به منظور تسهيل شناسائي مفهوم علائم مذكور بوده و جزئي از اين
استاندارد نميباشد . لذا استفاده از آنها اجباري نيست و براي هر محيط كامپيوتري و
دستگاه ورودي / خروجي مستقلا قابل تعريف خواهند بود وليكن استفاده از كدهاي تعيين
شده براي آنان اجباري است .
اهميت اين استاندارد براي ايجاد هماهنگي
از نظر تبادل اطلاعات زبان فارسي بين سيستمهاي مختلف كامپيوتري احتياج به تأكيد
ندارد . در مورد كاربردهاي كامپيوتري و لزوم وجود استاندارد مربوطه بررسي نقطه
نظرهاي زير حائز اهميت است . [1]
1- از نظر سازندگان كامپيوتر ,
براي حذف اطلاعات تكراري هنگام طرح سيستمهاي جديد و ارائه محصولات متنوع .
2- از نظر استفاده كنندگان : براي
حفظ سازگاري (compatibility) بين سيستمهاي مختلف
, آزادي بيشتر در انتخاب اجزاي مورد نياز هر سيستم و امكان اشتراك مساعي از طريق
استفاده از نتايج كار ديگران .
3- از نظر متخصصين كامپيوتر , براي
ايجاد يكنواختي در سيستمها و روشهاي استفاده از آنها , امكان استفاده از محصولات
پيش ساخته و عدم نياز به مطالعه خواص منحصر به فرد در هر سيستم جديد .
به طور كلي در هر زمينه , پيدايش
استانداردها به دنبال استفاده نسبي از كاربردهاي مختلف و ايجاد آگاهي كافي به
مسائل موجود و به منظور جلوگيري از هرج و مرج و اتلاف منافع و امكانات شروع ميشود
. در ايران نيز پس از پيروزي انقلاب اسلامي و جهش به سوي خود كفائي و استفاده هرچه
مؤثرتر از منابع و امكانات موجود و جلوگيري از دوبار كاريها , ضرورت تدوين چنين
استانداردهائي كاملا مشهود مينمايد .
منافع حاصل از تبعيت اينگونه استانداردها
به دو دسته قابل تقسيم هستند :
1- منافع ملي : نشان دادن رشد
تكنولوژي انفورماتيك و كاربردهاي آن در كشور , تقليل درجه وابستگي به سازندگان
سيستمهاي كامپيوتري خاص , و پايهگذاري صنايع داخلي انفورماتيك به طريق صحيح .
2- منافع اقتصادي : عدم نياز به
مطالعات تكراري و برنامه نويسي مجدد در طرح سيستمهاي جديد , جلب نظر سازندگان
داخلي و ايجاد انگيزه رقابت بين آنها , و امكان انتخاب با صرفهترين اجزاء در
سيستمهاي كامپيوتري .
اساسيترين استاندارد براي شروع كار در
اين زمينه مربوط به كد تبادل اطلاعات زبان فارسي است . استفاده از يك كد استاندارد
در كليه مواردي كه اطلاعات فارسي بين سيستمهاي مختلف رد و بدل ميشود به ما اين
امكان را خواهد داد كه بدون نياز به دانستن مشخصات سيستمهاي فرستنده و گيرنده
اطلاعات , بتوانيم اطلاعات ارسالي را به صورت واحدي تعبير نمائيم . ايجاد اين نوع
ارتباط بين سيستمهاي مختلف در حال حاضر توسط برنامههاي مترجم مخصوص صورت ميگيرد
. بديهي است كه با ازدياد روز افزون انواع سيستمهاي مختلف , اين نحوه عمل داراي
بازده بسيار كمي بوده و باعث اتلاف نيرو ميشود زيرا هر سيستم بايد برنامه مترجم
مخصوص كليه مواردي كه اطلاعات صرفأ در داخل يك سيستم ( كه نيازي به تبادل اطلاعات
با سيستمهاي ديگر ندارد ) رد و بدل ميشوند تبعيت از يك كد استاندارد لازم نيست
اگرچه استفاده از چنين كدي توسعه و ارتباطهاي بعدي را با سيستمهاي ديگر سادهتر
خواهد ساخت .
بايد توجه داشت كه وضع نمودن استانداردها
در تمام زمينهها با اشكالاتي روبرو ميشود كه از آن جمله ميتوان وجود سيستمهاي
غيراستاندارد و سرمايهگذاريهاي وسيع در ايجاد اين سيستمها و تكنلوژيهاي وابسته
به آنها را نام برد .
از آنجائي كه استاندارد تهيه شده ميبايد
براي مدت طولاني مورد استفاده قرار گيرد و از سوي ديگر تكنولوژي مربوطه يعني
كامپيوتر , نيز به سرعت در حال تغيير و تحول ميباشد , اهميت عدم وابستگي اين
استاندارد به تكنولوژي ( هاي ) خاص موجود آشكار ميگردد . با توجه به اين امر اصول
كلي كه در تدوين اين استاندارد مورد توجه قرار گرفته است به شرح زير ميباشد : [2]
1- كد استاندارد علائم بايد قابليت
انتقال اطلاعات را به طور صحيح دارا باشد . بدين ترتيب كه در انتقال اطلاعات از
نقطهاي به نقطه ديگر هيچگونه خدشهاي وارد نشود .
2- در تدوين كد استاندارد براي
تبادل اطلاعات اين اصل بايد مورد توجه قرار گيرد كه استقلال كامل آن از
تكنولوژيهاي ويژه و يا سيستمهاي كامپيوتري خاص حفظ گردد . گذري به تاريخ كوتاه
كامپيوتر و مشاهده تغيير سريع تكنولوژي آن در اين مدت كوتاه , اهميت اين اصل را
آشكار ميسازد . وابستگي استاندارد به تكنولوژي خاص نه تنها آن را با گذشت زمان
بياهميت ميكند , بلكه باعث عدم پذيرش عمومي آن توسط سازندگان و جامعه استفاده
كننده از كامپيوتر ميشود .
3- كد استاندارد بايد شامل
مجموعهاي كامل باشد . اين مجموعه بايد كليه علائم متداول در زبان فارسي را دارا
باشد به طوريكه كاربرد كد تبادل اطلاعات در متونهاي فارسي به آن گونه كه مرسوم است
, امكانپذير گردد .
4- در تدوين كد استاندارد بايد به
ترتيب قرار گرفتن علائم در جدول رمز , اهميت فوق العادهاي داده شود تا مرتب سازي
اطلاعات به سهولت انجامپذير باشد . حفظ ترتيب الفبائي علائم در جدول كدها يكي از
اصول ارزنده كد استاندارد ميباشد .
5- در تدوين كد استاندارد بايد
سهولت استفاده از آن در كاربردهاي نرمافزاري تا حد امكان مورد توجه قرار گيرد .
چند نمونه از اين موارد عبارتند از :
- حفظ تبادل يك به يك بين علائم و كد آنها
در جدول كدها .
- دستهبندي علائم بر حسب كاربرد آنها
مانند علائم الفبا , علائم عددي , علائم رياضي و غيره .
- ترتيب علائم در جدول كدها به نحوي كه
تشخيص علائم هم نوع , مانند ارقام , از ساير علائم به سهولت امكانپذير باشد .
الفباي زبان فارسي عمومأ داراي چهارگونه
" تنها ," " اول ," " وسط " و " آخر "
ميباشد . گونههاي مختلف حروف را ميتوان با استفاده از يك الگوريتم منتنج از
قواعد املائي به كمك حروف قبلي و بعدي تعيين كرد . بنابراين براي تبادل اطلاعات
احتياجي به گنجاندن گونههاي مختلف حروف در جدول كدها نيست . [2][3]
از سوي ديگر , استفاده از كد تك نمادي
براي مبادله اطلاعات متون فارسي خالي از اشكال نيست . به عبارت ديگر تنها با
استفاده از الگوريتم املائي نميتوان متون فارسي را كه با كد تك نمادي نمايش داده
شدهاند به صورت اصلي بازسازي كرد . براي مثال كلمات " صومعهسرا " و
" لك لك " را در نظر بگيريد . اين كلمات با استفاده از كد تك گونهاي به
صورت " ص و م ع ه س ر ا " و " ل ك ل ك " در ميآيند كه در
موقع نمايش در دستگاههاي خروجي با به كاربردن الگوريتم املائي به صورت "
مومعهسرا " و " لكلك " ظاهر ميشوند .
با توجه به ازدياد كلمات مركب در زبان
فارسي , اشكال فوق استفاده از كد تك گونهاي براي تبادل اطلاعات را غيرممكن
ميسازد . حل اين مشكل با استفاده از علامت فاصله , يا فاصله مجازي (Pseudo Space) براي جدا كردن اجزاء كلمه ممكن
نيست . اين راه حل نه تنها باعث ازدياد طول متن ميشود بلكه نظام الفبائي كلمات را
نيز بهم زده و كار مرتب سازي اطلاعات را دچار اشكال مينمايد .
براي حل اين مشكل بايد قادر باشيم در صورت
تمايل , در جاهائي كه حرفي امكان چسبيدن به حرف بعدي را دارد , آن حرف را جدا
بنويسيم . براي اين منظور كد دو گونهاي را در نظر ميگيريم . در اين كد براي هر
حرف از الفبا دو گونه اصلي و مبدله (Shift Code)
تعريف شده است . از كد مبدله فقط در مواقعي استفاده ميشود كه عمدا بخواهيم از
چسبيدن حرفي به حرف بعديش , برخلاف الگوريتم املائي , جلوگيري شود . بدين منظور در
دستگاههاي خروجي در هنگام برخورد با كد مبدله يك حرف , گونه مناسب آن ( آخر يا
تنها ) نمايش داده ميشود . اين راه حل تغييري در طول متون نميدهد .
همان طور كه نشان خواهيم داد با جاگذاري
مناسب كدهاي دو گونهاي در جدول كد , نظام الفبائي اطلاعات كاملا حفظ شده و با يك
عمل ساده , كد مبدله به كد اصلي آن تبديل ميشود كه كار مرتب سازي اطلاعات را دچار
هيچگونه اشكالي نخواهد كرد .
كد تبادل اطلاعات در زبان فارسي
هدف از تدوين اين استاندارد تعيين كد مشخص
شده براي مجموعه علائم زبان فارسي جهت ضبط و پردازش آن در كامپيوتر ( و يا هر
پردازنده ديگر ) و تبادل اطلاعات بين اين نوع پردازندهها ميباشد .
دامنه كاربرد اين استاندارد در دستگاههائي
خواهد بود كه قابليت ضبط , بازخواني و انتقال اطلاعات فارسي را داشته باشند مانند
:
- انواع كامپيوترها
- شبكههاي انتقال اطلاعات
- انواع دستگاههاي ورودي اطلاعات ( مانند
علامت خوان , كارت خوان , ديسك و نوار گردان , صفحه كليد , تجزيه صوت و غيره )
- انواع دستگاههاي خروجي اطلاعات ( مانند
چاپگر , صفحه نمايس ديسك گردان , نوار گردن و غيره )
اطلاعات به رمز درآمده جهت پنهان سازي
اطلاعات از اين استاندارد مستثني هستند .
3-1- داده 1:
مجموعهاي از يافتهها است كه امكان دارد
در ابتدا به صورت نامنظم باشد .
3-2- اطلاع 2:
حاوي بيان ارتباط بين اشيأ , امور و
پديدههاي جهان هستي است . هر پديده , رويداد , وضعيت و تغيير حالتي ميتواند توليد
اطلاع نمايد .
3-3- پردازش 3:
مجموعهاي از عمليات است كه روي دادها
انجام ميگيرد و آنها را تبديل به اطلاعات مفيد ميسازد .
3-4- مجموعه علائم زبان فارسي :
شامل حرف الفبا , ارقام دهدهي , نمادهاي
نقطهگذاري رياضي , جدول بندي , و نمادهاي كنترلي ميباشند .
مشخصههاي مربوط به عملكرد نمادهاي كنترلي
و بعضي از تعاريف اين قسمت به صورت كلي بيان شده است , كه براي كسب اطلاعات بيشتر
ميتوان به انتشارات ISO مراجعه كرد .
3-5- تركيب بيتي : 4:
مجموعه مرتب شدهاي از بيتها كه براي
نماياندن نمادها به كار ميرود .
3-6- نماد 5:
عضوي از مجموعه عناصر است كه براي
سازماندهي , كنترل يا نماياندن داده به كار ميرود .
3-7- مجموعه نمادهاي كد شده : كد : 6
مجموعهاي از قواعد مشخص است كه مجموعه
نمادها و رابطه يك به يك ميان هر نماد با تركيب بيتياش را بنا ميكند .
3-8- گسترش كد 7:
شيوهاي كه براي كدگذاري نمادهائي كه در
مجموعه نمادهاي كد شده معيني نيستند استفاده ميگردد .
3-9- جدول كدها 8:
جدولي كه نماد اختصاص يافته به هر تركيب
بيتي را نشان ميدهد .
3-10- نماد كنترل 9:
تابع كنترلي است كه نمايش كد شده آن از يك
تركيب بيتي منفرد تشكيل يافته باشد .
3-11- تابع كنترل 10:
عملي است كه بر ثبت پردازش , انتقال يا
تفسير داده تأثير ميگذارد و داراي نمايش كد شده مشتمل بر يك يا چند تركيب بيتي
ميباشد .
3-12- نماد ترسيمي 11:
نمادي , غير از تابع كنترلي است , كه
داراي يك نمايش عيني بوده و معمولا به صورت دست نوشته , چاپي يا تصويري ميباشد .
3-13- نهش 12:
قسمتي از جدول كدها كه به وسيله ستون و
رديف مربوطهاش مشخص ميگردد .
3-14- تقسيمبندي كلي نمادهاي كنترل :
نمادهاي عمومي كنترل به چهار قسم مشخص به
شرح زير تعريف ميگردند :
3-15-1- نمادهاي كنترل كننده انتقال 13
اين نمادها به منظور كنترل يا سهولت
انتقال اطلاعات در شبكههاي ارتباطي به كار ميروند كه عبارتند از :
ETB ,SYN ,NAK ,DLE ,ACK ,ENQ ,EOT ,ETX ,STX ,SOH
3-15-1-1- آغاز سرفصل 14:
يك نماد كنترل كننده انتقال است كه به
عنوان اولين نماد يك سر فصل حاوي پيام اطلاعاتي بكار ميرود .
3-15-1-2 آغاز متن 15:
يك نماد كنترل كننده انتقال است كه قبل از
يك متن ميآيد و براي ختم سر فصل بكار ميرود .
3-15-1-3- نماد پايان متن 16:
يك
نماد كنترل كننده انتقال است كه يك متن را خاتمه ميدهد
3-15-1-4- نماد پايان انتقال 17
يك
نماد كنترل كننده انتقال است كه براي مشخص كردن پايان انتقال يك يا چند متن بكار
ميرود .
3-15-1-5- نماد پرسش 18:
يك نماد كنترل كننده انتقال است كه بهنگام
درخواست پاسخ از يك ايستگاه راه دور بكار ميرود . پاسخ ممكن است شامل هويت و يا
وضعيت ايستگاه باشد . هنگامي كه بكارگيري تابع " شما كه هستيد " در شبكه
عمومي انتقال سويچي ضروري باشد اولين استفاده از ENQ
پس از برقراري ارتباط به منزله " شما كه هستيد " ( تعيين هويت ايستگاه )
تلقي ميگردد .
استفاده بعدي ENQ
ممكن است بر اساس توافق شامل " شما كه هستيد " باشد يا نباشد .
3-15-1-6- نماد تصديق 19:
يك نماد كنترل كننده انتقال است كه توسط
گيرنده به عنوان پاسخ مثبت فرستنده ارسال ميگردد .
3-15-1-7- نماد گيرنده ورودي 20:
يك نماد كنترل كننده انتقال است كه معني
تعداد محدودي از نمادهاي مجاور بعدي را عوض مينمايد . اين نماد به طور انحصاري
براي تأمين توابع تكميلي كنترل كننده انتقال بكار مي رود . تنها نمادهاي ترسيمي و
كنترل كننده انتقال ميتوانند در دنبالههاي DLE
مورد استفاده قرار گيرند .
3-15-1-8- نماد عدم تصديق 21:
يك نماد كنترل كننده انتقال است كه توسط گيرنده بمنزله
پاسخ منفي به فرستنده ارسال ميگردد .
3-15-1-9- نماد عاطل براي حفظ هماهنگي 22:
يك نماد كنترل كننده انتقال است كه توسط
سيستم انتقال دهنده از نوع هماهنگساز در نبود ساير نمادها ( در وضعيت بيكاري )
براي حفظ و تأمين نشانه هماهنگي بين سيستم و پايانه بكار ميرود .
3-15-1-10- نماد پايان انتقال تودهاي از
داده 23:
اين نماد پايان انتقال تودهاي از داده كه
به منظور انتقال به چنين تودههائي تقسيم شدهاند را مشخص مينمايد .
3-16- نمادهاي شكلبندي 24:
نمادهاي كنترلي فوق بيشتر به منظور كنترل
شكل و چگونگي قرار دادن اطلاعات بر روي چاپگر يا صفحه نمايش بكار ميروند . تعاريف
" نمادهاي شكل بندي " مربوط به دستگاه چاپگر , شامل دستگاه صفحه نمايش
نيز ميباشد كه ذيلا تنها به دستگاههاي چاپگر اشاره شده است .
نمادهاي شكل بندي از مفاهيم زير استفاده
ميكنند
- صفحه , كه از تعدادي از خطوط متشكل از نمادها
ساخته شده است .
- نمادهائي كه يك خط را تشكيل ميدهند
ميتوانند در نهشهائي كه " نهش نماد " ناميده ميشوند قرار گيرند .
- " نهش مولد " نهشي است كه در
صورت چاپ , نماد مربوطه در نهش آن ظاهر ميشود , نهشهاي مولد به صورت پيدرپي
ميگيرد .
" نمادهاي شكل بندي " عبارتند
از :
3-16-1- نماد برگشت به عقب 25:
يك نماد شكل بندي است كه موجب ميشود نهش
مولد به اندازه نهش يك نماد به عقب رانده شود .
3-16-2- نماد جدول بندي افقي 26:
يك نماد شكل بندي است كه موجب ميشود نهش
مولد به نهش نماد معين بعدي به جلو رانده شود .
3-16-3- نماد جدول بندي عمودي 27:
يك نماد شكلبندي است كه موجب ميشود نهش
مولد به نهش نماد متناظر در خط معين بعدي به جلو رانده شود .
3-16-4- نماد خط بعد 28:
يك نماد شكل بندي است كه موجب ميشود نهش
مولد به نهش نماد متناظر در خط بعدي به جلو رانده شود .
3-16-5- نماد فرم بعد 29:
يك نماد شكل بندي است كه موجب ميشود نهش
مولد به نهش نماد متناظر در خط معيني از فرم يا صفحه بعدي به جلو رانده شود .
3-16-6- نماد برگشت به سر خط 30:
يك نماد شكل بندي است كه موجب ميشود نهش
مولد به نهش اولين نماد در همان خط رانده شود .
3-17- نمادهاي كنترل گسترش كد عبارتند
از :
3-17-1- نماد انتقال از حالت اوليه به
ثانويه 31:
يك نماد كنترل كننده است كه به همراه IN - Shift و Escape براي گسترش مجموعه نمادهاي ترسيمي كد بكار ميرود .
اين نماد ممكن است معني تركيبات بيتي ستون 2 تا 7 ( به استثناي اولين عنصر ستون 2 و آخرين عنصر ستون 7) كد را تا رسيدن به
نماد IN - Shift
تغيير دهد .
اثرات اين نماد به هنگام استفاده از
تكنيكهاي گسترش كد در استاندارد 2022 ISO تشريح شده است .
3-17-2- نماد انتقال از حالت ثانويه به
اوليه 32:
يك نماد كنترل كننده است كه به همراه out
- Shift و Escape
براي گسترش مجموعه نمادهاي ترسيمي كد به كار ميرود . اين نماد ممكن است معاني
استاندارد تركيبات بيتي كه به دنبالش ميآيند را دوباره برقرار نمايد . تأثير اين
نماد بهنگام استفاده از تكنيكهاي گسترش كد در استاندارد 2022 ISO
شرح داده شده است .
3-17-3- نماد گريز 33:
يك نماد كنترل كننده است كه براي فراهم
آوردن نمادهاي اضافي بكار ميرود . اين نماد ممكن است معني تعداد محدودي از
تركيبات بيتي مجاور و به دنبال را عوض كند . استفاده از اين نماد در استاندارد 2024 ISO
مشخص شده است .
3-18- نمادهاي كنترل كننده دستگاه 34:
اين نمادها براي كنترل دستگاه ( يا
دستگاههاي ) فرعي محلي يا دور دست متصل به يك پردازشگر و يا سيستم ارتباط اطلاعاتي
راه دور مورد استفاده قرار ميگيرد . اين نمادها براي كنترل سيستمهاي ارتباطاتي
در نظر گرفته نشده است بلكه چنين عملي را ميتوان با استفاده از نمادهاي كنترل
كننده انتقال صورت داد .
3-18-1- نماد كنترل كننده دستگاه 1 35:
- يك نماد كنترل كننده دستگاه است كه در
اصل براي روشن نمودن و يا آغاز ساختن يك دستگاه فرعي در نظر گرفته شده است ,
چنانچه براي اين منظور موردنياز نباشد ممكن است براي برگرداندن دستگاه به حالت
اوليه عمليات (DC2 و DC3 را نيز ملاحظه فرمائيد ) يا براي هر يك از ساير
توابع كنترل كننده دستگاه كه توسط ديگر DC
ها فراهم نشده باشد مورد استفاده قرار ميگيرد .
3-18-2- نماد كنترل كننده دستگاه 2 36:
- يك نماد كنترل كننده دستگاه است كه در
اصل براي روشن نمودن و يا آغاز ساختن يك دستگاه فرعي در نظر گرفته شده است .
چنانچه براي اين منظور موردنياز نباشد ممكن است براي قرار دادن يك دستگاه در حالت
ويژه ( كه در اين حالت DC1 براي برگرداندن
دستگاه به حالت اوليه بكار ميرود ) يا براي هر يك از ساير توابع كنترل كننده
دستگاه كه توسط DC هاي ديگر فراهم نشده
باشد مورد استفاده قرار ميگيرد .
3-18-3- نماد كنترل كننده دستگاه 3 37:
- يك نماد كنترل كننده دستگاه است كه در
اصل براي خاموش نمودن يا ايستادن يك دستگاه فرعي در نظر گرفته شده است , اين عمل
ممكن است يك ايست تراز دوم باشد . به عنوان مثال صبر , مكث , گوش بزنگ , توقف ( كه
در اين حالت DC1 براي از سرگيري
عمليات عادي بكار ميرود .) چنانچه براي اين منظور موردنياز نباشد ممكن است براي
ساير توابع كنترل كننده دستگاههاي فرعي كه توسط ديگر DC
ها فراهم نشده باشد مورد استفاده قرار گيرد .
3-18-4- نماد كنترل كننده دستگاه 4 38:
يك نماد كنترل كننده دستگاه است كه در اصل
براي خاموش نمودن , ايستادن يا ايجاد وقفه در يك دستگاه فرعي در نظر گرفته شده است
. چنانچه براي اين منظور موردنياز نباشد ممكن است براي ساير توابع كنترل كننده
دستگاه كه توسط ساير DC ها فراهم نشدهاند
مورد استفاده قرار ميگيرند .
3-19- نمادهاي جدا كنند اطلاعات 39:
نمادهائي هستند كه براي جداسازي و تنظيم
منطقي اطلاعات بكار ميروند . اين نمادها بر چهار گونهاند كه ممكن است به دو
ترتيب سلسله مراتبي يا غير سلسله مراتبي مورد استفاده قرار گيرد . در طريق دوم
معاني خاص آنها به نوع كاربردشان بستگي دارد .
اگر به طريق سلسله مراتبي بكار برده شوند
ترتيب صعودي آنها از چپ به راست عبارتند از :
FS ,GS ,RS ,US
در اين حالت عمومأ اطلاعاتي كه به وسيله يك جدا كننده خاص مرز
بندي شده است نميتواند به وسيله يك جدا كننده با ترتيب بالاتر جدا شود اما
ميتواند بوسيله هر جدا كننده مرتبه بالاتري مرز بندي گردد .
3-19-1- نماد جدا كننده اطلاعات 1 40:
يك نماد كنترل كننده است كه براي جداسازي
و تنظيم منطقي اطلاعات بكار ميرود . معني ويژه آن ميبايد براي هر كاربردي تعريف
شود . همانگونه كه در شرح كلي نمادهاي جداكننده اطلاعات گفته شد اگر اين نماد به
صورت سلسله مراتبي بكار رود بخشي از داده به نام واحد (Unit)
را مرز بندي مينمايد .
3-19-2- نماد جدا كننده اطلاعات 2 41:
يك نماد كنترل كننده است كه براي جداسازي
و تنظيم منطقي اطلاعات بكار ميرود . معني ويژه آن ميبايد براي هر كاربردي تعريف
شود . همانگونه كه در شرح كلي نمادهاي جدا كننده اطلاعات گفته شد اگر اين نماد به
صورت سلسله مراتبي بكار رود بخشي از داده به نام ركورد (Record)
را مرز بندي ميكند .
3-19-3- نماد جدا كننده اطلاعات 3 42:
يك نماد كنترل است كه براي جداسازي و
تنظيم منطقي اطلاعات بكار ميرود . معني ويژه آن ميبايد براي هر كاربردي تعريف
شود . همانگونه كه در شرح كلي نمادهاي جداكننده اطلاعات گفته شد اگر اين نماد به
صورت سلسله مراتبي بكار رود بخشي از داده به نام گروه (Group)
را مرز بندي مينمايد .
3-19-4- نماد جداكننده اطلاعات 4 43:
يك نماد كنترل كننده است كه براي جداسازي
و تنظيم منطقي اطلاعات بكار ميرود . معني ويژه آن ميبايد براي هر كاربردي تعريف
شود . همانگونه كه در شرح كلي نمادهاي جداكننده اطلاعات گفته شد اگر اين نماد به
صورت سلسله مراتبي بكار رود بخشي از داده بنام پرونده (File)
را مرز بندي مينمايد .
3-20- ساير نمادهاي كنترل كننده :
اينها نمادهائي هستند كه خارج از طبقه
بنديها ذكر شده ( تعاريف 3-15-1 تا 3-19-4) قرار دارند و عبارتند از :
3-20-1- نماد زنگ 44:
يك نماد كنترل كننده است كه هنگامي بكار
ميرود كه نياز به جلب توجه باشد و ممكن است زنگ يا دستگاههاي آگاه كننده را
كنترل نمايد .
3-20-2- نماد تهي 45:
يك نماد كنترل كننده است كه براي پر كردن
فاصله زماني يا رسانهها بكار ميرود . نمادهاي NUL
ميتوانند بدون تأثير بر محتويات اطلاعاتي رشتهاي از دادهها در بين آن درج و يا
از آن خارج شود . هرچند كه چنين عملي ممكن است بر شكل و چهارچوب اطلاعات و يا نحوه
كنترل تجهيزات تأثير گذارد .
3-20-3- نماد ابطال 46:
يك نماد , يا اولين نماد از يك رشته است
كه مشخص ميكند داده قبلي اشتباه است . در نتيجه , اين داده ميبايد ناديده گرفته
شود .
معني خاص اين نماد ميبايد در هر كاربردي
و يا ميان فرستنده و دريافت كننده تعيين گردد .
3-20-4- نماد انتهاي واسطه 47:
يك نماد كنترل كننده است كه ممكن است جهت
تعيين و تشخيص پايان فيزيكي و يا پايان بخش استفاده شده از يك واسطه بكار رود .
اين نماد را ميتوان در انتهاي يك بخش خواسته شده از اطلاعات ضبط شده بر روي يك
واسطه نيز استفاده نمود . نهش اين نماد لزومأ بستگي به خاتمه فيزيكي واسطه ندارد .
3-20-5- نماد جانشين 48:
يك نماد كنترل كننده است كه بجاي نمادي كه
اشتباه است و يا بياعتبار تشخيص داده شده بكار ميرود . SUB
جهت معرفي توسط وسائل خودكار در نظر گرفته شده است .
3-20-6- نماد حذف 49:
يك نماد كنترل كننده است كه در اصل براي
حذف يا پاك كردن يك نماد اشتباهي يا ناخواسته در نوار سوراخ شده (Punched Tape) بكار ميرود . نماد DEL ممكن است براي پر كردن فاصله زماني يا رسانهها
استفاده گردد . اين نمادها ميتوانند بدون تأثير بر محتويات اطلاعاتي رشتهاي از
دادهها در بين آن درج و يا از آن خارج شود , هرچند كه چنين عملي ممكن است بر شكل
و چهار چوب اطلاعات و يا نحوه كنترل تجهيزات اثر گذارد .
3-21- نمادهاي ويژه كنترل كننده 50:
گاهي اوقات نمادهاي كنترل كننده توسط اسم
, تقسيمبندي شده و يك زيرنويس ( براي مثال SCT)
و در بعضي اوقات به وسيله نام خاص مشخص كننده آن ( براي مثال ENQ) نامگذاري ميشوند .
ممكن است معاني مختلف اما مربوط بهم به
بعضي از نمادهاي كنترل تعلق گيرد و معمولا تبادل اطلاعات مبتني بر اين موضوع بين
فرستنده و گيرنده توافق ميشود .
3-22- نماد فاصله 51:
يك نماد است كه در قبل و بعد از "
نهش مولد " هر نماد در همان خط بكار ميرود . به اين نماد يك نماد غيرقابل
چاپ و ترسيم نيز گفته ميشود .
4-
ويژگيهاي مجموعه نمادهاي كد شده
بيتهاي تركيبات بيتي محيط 7 بيتي كد عبارتند از :
b1
,b2 ,b3
,b4 ,b5
,b6 ,b7
b7
داراي بيشترين مرتبه و b1 داراي كمترين مرتبه
ميباشد . تركيبات بيت را ميتوان بدينگونه تفسير نمود كه اعداد صحيح در محدوده ده
صفر تا 127
در محيط دودوئي است كه به نسبت وزن هر كدام جداگانه به شكل جدول زير مشخص ميشوند
:
در استاندارد بين المللي تركيبات بيتي
بوسيله فرم y/x
معرفي ميشوند كه x از صفر تا 7 و y از صفر تا 15 ميتوانند مقدار بگيرند . ارتباط ما بين تركيبات
بيتي از b7 تا b1
و فرم y/x
بشرح زير است :
- x
عددي است كه بوسيله b7 ,b6 ,b5 معرفي ميگردد وقتي
كه اين بيتها داراي اوزان معيني داده شده به ترتيب 4 و 2 و 1 باشند .
- y
عددي است كه بوسيله b4 ,b3 ,b2 ,b1 معرفي ميگردد وقتي كه اين بيتها داراي اوزان معيني به ترتيب 8 و 4 و 2 و 1 باشند .
فرم Y/X با در نظر گرفتن X براي شماره ستون و Y براي شماره سطر نيز براي تشخيص نهش كدها در جدول كدهاي تبادل
اطلاعات زبان فارسي بكار ميرود .
تركيبات 128 بيت در محيط 7 بيتي كد , بوسيله
نمادهاي كنترل كننده و ترسيمي مشخص ميشوند . اختصاص نمادها به تركيبات بيتي
براساس اصول زير است :
- تركيبات بيت 0/0 تا 1/15 معرف 32 نماد كنترل كننده ميباشد .
- تركيب بيت 2/0 معرف نماد Space
است كه ميتواند هم يك نماد كنترل كننده و هم يك نماد ترسيمي تلقي گردد .
- تركيبات بيتي 2/1 تا 7/14 معرف حداكثر 94 نماد ترسيمي است كه
يا چند تركيب آن ميتواند بدون استفاده اعلام گردد .
ترتيب قرار گرفتن نمادها در تركيبات بيتي
محيط 7
بيتي در جدولهاي شماره 8
و 9
آمده است .
4-1- نمادهاي كنترل كننده :
نمادهاي كنترل كننده در محيط 7 بيتي عبارتند از :
4-1-1- نمادهاي كنترل كننده انتقال :
جدول شماره 2 فهرست , نام و محل كدهاي مربوط
به نمادهاي كنترل انتقال را مشخص مينمايد .
4-1-2- نمادهاي شكل بندي :
جدول شماره 3 فهرست , نام و محل كدهاي مربوط
به نمادهاي شكل بندي را مشخص مينمايد .
4-1-3- نمادهاي كنترل كننده گسترش كد :
نمادهاي
كنترل كننده گسترش در جدول شماره 4 معرفي شده اند .
4-1-4- نمادهاي كنترل كننده دستگاه :
نمادهاي
كنترل كننده دستگاه در جدول شماره 5 معرفي شده اند .
4-1-5- نمادهاي جداكننده اطلاعات :
نمادهاي جدا كننده اطلاعات در جدول شماره 6 معرفي شدهاند .
نامهاي ويژه اين نمادها هنگامي مورد
استفاده قرار ميگيرند كه به صورت سلسله مراتبي و به طريق زير به طور صعودي از چپ
به راست استقرار يابند :
FS ,GS ,RS ,US
اطلاعاتي كه به وسيله يك جدا كننده خاص جدا ميشود , نميتواند
بوسيله جدا كننده با مرتبه بالاتر ديگر جدا گردد اما ميتوان آن را جدا شده به
وسيله جدا كننده با مرتبه بالاتر تلقي نمود .
4-2- ساير نمادهاي كنترل كننده :
نمادهاي كنترل كننده خارج از بخشهاي فوق
در جدول شماره 7
معرفي شدهاند .
4-2-1- نماد فاصله 52:
حرف اختصاري نماد فاصله (Space) بصورت SP
ميباشد و در جدول در محل 2/0 قرار ميگيرد .
4-2-2- محل استقرار نمادهاي ترسيمي :
محل استقرار نمادهاي ترسيمي در جدول شماره
8
مشخص شده است .
مراجعات
الف - مقدمه :
1- اقتباس از مقدمه جزوه پيشنهادي
كد تبادل اطلاعات وزارت برنامه و بودجه سال 59
2- گزارش كامپيوتر - ارديبهشت 65 - مقاله 6 - دكتر محمد صنعتي
ب -
تعاريف اصطلاحات :
ايزو 646
|
1- Data
2- Information
3- Processing
4- Bit Combination
5- Character
6- Coded Character set ; coded
7- Code Extension
8- Code Table
9- Control Character
10- Control Function
11- Graphic Character
12- Position
13- TC - (Transimission Control
Characters )
14- SOH (START OF HEADING )
15- STX - (Start of Text )
16- ETX - ( End of Text )
17- EOT - (End of transmission )
18- ENQ - ( Enquiry )
19- ACK - ( Acknowledge )
20- DLE - ( Data Link Escape )
21- NAK - ( Negative Acknowledge
)
22- SYN - ( Synchronous Idle )
23- ETB - ( End of Transmission
Block )
24- FE - ( Format Effectors )
25- BS - ( Backspace )
26- HT - ( Horizontal tabulation
)
27- VT - ( Vertical Tabulation )
28- LF - ( Line Feed )
29- FF - ( Form Feed )
30- CR - ( Carriage Return )
31- SO - ( Shift - Out )
32- SI - ( Shift - In )
33- ESC - ( Escape )
34- DC - ( Device Control
Characters )
35- DC1
36- DC2
37- DC3
38- DC4
39- IS - ( Information
Separators )
40- IS 1 ( US : Unit Separator )
41- IS 2 ( RS : Record Separator )
42- IS 3 ( GS : Group Separator
)
43- IS 4 ( FS : File Separator )
44- BEL - (BELL)
45- NUL - (NULL)
46- CAN - (CANCEL)
47- EM - ( END OF MEDIUM )
48- SUB - ( SUBSTITUDE CHARACTER
)
49- DEL - ( DELETE )
50- SPECIFIC CONTROL CHARACTERS
51- SP - ( SPACE )
52- Space
ISLAMIC REPUBLIC OF IRAN |
|
Institute of Standards and Industrial Research of
Iran |
|
ISIRI NUMBER |
|
2900 |
|
|
|
IRANIAN STANDARD CODE FOR INFORMATION INTERCHANGE |
|
|
|
Second Edition |