لینک دانلود و خرید پایین توضیحات
فرمت فایل word و قابل ویرایش و پرینت
تعداد صفحات: 15
مشکلات خط فارسینقصهایی اساسی که برای زبان فارسی شمردهاند به شرح زیراست (راثی ساربانقلی، 1384):● عدم اعراب گذاری: به عنوان مثال کلمات (مَلَک، مِلک، مَلِک، مُلک) همه به یک شکل نوشته می شوند.● وجود چند علامت برای یک حرف: مانند (ز، ذ، ظ، ض)● استفاده از یک علامت برای چند حرف: مانند "و" که پنج مورد نوشتن دارد یکی برای بیان ضمه در کلمات "خوش" و "تو". دیگر بیان مصوت ممدود یا "واو ماقبل مضموم" مانند "شور" و "او". سوم بیان حرف صامت "واو" در کلماتی چون "آواز" و "والی" و "عفو" . چهارم بیان حرف مصوت مرکبی که در کلمات "نو" و "جوشن" و مانند آنهاست. پنجم حرفی که در زبان کنونی خوانده نمیشود مانند "واو معدوله" در کلمات "خواهر" و "خواستن" و "واو" در کلمه "عمرو"[27]● حرفهایی که در نوشتار حذف می شوند: مانند "الف" در کلمات "اسمعیل" و "الله"● نقطه گذاری: نقطههایی متعدد در بالا و پائین حرف که هم سبب دشواری و هم موجب اشتباه در خواندن میشود. اهمیت بیش از حد نقطه درخط فارسی هنگام تشخیص نوری کاراکترها تولید اشکال اساسی میکند. به عنوان مثال کلمات زیر را در نظر بگیرید که با یک یا چند نقطه عوض میشوند (بُر، بَر، پُر، پَر، تَر، پُز، پَز، بُز، تِز). - از راست به چپ نوشته شدن: برای این مورد دلایل مختلفی ذکر شده است از جمله عدم هماهنگی و ایجاد مشکل در نوشتن متون ریاضی و شیمی و نتهای موسیقی و دستورات شطرنج و این که خط تصویری یعنی علائم گرافیکی که در کل جهان استفاده میشود مانند علائم راهنمائی و رانندگی تماماً از چپ خوانده میشوند.● پیوسته نویسی و جدا نویسی: مانند تنوع استفاده از ‹می› چسبان و غیر چسبان و یا تنوع نحوه به کار بردن «علامتهای جمع ‹ها، ان، جات› ، هم، هیچ، که، (ضمایر شخصی متصل مان، تان، شان)، شناسی، را، چه، چون، تر، ترین، بی (پیشوند نفی)، به، ای (نشانه ندا)، آن و این» در کلمات به صورت پیوسته و یا جدا گانه: (آنچه ، آن چه)؛ (همچنانکه، همچنانکه) ؛ (جنابعالی، جنابعالی)؛ (هیچکس، هیچکس)؛ (میتواند، میتواند)؛ (آن ها، آنها) در این مورد کلماتی که پیشوند و یا پسوند دارند نیز در شکلهای مختلف نوشته میشوند. برخی از کلمات در دو شکل متصلنویسی و منفصلنویسی به دو شکل مختلف ظاهر میشوند، مانند «علاقمند و علاقهمند؛ اندیشمند و اندیشهمند». مصدرها و فعلهای مرکب و اسمهای مشتق از آنها نیز به دو صورت متصل و منفصل نوشته میشوند مانند «نگهداشتن و نگهداشتن». در جستجوی مطالب از اینترنت این مورد تولید اشکال میکند چنانکه جستجوی «هیچکس» نتایج متفاوتی را با جستجوی «هیچکس» میآورد و یا جستجوی «کتابشناسی» و «کتابشناسی» در موتور جستجوی گوگل نتایج متفاوتی را ارائه میکند. این گونه کلمات با این که در خواندن متن اشکال کمی به وجود میآورند و هر آشنای به زبان فارسی به راحتی میتواند آن را بخواند اما در فنآوری امروزه و تجزیه و تحلیل کلمات به کمک رایانه اشکال اساسی تولید میکند و شاید اگر قاعدهای جامع و مانع برای آن وضع گردد، بتوان گفت بزرگترین مشکل خط فارسی حل شده است. منظور این که، برای مثال خواندن سه کلمه «بیحوصلگی، بیحوصلگی، بیحوصلهگی» مشکلی ایجاد نمیکند. اما در محیط الکترونیکی و شبکه اینترنت برای بازیابی این کلمه بایستی برای تمام اشکال این کلمه، جستجو را انجام دهیم، البته اگر آگاهی از تمام اشکال نوشتاری آن داشته باشیم. ● نوشته شدن حروف به اشکال متعدد: مثلاً نوشتن ک و گ (کـ گـ ک گ) در اشکال مختلف نیز باعث سردرگمی و عدم جستجوی صحیح میشود.●بوجود آمدن معنای متفاوت با اضافه کردن یک فاصله: مثل مادر ، ما در● تعداد سطرها در هر صفحه: سه کرسی مختلف برای حرفهای مختلف الفبا باعث می شود که در مقایسه با اکثر زبانها تعداد سطرهای هر صفحه به مراتب بیشتر گردد چون برخی حروف روی خط کرسی قرار میگیرند و برخی پائین خط کرسی و برخی بالای خط کرسی مثل (ا ب م )● پیوسته نویسی حروف: از آنجائیکه حروف در نوشتن غالباً به صورت چسبیده و پیوسته نوشته میشوند و این امر تشخیص حرف به حرف نوشته به وسیله رایانه را، دچار مشکل میکند.● عدد صفر در فارسی: در او. سی. آر. فارسی هم چنین اعداد نیز مشکل ساز هستند چنانچه صفر در فارسی یک نقطه کوچک است که میتواند رایانه را به اشتباه بیاندازد و نیز اعداد 1 و 2 و 3 بسیار شبیه هم هستند و تفاوتشان در یک دندانه کوچک است.● تنوع در رسم الخط: مانند ( اتاق و اطاق) و یا (امپراتور و امپراطور). و کلماتی که فقط یک شکل آنها صحیح میباشد ولی شکل ناصحیح آن نیز زیاد استفاده میشود مانند «ذغال و زغال؛ خوشنود و خشنود». البته این جدای از تنوع در مفهوم کلمات است که در دیگر زبانها نیز وجود دارد، یعنی برای بعضی از مفاهیم ممکن است کلمات متنوعی استفاده بشود. مانند کامپیوتر و رایانه.● شکل های مختلف ضبط نام های بیگانه: واژههای بیگانه اغلب برای پر کردن خلاء واژههای علمی و یا ارتباطی سودمند هستند، اما وجود آنها مسائلی از قبیل چگونگی ضبط آنها در زبان قرضگیرنده را به وجود میآورد. برای ضبط واژههای قرضی به سبب اختلاف فاحش نشانههای الفبای فارسی با نشانههای الفبای خارجی مشکلات جدی وجود دارد. از جمله این که الفبای فارسی آوانگار نیست و به همین جهت در ضبط دقیق تلفظ واژههای زبان فارسی نیز ناتوان است و این ناتوانی در ضبط واژههای بیگانه به مراتب بیشتر است و این که در مورد برگردان اسامی خارجی به خط فارسی قاعده خاصی وجود ندارد و هر کس بنا بر سلیقه و ذوق خود این کار را انجام میدهد که در نتیجه یک کلمه واحد به صورتهای مختلف نوشته میشود. برای مثال (کلسیم، کلسیوم، کالسیوم) و یا اسم Franklin به صورت (فرانکلین، فرانکلن، فرنکلین، فرنکلن) ضبط شده است. خانم صدیق بهزادی این مشکلات را به سه دسته تقسیم کرده است: ” 1- نامهایی که در برگردان آنها همخوانها ایجاد مشکل میکنند. 2 – نامهایی که در برگردان آنها واکههای ساده مشکلاتی را به وجود میآورند . 3 – و سوم نامهایی که در برگردان آنها مشکل اصلی مربوط به واژههای مرکب است. (نقل در راثی ساربانقلی، 1384) ● انواع مختلف جمع بستن: به عنوان مثال جمع بستن یک واژه با علایم جمع فارسی وعلایم جمع عربی و نیز جمع بستن بی قاعده (جمع مکسر)، استفاده ازجمع جمع، مانند (معلم، معلمین، معلمان، معلمها).● تنوین های زبان عربی: از جمله دشواریهای رعایت اصل همخوانی نوشتاری و گفتاری هستند.● وجود دندانه های متعدد: به خصوص در او.سی.آر. فارسی ایجاد اشکال میکند مانند کلمات: نشستن و استشهاد.ابزارهای کاوش با واسط فارسیبرخی از ابزارهای کاوش با امکانات جستجوی فارسی عبارتند از: ایران کلیکIranclick، Open Directory، ایرانهوIranhoo ، ایرانمهرIranMehre ، پارسیک Parseek ، گوگل Google. تنها موتور کاوش Google دارای برنامه روبات می باشد و قادر است صفحات فارسی را در قالب یونی کد[28] شناسایی و در پایگاه خود نمایه کند. Parseek نیز از آنجایی که از پایگاهGoogle استفاده می کند، یک موتور کاوش وابسته به پایگاه دیگر ابزارهای کاوش به حساب می آید.4 ابزارکاوش دیگرراهنمای موضوعی به شمارمی آیند و انسان فرایند شناسایی،بررسی و نمایه سازی سایتها یا صفحات وب رابرعهده دارد. (کوشا، 1382) اضافه کردن یک واسط هوشمند به موتورهای کاوش یا خزنده ها، کیفیت نتایج کاوش در وب های فارسی زبان را ارتقاء می دهد. این واسط در واقع نقش یک پردازشگر پرس وجو[29] را ایفاء می کند. (صدیقی؛ زمانی فر، 1385)
نتیجه گیرینقایص ومشکلات خط فارسی که اجمالاً ذکر شد، بازیابی اطلاعات توسط موتورهای جستجو را که در حال حاضر تنها موتور جستجوی Google امکان جستجو به زبان فارسی را دارد و سایر موتورهای کاوش مانند Parseek هم موتور کاوش Google را برای جستجوی اطلاعات فارسی به کار می برند، دشوار می کند و همین نقایص، باعث عدم دسترسی کاربران به همۀ صفحات وب موجود به زبان فارسی می شود که این همان وب نامرئی است (صفحاتی در وب وجود دارد اما با موتور کاوش نمی توان آن را بازیابی کرد).طبق مطالعات انجام شده در این زمینه، به نظر می رسد که حجم وب نامرئی در زبان فارسی نسبت به حجم کل وب فارسی بیشتر از حجم کل وب نامرئی نسبت به حجم کل وب است. چرا که از میان صفحات وب فارسی، صفحات وب بسیاری وجود دارد که به دلایلی که قبلاً اشاره شد از جمله عدم وجود رسم الخط ثابت و نیز عدم رعایت آن توسط تولیدکننگان صفحات وب از دید کاربران پنهان می ماند. در این راستا آگاهی از وجود وب نامرئی توسط کتابداران، اولین و مهمترین گام است. ساده و روشن بنویسیم
«آیا باید برای آنلاین-نویس دستورها و هنجارهای ویژهای داشت؟» به این پرسش داریوش آشوری، نویسنده و زبانشناس پرآوازه پاسخ میدهد.
دویچه وله: آقای آشوری، عنوان پروژهی شما در قلمرو زبان، پروژهی زبان باز است. اینترنت را برای باز شدن زبان فارسی یک فرصت میبینید، یا به خاطر آسیبهایی که به زبان میرساند، یک تهدید؟
دانلود پروژه مشکلات خط فارسی