یاری فایل

مرجع دانلود فایل ,تحقیق , پروژه , پایان نامه , فایل فلش گوشی

یاری فایل

مرجع دانلود فایل ,تحقیق , پروژه , پایان نامه , فایل فلش گوشی

دانلود پروژه مشکلات خط فارسی

اختصاصی از یاری فایل دانلود پروژه مشکلات خط فارسی دانلود با لینک مستقیم و پر سرعت .

لینک دانلود و خرید پایین توضیحات

فرمت فایل word  و قابل ویرایش و پرینت

تعداد صفحات: 15

 

مشکلات خط فارسینقص‌هایی اساسی که برای زبان فارسی شمرده‌اند به شرح زیراست (راثی ساربانقلی، 1384):● عدم اعراب گذاری: به عنوان مثال کلمات (مَلَک، مِلک، مَلِک، مُلک) همه به یک شکل نوشته می شوند.● وجود چند علامت برای یک حرف: مانند (ز، ذ، ظ، ض)● استفاده از یک علامت برای چند حرف: مانند "و" که پنج مورد نوشتن دارد یکی برای بیان ضمه در کلمات "خوش" و "تو". دیگر بیان مصوت ممدود یا "واو ماقبل مضموم" مانند "شور" و "او". سوم بیان حرف صامت "واو" در کلماتی چون "آواز" و "والی" و "عفو" . چهارم بیان حرف مصوت مرکبی که در کلمات "نو" و "جوشن" و مانند آن‌هاست. پنجم حرفی که در زبان کنونی خوانده نمی‌شود مانند "واو معدوله" در کلمات "خواهر" و "خواستن" و "واو" در کلمه "عمرو"[27]● حرفهایی که در نوشتار حذف می شوند: مانند "الف" در کلمات "اسمعیل" و "الله"● نقطه گذاری: نقطه‌هایی متعدد در بالا و پائین حرف که هم سبب دشواری و هم موجب اشتباه در خواندن می‌شود. اهمیت بیش از حد نقطه درخط فارسی هنگام تشخیص نوری کاراکترها تولید اشکال اساسی می‌کند. به عنوان مثال کلمات زیر را در نظر بگیرید که با یک یا چند نقطه عوض می‌شوند (بُر، بَر، پُر، پَر، تَر، پُز، پَز، بُز، تِز).  - از راست به چپ نوشته شدن: برای این مورد دلایل مختلفی ذکر شده است از جمله عدم هماهنگی و ایجاد مشکل در نوشتن متون ریاضی و شیمی و نت‌های موسیقی و دستورات شطرنج و این‌ که خط تصویری یعنی علائم گرافیکی که در کل جهان استفاده می‌شود مانند علائم راهنمائی و رانندگی تماماً از چپ خوانده می‌شوند.● پیوسته نویسی و جدا نویسی: مانند تنوع استفاده از ‹می› چسبان و غیر چسبان و یا تنوع نحوه به کار بردن «علامت‌های جمع ‹ها، ان، جات› ، هم، هیچ، که، (ضمایر شخصی متصل مان، تان، شان)، شناسی، را، چه، چون، تر، ترین، بی (پیشوند نفی)، به، ای (نشانه ندا)، آن و این» در کلمات به صورت پیوسته و یا جدا گانه: (آنچه ، آن چه)؛ (همچنانکه، همچنان‌که) ؛ (جنابعالی، جناب‌عالی)؛ (هیچکس، هیچ‌کس)‏‎؛ (میتواند، می‌تواند)؛ (آن ها، آنها) در این مورد کلماتی که پیشوند و یا پسوند دارند نیز در شکل‌های مختلف نوشته می‌شوند. برخی از کلمات در دو شکل متصل‌نویسی و منفصل‌نویسی به دو شکل مختلف ظاهر می‌شوند، مانند «علاقمند و علاقه‌مند؛ اندیشمند و اندیشه‌مند». مصدرها و فعل‌های مرکب و اسم‌های مشتق از آنها نیز به دو صورت متصل و منفصل نوشته می‌شوند مانند «نگه‌داشتن و نگهداشتن». در جستجوی مطالب از اینترنت این مورد تولید اشکال می‌کند چنانکه جستجوی «هیچ‌کس» نتایج متفاوتی را با جستجوی «هیچکس» می‌آورد و یا جستجوی «کتاب‌شناسی» و «کتابشناسی» در موتور جستجوی گوگل نتایج متفاوتی را ارائه می‌کند. این گونه کلمات با این که در خواندن متن اشکال کمی به وجود می‌آورند و هر آشنای به زبان فارسی به راحتی می‌تواند آن را بخواند اما در فن‌آوری امروزه و تجزیه و تحلیل کلمات به کمک رایانه اشکال اساسی تولید می‌کند و شاید اگر قاعده‌ای جامع و مانع برای آن وضع گردد، بتوان گفت بزرگ‌ترین مشکل خط فارسی حل شده است. منظور این که، برای مثال خواندن سه کلمه «بی‌حوصلگی، بیحوصلگی، بی‌حوصله‌گی» مشکلی ایجاد نمی‌کند. اما در محیط الکترونیکی و شبکه اینترنت برای بازیابی این کلمه بایستی برای تمام اشکال این کلمه، جستجو را انجام دهیم، البته اگر آگاهی از تمام اشکال نوشتاری آن داشته باشیم. ● نوشته شدن حروف به اشکال متعدد: مثلاً نوشتن ک و گ (کـ گـ ک گ) در اشکال مختلف نیز باعث سردرگمی و عدم جستجوی صحیح می‌شود.●بوجود آمدن معنای متفاوت با اضافه کردن یک فاصله: مثل مادر ، ما در● تعداد سطرها در هر صفحه: سه کرسی مختلف برای حرف‌های مختلف الفبا باعث می شود که در مقایسه با اکثر زبان‌ها تعداد سطرهای هر صفحه به مراتب بیش‌تر گردد چون برخی حروف روی خط کرسی قرار می‌گیرند و برخی پائین خط کرسی و برخی بالای خط کرسی مثل (ا ب م )● پیوسته نویسی حروف: از آنجائیکه حروف در نوشتن غالباً به صورت چسبیده و پیوسته نوشته می‌شوند و این امر تشخیص حرف به حرف نوشته به وسیله رایانه را، دچار مشکل می‌کند.● عدد صفر در فارسی: در او. سی. آر. فارسی هم چنین اعداد نیز مشکل ساز هستند چنانچه صفر در فارسی یک نقطه کوچک است که می‌تواند رایانه را به اشتباه بیاندازد و نیز اعداد 1 و 2 و 3 بسیار شبیه هم هستند و تفاوت‌شان در یک دندانه کوچک است.● تنوع در رسم الخط: مانند ( اتاق و اطاق) و یا (امپراتور و امپراطور). و کلماتی که فقط یک شکل آنها صحیح می‌باشد ولی شکل ناصحیح آن نیز زیاد استفاده می‌شود مانند «ذغال و زغال؛ خوشنود و خشنود». البته این جدای از تنوع در مفهوم کلمات است که در دیگر زبان‌ها نیز وجود دارد، یعنی برای بعضی از مفاهیم ممکن است کلمات متنوعی استفاده بشود. مانند کامپیوتر و رایانه.● شکل های مختلف ضبط نام های بیگانه: واژه‌های بیگانه اغلب برای پر کردن خلاء واژه‌های علمی و یا ارتباطی سودمند هستند، اما وجود آن‌ها مسائلی از قبیل چگونگی ضبط آن‌ها در زبان قرض‌گیرنده را به‌ وجود می‌آورد. برای ضبط واژه‌های قرضی به سبب اختلاف فاحش نشانه‌های الفبای فارسی با نشانه‌های الفبای خارجی مشکلات جدی وجود دارد. از جمله این که الفبای فارسی آوانگار نیست و به همین جهت در ضبط دقیق تلفظ واژه‌های زبان فارسی نیز ناتوان است و این ناتوانی در ضبط واژه‌های بیگانه به مراتب بیش‌تر است و این که در مورد برگردان اسامی خارجی به خط فارسی قاعده خاصی وجود ندارد و هر کس بنا بر سلیقه و ذوق خود این کار را انجام می‌دهد که در نتیجه یک کلمه واحد به صورت‌های مختلف نوشته می‌شود. برای مثال (کلسیم، کلسیوم، کالسیوم) و یا اسم Franklin به صورت (فرانکلین، فرانکلن، فرنکلین، فرنکلن) ضبط شده است. خانم صدیق بهزادی این مشکلات را به سه دسته تقسیم کرده است: ” 1- نام‌هایی که در برگردان آن‌ها هم‌خوان‌ها ایجاد مشکل می‌کنند. 2 – نام‌هایی که در برگردان آن‌ها واکه‌های ساده مشکلاتی را به‌ وجود می‌آورند . 3 – و سوم نام‌هایی که در برگردان آن‌ها مشکل اصلی مربوط به واژه‌های مرکب است. (نقل در راثی ساربانقلی، 1384) ● انواع مختلف جمع بستن: به عنوان مثال جمع بستن یک واژه با علایم جمع فارسی وعلایم جمع عربی و نیز جمع بستن بی قاعده (جمع مکسر)، استفاده ازجمع جمع، مانند (معلم، معلمین، معلمان، معلم‌ها).● تنوین های زبان عربی: از جمله دشواری‌های رعایت اصل هم‌خوانی نوشتاری و گفتاری هستند.● وجود دندانه های متعدد: به خصوص در  او.سی.آر. فارسی ایجاد اشکال می‌کند مانند کلمات: نشستن و استشهاد.ابزارهای کاوش با واسط فارسیبرخی از ابزارهای کاوش با امکانات جستجوی فارسی عبارتند از: ایران کلیکIranclick، Open Directory، ایران‌هوIranhoo  ، ایران‌مهرIranMehre ، پارسیک Parseek ، گوگل Google. تنها موتور کاوش Google دارای برنامه روبات می باشد و قادر است صفحات فارسی را در قالب یونی کد[28] شناسایی و در پایگاه خود نمایه کند. Parseek نیز از آنجایی که از پایگاهGoogle استفاده می کند، یک موتور کاوش وابسته به پایگاه دیگر ابزارهای کاوش به حساب می آید.4 ابزارکاوش دیگرراهنمای موضوعی به شمارمی آیند و انسان فرایند شناسایی،بررسی و نمایه سازی سایتها یا صفحات وب رابرعهده دارد. (کوشا، 1382) اضافه کردن یک واسط هوشمند به موتورهای کاوش یا خزنده ها، کیفیت نتایج کاوش در وب های فارسی زبان را ارتقاء می دهد. این واسط در واقع نقش یک پردازشگر پرس وجو[29] را ایفاء می کند. (صدیقی؛ زمانی فر، 1385)

نتیجه گیرینقایص ومشکلات خط فارسی که اجمالاً ذکر شد، بازیابی اطلاعات توسط موتورهای جستجو را که در حال حاضر تنها موتور جستجوی Google امکان جستجو به زبان فارسی را دارد و سایر موتورهای کاوش مانند Parseek هم موتور کاوش Google  را برای جستجوی اطلاعات فارسی به کار می برند، دشوار می کند و همین نقایص، باعث عدم دسترسی کاربران به همۀ صفحات وب موجود به زبان فارسی می شود که این همان وب نامرئی است (صفحاتی در وب وجود دارد اما با موتور کاوش نمی توان آن را بازیابی کرد).طبق مطالعات انجام شده در این زمینه، به نظر می رسد که حجم وب نامرئی در زبان فارسی نسبت به حجم کل وب فارسی بیشتر از حجم کل وب نامرئی نسبت به حجم کل وب است. چرا که از میان صفحات وب فارسی، صفحات وب بسیاری وجود دارد که به دلایلی که قبلاً اشاره شد از جمله عدم وجود رسم الخط ثابت و نیز عدم رعایت آن توسط تولیدکننگان صفحات وب از دید کاربران پنهان می ماند. در این راستا آگاهی از وجود وب نامرئی توسط کتابداران، اولین و مهمترین گام است.  ساده و روشن بنویسیم

«آیا باید برای آن‌لاین-نویس دستورها و هنجارهای ویژه‌ای داشت؟» به این پرسش داریوش آشوری، نویسنده و زبان‌شناس پرآوازه‌ پاسخ می‌دهد.

دویچه وله: آقای آشوری، عنوان پروژه‌ی شما در قلمرو زبان، پروژه‌ی زبان باز است. اینترنت را برای باز شدن زبان فارسی یک فرصت می‌بینید، یا به خاطر آسیبهایی که به زبان می‌رساند، یک تهدید؟


دانلود با لینک مستقیم


دانلود پروژه مشکلات خط فارسی