كندوكاو مسائل ريخت‌شناسي زبان فارسي در بازيابي اطلاعات از جست‌وجوگرهاي وب

 

نام نویسنده: عبدالهي نورعلي, محمد صادق 

استاد(ان) راهنما :دکتر عبدالرسول جوکار

استاد(ان) مشاور: دکتر جلال رحیمیان، دکتر نورالله محمدی

 دانشکده و دانشگاه محل تحصیل: دانشکده علوم تربیتی و روانشناسی، دانشگاه شیراز

تاریخ دفاع (ماه و سال): 86/7/10

نشانی پست الکترونیکی:این آدرس ایمیل توسط spambots حفاظت می شود. برای دیدن شما نیاز به جاوا اسکریپت دارید

چکیده

 اين پژوهش به بررسي مسايلي پرداخته­است كه جست ­وجوگرهاي فارسي در كاوشِ ريخت­هاي مختلفِ يك كلمه با آن روبرو هستند. براي پاسخ­گويي به سؤالات پژوهش از دو روش ِ پيماش مقايسه­اي و اسنادي استفاده شده­است. جامعه‌ي پژوهش عبارت است از سه جست ­وجوگرِ بين‌المللي گوگل، ياهو و آلتاويستاكهامکان جست­وجو به زبان فارسی را فراهم کرده­اند.

  با مطالعه و دقّت در متون فارسي، سياهه­اي شامل 17 كليدواژه انتخاب شد كه هر كدام نمايانگرِ يك مورد از چالش­هاي زبان­ فارسي در برخورد با فنّ­آوري نوين هستند. محقّق كليدواژه ­ها را وارد جعبه ­ي جست ­وجوي ابزارهاي كاوش انتخابي كرده و تعدادِ نتايجِ بازيابي ­شده براي هركدام از جست ­وجوگرها را ثبت كرد. 

 تجزيه و تحليل داده­ها در دو سطح توصيفي و استنباطي انجام شد. نتايج نشان داد كه هيچ­كدام از جست ­وجوگرها، چالش­هاي زبان­شناختيِ زبانِ فارسي را در جهت بهبود كاوش، موردِ توجه قرار نداده ­اند. هم­چنين رابطه ­ي معناداري بين شكل كلمه و نوع ابزار جست ­وجو وجود دارد.

  اين بررسي نشان داد دستورِ خطِّ فرهنگستان زبان و ادب فارسي، نه تنها كمكي به بهبود پردازش خودكارِ متون فارسي نمي­­كند، بلکه در خيلي از موارد با استثناهايي كه بر قاعده ­ها روا داشته شده، بر ميزانِ ناهماهنگي ­هاي موجود افزوده ­است. با توجه به دست‌آوردهاي حاصل از پژوهش، الگويي براي ايجاد اصلاحات در شيوه­ي نگارش فارسي ارائه شد تا از اين طريق بتوان پردازش متون رايانه­اي را تسهيل نمود.

 

تمامی حقوق مطالب محفوظ است

2013-2020©