كندوكاو مسائل ريختشناسي زبان فارسي در بازيابي اطلاعات از جستوجوگرهاي وب
نام نویسنده: عبدالهي نورعلي, محمد صادق
استاد(ان) راهنما :دکتر عبدالرسول جوکار
استاد(ان) مشاور: دکتر جلال رحیمیان، دکتر نورالله محمدی
دانشکده و دانشگاه محل تحصیل: دانشکده علوم تربیتی و روانشناسی، دانشگاه شیراز
تاریخ دفاع (ماه و سال): 86/7/10
نشانی پست الکترونیکی:این آدرس ایمیل توسط spambots حفاظت می شود. برای دیدن شما نیاز به جاوا اسکریپت دارید
چکیده
اين پژوهش به بررسي مسايلي پرداختهاست كه جست وجوگرهاي فارسي در كاوشِ ريختهاي مختلفِ يك كلمه با آن روبرو هستند. براي پاسخگويي به سؤالات پژوهش از دو روش ِ پيماش مقايسهاي و اسنادي استفاده شدهاست. جامعهي پژوهش عبارت است از سه جست وجوگرِ بينالمللي گوگل، ياهو و آلتاويستاكهامکان جستوجو به زبان فارسی را فراهم کردهاند.
با مطالعه و دقّت در متون فارسي، سياههاي شامل 17 كليدواژه انتخاب شد كه هر كدام نمايانگرِ يك مورد از چالشهاي زبان فارسي در برخورد با فنّآوري نوين هستند. محقّق كليدواژه ها را وارد جعبه ي جست وجوي ابزارهاي كاوش انتخابي كرده و تعدادِ نتايجِ بازيابي شده براي هركدام از جست وجوگرها را ثبت كرد.
تجزيه و تحليل دادهها در دو سطح توصيفي و استنباطي انجام شد. نتايج نشان داد كه هيچكدام از جست وجوگرها، چالشهاي زبانشناختيِ زبانِ فارسي را در جهت بهبود كاوش، موردِ توجه قرار نداده اند. همچنين رابطه ي معناداري بين شكل كلمه و نوع ابزار جست وجو وجود دارد.
اين بررسي نشان داد دستورِ خطِّ فرهنگستان زبان و ادب فارسي، نه تنها كمكي به بهبود پردازش خودكارِ متون فارسي نميكند، بلکه در خيلي از موارد با استثناهايي كه بر قاعده ها روا داشته شده، بر ميزانِ ناهماهنگي هاي موجود افزوده است. با توجه به دستآوردهاي حاصل از پژوهش، الگويي براي ايجاد اصلاحات در شيوهي نگارش فارسي ارائه شد تا از اين طريق بتوان پردازش متون رايانهاي را تسهيل نمود.