تحلیل متن مقالات فارسی كتابدرای و اطلاع رسانی و امكان نمایه سازی ماشینی آنها بر اساس قانون زیف

نام نویسنده :بلندیان كاشی، صديقه
مقطع تحصیلی: کارشناسی ارشد
استاد راهنمای اول :داورپناه، محمد رضا
استاد مشاور اول :دیانی، محمدحسین
سال انتشار:  1385
تعداد صفحات 199 :
چکیده

پژوهش حاضر با استفاده از روش تحلیل محتوا به شناسایي الگوی حاکم بر توزیع واژگانی و بررسی بسامد واژگانی در مقالات فارسی کتابداری و اطلاع رسانی و امکان نمایه سازی ماشینی آنها بر اساس قانون زیف می پردازد. جامعه پژوهش شامل 27 عنوان مقاله در آخرین شماره منتشر شده سال 1383 در مجله های: فصلنامه کتاب، کتابداری و اطلاع رسانی آستان قدس رضوی و مجله کتابداری دانشگاه تهران می باشد. با روش نمونه گیری تصادفی ساده تعداد 10 عنوان مقاله حاوی بیش از 35000واژه به عنوان نمونه پژوهش انتخاب شدند. برای تفکیک واژگان از دو شیوه «صرفا ماشینی بدون دخالت عامل انسانی» مبتنی بر معیار ساختاری و « ماشینی با دخالت عامل انسانی» مبتنی بر معیار نشانه مند استفاده شده است. به منظور دستیابی به اطلاعات مورد نیاز با استفاده از بخش تحلیلگر متن در نرم افزار word واژگان تفکیک شده و جداول زیف برای مقالات تهیه شد. برای شناسایي الگوی توزیع واژگان و بررسی بسامد واژگانی از معادلات زیف و بوث و معادله (4) گافمن استفاده شده است. برای تشخیص وضعیت همخوانی بین واژه نمایه ها ، توصیفگرهای موضوعی و کلیدواژه های عنوانی از آزمون مجذور کای، آزمون F و آزمون تعقیبی شفه استفاده شد. نتایح حاصله نشان داد که توزیع فراوانی واژگان در متون فارسی دارای یک الگوی پیش بینی پذیر بوده و کاربرد واژه های با بسامد بالا و بسامد پایين در مقالات فارسی از قانون زیف تبعیت می کند. همچنین مشخص شد که بسامد واژگانی می تواند به عنوان معیاری برای نمایه سازی ماشینی متون فارسی در نظر گرفته شود. وضعیت همخوانی کامل بین واژ نمابه ها و وصیفگر های موضوعی در شیوه تفکیک «صرفا ماشینی بدون دخالت عامل انسانی» به صور متوسط در کل مقالات مورد بررسی به میزان 50/21% می باشد. در شیوه تفکیک «ماشینی با دخالت عامل انسانی» میزان همخوانی به 60/49% می رسد. وضعیت همخوانی کامل واژه نمایه ها با کلید واژه های عنوانی در شیوه «صرفا ماشینی بدون دخالت عامل انسانی» به طور متوسط در کل مقالات مورد بررسی 20/9%، که در شیوه «صرفا ماشینی بادخالت عامل انسانی» به طور متوسط بیشتر از 5 برابر شده و به 50/52% می رسد. براين اساس مشخص شد که میزان همخوانی بین نمایه سازی ذهنی (توصیفگر موضوعی) و نمایه سازی عینی (بسامد واژگانی) در شیوه تفکیک «صرفا ماشینی » و در شیوه تفکیک «صرفا ماشینی با دخالت عامل انسانی» متفاوت است.

فهرست منابع و مآخذ-فهرست مندرجات-نتيجه گيري

تمامی حقوق مطالب محفوظ است

2013-2020©