Review
چكيده
در اين پژوهش كاربردي كه با استفاده از تحليل محتوا انجام شده است، كارايي دو رويكرد جستجوي موضوعي: زبان طبيعي و واژگان كنترل شده با استفاده از معيارهاي ربط، دقت، بازيافت و ريزش كاذب، در دو پايگاه كتابشناختي پيوسته (كتابخانه كنگره واريك) مقايسه شده است. سي عنوانمربوط به موضوعات كتابخانه، كتابداري و اطلاعرساني به صورت تصادفي انتخاب شدند. براي هر عنوان راهبردهاي جستجوي زبان طبيعي و كنترل شده به دست آمد. پس از انجام جستجوها و ارزيابي ربط پيشينههاي حاصل، دقت، بازيافت و ريزش كاذب در دو رويكرد مذكور با هم مقايسه گرديد.
نتايج نشان ميدهد بازيافت رويكرد جستجوي زبان طبيعي در هر دو پايگاه بيش از رويكرد موضوعي كنترل شده مي باشد. دقت رويكرد زبان طبيعي در پايگاه اريك بيش از كنترل شده ميباشد اما، در فهرست پيوسته كتابخانه كنگره تفاوتي معنادار مشاهده نشد. رويكرد زبان طبيعي در پايگاه اريك ريزش كاذب كمتري به همراه داشته است، در حالي كه در فهرست كتابخانه كنگره تفاوت معنادار نيست. پيشنهاد تحقيق حاضر اين است كه براي كسب نتايج جامع در جستجوهاي موضوعي در پايگاههاي كتابشناختي پيوسته، تركيبي از دو رويكرد زبان طبيعي و كنترل شده مورد استفاده قرار گيرد. براي انجام جستجوهايي كه جامعيت نتايج حاصل از آنها اهميت چنداني ندارد و هدف، به دست آوردن تعدادي پيشينه مربوط است، رويكرد زبان طبيعي مزيت بيشتري دارد.
كليدواژهها: جستجوي موضوعي، زبان طبيعي، واژگان كنترل شده.
مقدمه
پيشرفت و گسترش فناوري اطلاعات، به ايجاد نظامهاي اطلاعاتي پيچيده سرعت ميبخشد. در چنين نظامهايي بخش عمدهاي از جستجوهاي پيوسته را جستجوهاي موضوعي تشكيل ميدهند، اما بسياري از كاربران اين نظامها با وجود آشنايي پايه با فنون جستجو، از روشهاي مناسب براي جستجوي مؤثر اطلاعات مربوط مطلع نيستند. در واقع، اهميت دستيابي موضوعي، بيش از صد سال پيش وقتي كاتر[3] اهداف فهرست را بيان كرد، روشن شد. كاتر معتقد بود فهرست بايد به افراد براي يافتن كتابي كه موضوع آن مشخص است كمك كند و همچنين به استفادهكنندگان نشان دهد كه كتابخانه در مورد يك موضوع خاص، چه منابعي را در اختيار دارد ( هوفمن[4]، 2001).
در عصر الكترونيك نيز استفاده از جستجوي موضوعي براي بازيابي اطلاعات، رويكردي عمده تلقي ميشود. نظامهاي جستجو كه به كاربران اجازه ميدهند زبان طبيعي را براي جستجو به كار ببرند، هنوز نميتوانند به طور موفقيتآميز نيازهاي كاربران را برآورده سازند، در يكي از مؤسسههاي وابسته به OCLC، اعضاي هيئت علمي و مشاركتكنندگان به توافق جمعي رسيدند كه براي دسترسي به منابع الكترونيكي، به واژگان كنترل شده و ردهبندي نياز است (تيلور[5]،1381). از سوي ديگر، زمان آن رسيده است كه كتابخانهها نظامهاي بازيابي موضوعي خود را با دنياي اطلاعات رقمي سازگار سازند (مور[6] و كين[7] ، 1996).
مسئله پژوهش
يكي از مهمترين عملكردهاي هر كتابخانه و مركز اطلاع رساني، بر طرف كردن نيازهاي جامعه استفادهكننده با استفاده از يك نظام بازيابي كار آمد است. بازيابي اطلاعات، فرايندي است كه طي آن مجموعهاي از مدارك براي مشخص كردن مداركي كه با يك موضوع خاص مرتبطند، مورد جستجو قرار ميگيرد. بر اين اساس، براي ارزيابي نظام و بررسي كارايي بازيابي آن، كافي است روشهايي براي بررسي پاسخهاي ارائه شده به استفادهكننده ايجاد شود.
كارايي[8] ميزاني براي سنجش توانايي نظام با توجه به ربط مدارك بازيابي شده است براي سنجش كارايي نظام بازيابي، دو مفهوم دقت[9] و بازيافت[10] مورد توجه قرار ميگيرند. از سوي ديگر واژگان نقش مهمي در كارايي و توانايي يك نظام بازيابي اطلاعات بازي ميكند. اصطلاح جستجوي مورد استفاده در فرايند بازيابي، ممكن است از زبان طبيعي يا واژگان كنترل شده استخراج شده باشد. يكي از مهمترين مزاياي واژگان كنترل شده، توانايي آنها در ارائه اصطلاحات جستجوي متعارفي است كه فاقد ابهامند، اما اين روش نيازمند ايجاد و روزآمدسازي مداوم واژگان كنترل شده است. روزآمدسازي واژگان و انعطافپذيري در برابر تغييرات بويژه در موضوعات جديد كه به سرعت توسعه مييابند، از اهميت بيشتري برخوردار است.
استفاده از اصطلاحات زبان طبيعي كه به عنوان جايگزيني براي واژگان كنترل شده معرفي شده است، با نگرانيهاي عمدهاي در مورد ابهام و كارايي آن در فرايند بازيابي روبرو شده است. رفع ابهام از ابزارهاي جستجوي موضوعي و به كارگيري آنها در نظامهاي بازيابي پيوسته، دغدغه خاطر كتابداران و طراحان اين نظامهاست.
هدفها و سؤالهاي پژوهش
اين پژوهش با استفاده از معيارهاي ربط، دقت، بازيافت و ريزش كاذب، به ارزيابي و مقايسه كارايي زبان طبيعي و واژگان كنترل شده در بازيابي اطلاعات از پايگاههاي كتابشناختي پيوسته ميپردازد تا در پرتو اين بررسي كاربران و جستجوكنندگان اطلاعات و طراحان پايگاههاي اطلاعاتي، بتوانند روشهاي بهتري براي جستجوهاي موضوعي در پايگاهها به كار گيرند .براي نيل به اين هدف، پژوهش حاضر در صدد پاسخگويي به سؤالهاي زير است:
1. كدام رويكرد جستجوي موضوعي: كنترل شده ـ (سرعنوان موضوعي و اصطلاح نامه) يا زبان طبيعي ـ در جستجوي اطلاعات بازيافت بيشتري به همراه دارد؟
2. كدام رويكرد جستجوي موضوعي ـ كنترل شده (سرعنوان موضوعي و اصطلاح نامه) يا زبان طبيعي ـ در جستجوي اطلاعات دقت بيشتري به همراه دارد؟
3. كدام رويكرد جستجوي موضوعي ـ كنترل شده (سرعنوان موضوعي و اصطلاح نامه) يا زبان طبيعي ـ در جستجوي اطلاعات ريزش كاذب كمتري به همراه دارد؟
پيشينه پژوهش
تاريخچه زبان طبيعي در مقابل واژگان كنترل شده به سه دوره تقسيم ميشود. نخستين دوره در قرن نوزدهم با افزايش نمايهسازي با استفاده از اصطلاحات عناوين آغاز شد. دوره دوم، با اختراع رايانهها و نويدي كه با ارائه جستجوي متن آزاد در مقابل واژگان كنترل شده به همراه داشت به وجود آمد. در اين دوره، پژوهشهاي زيادي در زمينه مورد بحث صورت گرفت كه عمدهترين آنها تحقيقاتي بود كه در دهه 1960 در كرانفليد[11] انگلستان براي ارزيابي عملكردهاي زبانهاي نمايهسازي گوناگون در بازيابي اجرا شد.
در دوره سوم، از اواسط ده 1970 به بعد، روشهاي متفاوتي براي بررسي مسئله واژگان كنترل شده در برابر متن آزاد مورد توجه قرار گرفت (مودماله[12]، 1998).
چشمه سهرابي ( 1378) پاياننامه خود را تحت عنوان تأثير استفاده از اصطلاح نامه در بانكهاي اطلاعاتي كتاب شناختي بر ميزان جامعيت، مانعيت و مدت زمان جستجوي اطلاعات بازيابي شده انجام داده است. يافتههاي وي نشان مي دهد ميزان جامعيت در جستجوهاي اصطلاح نامهاي كاهش يافته اما زمان جستجو و ميزان مانعيت بيشتر شده است. بهمنآبادي (1380) در مقالهاي از طريق بررسي متون و تحقيقات صورت گرفته، به بحث در مورد كاربرد اصطلاح نامه در بازيابي اطلاعات پرداخته است. او در پايان نتيجه گرفته است كه، هرچند استفاده از اصطلاح نامههاي موجود ممكن است بر جامعيت جستجوها بيفزايد، اما در عين حال لازم است براي كمك به استفاده كنندگان در كشف مفاهيم مورد نياز و انجام كاوشهاي مؤثرتر، گونه خاصي از اصطلاح نامه تحت عنوان اصطلاح نامه بازيابي فراهم شود.
پيترز[13] و كورت[14] (1991) پژوهشي تحت عنوان «جستجوي موضوعي واژگان كنترل شده و كنترل نشده در فهرست پيوسته يك كتابخانه دانشگاهي» انجام دادهاند. نتايج اين پژوهش نشان ميدهد كه اغلب كاربران براي بازيابي اطلاعات مورد نياز خود جستجوي موضوعي كليد واژهاي را با جستجوي كنترل شده تركيب كردهاند. شاو[15] (1994) در پژوهش خود به توصيف روشهايي ميپردازد كه براي بررسي عملكرد بازيابي نمونههاي موضوعي كنترل شده و كنترل نشده در يكي از پايگاههاي مدلاين[16] به كار رفته است. او به اين نتيجه رسيد كه نمونههاي كنترلشده و كنترلنشده در همه سطوح بازيابي مورد انتظار عملكرد يكساني داشتهاند و تركيبي از نتايج بازيابي شده، از نتايج حاصل از هر كدام از نمونهها به تنهايي مفيدتر است. مود ماله [17](1998) پژوهشي با عنوان «زبان طبيعي در مقابل واژگان كنترل شده در بازيابي اطلاعات» انجام داده است. در اين پژوهش، كارايي ابزارهاي بازيابي اطلاعات (اصطلاح نامه و زبان طبيعي) مورد بررسي قرار گرفت و در نهايت محقق با توجه به عملكردهاي متفاوت دو روش فوق، تركيبي از آنها را براي انجام جستجوها پيشنهاد ميكند. بالارد[18] (1998) در مقالهاي گزارش ميكند كه اضافه كردن يك گزينه جستجوي كليدواژهاي در فيلد موضوع به فهرست كتابخانهاش، باعث كاهش 75درصدي ميزان عدم موفقيت در جستجوهاي موضوعي شده است. آرلانو[19] (1999) پژوهشي با عنوان «جستجوي موضوعي در فهرستهاي پيوسته شامل مواد اسپانيايي و انگليسي»" انجام داده است. نتايج اين پژوهش نشان ميدهد استفاده از زبان كنترل شده در جستجوهاي موضوعي فهرست، سودمندي بيشتري به همراه داشته است، با وجود آن كه استفاده از كلمات عنوان، شيوهاي است كه به زبان كاربران نزديكتر است.
توجه به اين پژوهشها نشان ميدهد تأثير رويكردهاي موضوعي در بازيابي از نظامهاي اطلاعاتي، مقولهاي است كه از ديدگاههاي گوناگون مورد بررسي قرار گرفته است. استفاده از اصطلاح نامههاي خاص،رفتارهاي اطلاعيابي،پايگاههاي دوزبانه و تلاش در جهت افزايش مزاياي يك رويكرد با استفاده از رويكردهاي ديگر، جنبههاي مختلف اين پژوهشها را نشان ميدهند.
روششناسي پژوهش
پژوهش حاضر كه تحقيقي كاربردي ـ توصيفي است، به گردآوري دادهها از طريق تحليل محتوا پرداخته است. براي استخراج موضوعاتي كه بتوان سه رويكرد جستجوي موضوعي با استفاده از زبان طبيعي، سرعنوان موضوعي يا اصطلاح نامه را در مورد آنها بررسي كرد از عناوين موجود در راهنماي موضوعي Books In Print 2000-2001 (BIP) استفاده شد. تعداد 30 عنوان[20] ذيل موضوعات مربوط به كتابخانه، كتابداري و اطلاعرساني به صورت تصادفي انتخاب شدند. سرعنوانهاي موضوعي مناسب اين عناوين از فهرست سرعنوانهاي موضوعي كتابخانه كنگره انتخاب شدند تا به عنوان راهبردهاي جستجوي كنترل شده در فهرست پيوسته كتابخانه كنگره به كار روند. اختصاص توصيفگرهاي اصطلاح نامه اريك به هر عنوان با استفاده از امكانات پايگاه پيوسته اريك و نظر متخصصان موضوعي صورت پذيرفت. براي مشخص كردن راهبردهاي جستجوي زبان طبيعي، از واژههاي موجود در عناوين و عملگرهاي بولي استفاده شد.
در مرحله دوم تحقيق، سرعنوانها، توصيفگرها و راهبردهاي زبان طبيعي به دست آمده، در پايگاه پيوسته كتاب شناختي اريك و فهرست پيوسته كتابخانه كنگره مورد جستجو قرار گرفتند. ده پيشينه اول حاصل از هرجستجوي موضوعي مورد بررسي قرار گرفت. اين بررسي شامل ارزيابي ربط موضوعي هر كدام از پيشينههاي بازيابي شده به عنوان مربوط به خود بود. با توجه به اين كه عناوين منتخب براي انجام جستجوهاي موضوعي در اين پژوهش بر اساس نياز واقعي كاربران پايگاهها نيستند. بنابراين، ارزيابي ربط پيشينههاي بازيابي شده بر اساس قضاوت متخصص موضوعي صورت پذيرفت. ربط تصوري نظري است كه از دو ديدگاه متفاوت عيني و ذهني مورد بررسي قرار ميگيرد.نگرش عيني، وضعيت خاصّ دانش استفادهكننده را مورد توجه قرار نميدهد.در نتيجه، در اين نگرش تأكيد عمده در واقع بر نظامهاي بازيابي اطلاعات است. پارك[21] عوامل مؤثر در قضاوتهاي ربط را در چند گروه خلاصه ميكند: ويژگيهاي فردي و دريافت و تصور استفادهكننده، شرايط خارجي و شرايط مسئله.از آنجا كه در اين پژوهش قضاوت ربط از ديدگاه عيني مورد توجه بوده و به وسيله متخصص موضوعي صورت گرفته است ،ويژگيهاي فردي و دريافت و تصور استفادهكنندهدر قضاوتهاي ربط مؤثر نبودهاند.براي ارزيابي شرايط خارجي، محصول نهايي براي هر موضوع منتخب يك پاياننامه تصور شده و هدف هر جستجو به دست آوردن اطلاعات جامع براي انجام كليه مراحل پژوهش تلقي شده است. همه نتايج حاصل از جستجوها دسترسپذير فرض شدهاند. در مورد شرايط مسئله همه مداركي كه به روشن شدن گستره موضوع منتخب،تعريف و درك و پيشينه آن، روشهاي بررسي مسئله، چارچوب و جنبههاي جديد و قابل توجه آن كمك كردهاند مربوط تلقي شده اند.
تجزيه وتحليل يافتهها
تجزيه و تحليل دادهها در اين پژوهش با استفاده از روشهاي آمار توصيفي و استنباطي با استفاده از نرمافزارSPSS صورت پذيرفت. براي مقايسه دقت و ريزش كاذب رويكردهاي موضوعي از آزمونt در دو گروه مستقل و براي مقايسه بازيافت رويكردهاي موضوعي مختلف، از آزمون «خي دو» براي دادههاي ناپارامتريك استفاده شد. جدول1، تعداد جستجوها و پيشينههاي بازيابي شده در دو پايگاه پيوسته كتاب شناختي اريك و فهرست پيوسته كتابخانه كنگره را نشان ميدهد.
جدول 1. تعداد جستجوها و پيشينه هاي بازيابي شده
پايگاه پيوسته كتابشناختي
|
رويكرد جستجوي موضوعي
|
تعداد جستجوها
|
تعداد پيشينه بازيابي شده
|
تعداد پيشينه بازيابي شده تا ده پيشينه اول
|
تعداد پيشينه مربوط
|
فهرست كتابخانه كنگره
|
زبان طبيعي
|
81
|
55615
|
513
|
190
|
كنترل شده
|
77
|
20249
|
600
|
193
|
پايگاه اريك
|
زبان طبيعي
|
81
|
432005
|
715
|
374
|
كنترل شده
|
54
|
313193
|
503
|
81
|
جمع
|
|
293
|
821062
|
2331
|
838
|
براي بررسي سؤال اول تحقيق كه هدف آن مقايسه بازيافت رويكردهاي جستجوي موضوعي كنترل شده با زبان طبيعي بود، از آزمون غيرپارامتريك «خي دو» استفاده گرديده است.
جدول 2.آزمون معناداري تفاوت بازيافت در دو رويكرد زبان طبيعي و كنترلشده
پايگاه پيوسته كتابشناختي
|
رويكرد جستجوي موضوعي
|
مشاهده شده
|
مورد انتظار
|
مجذور كاي
|
درجه آزادي
|
احتمال
|
فهرست كتابخانه كنگره
|
زبان طبيعي
|
55615
|
37932
|
79/16486
|
1
|
000/0
|
كنترل شده
|
20249
|
37932
|
پايگاه اريك
|
زبان طبيعي
|
432005
|
372599
|
5/9471
|
1
|
000/0
|
كنترل شده
|
313193
|
372599
|
با توجه به جدول2 و ميزان خي دو به دست آمده ميتوان ادعا نمود كه در فهرست كتابخانه كنگره ميزان بازيافت در رويكرد موضوعي زبان طبيعي بيش از رويكرد موضوعي كنترل شده ميباشد و تقريباً 7/2 برابر آن ميباشد.
در پايگاه اريك نيز بازيافت پيشينهها در رويكرد موضوعي زبان طبيعي بيش از رويكرد موضوعي كنترل شده ميباشد و اين تفاوت از نظر آماري معنادار است.
بنابراين، در پاسخ به سؤال اول پژوهش ميتوان گفت كه در هر دو پايگاه مورد بررسي بازيافت رويكرد زبان طبيعي بيش از رويكرد واژگان كنترل شده بوده و اين تفاوت از نظر آماري معنادار است.
سؤال دوم تحقيق، بررسي ميزان دقت در دو رويكرد زبان طبيعي و كنترل شده ميباشد. ميزان دقت بر اساس فرمول زير محاسبه گرديد:
100 × ) تعداد مدارك بازيابي شده تا 10 پيشينه اول/ تعداد مدارك مربوط) = دقت
براي بررسي اين سؤال از آزمون t استفاده گرديده است .
جدول 3. آزمون معناداري تفاوت ميانگين دقت در دو رويكرد كنترل شده و زبان طبيعي
پايگاه پيوسته كتابشناختي
|
رويكرد جستجوي موضوعي
|
ميانگين دقت (درصد)
|
SD
|
t-value
|
df
|
sig
|
فهرست كتابخانه كنگره
|
زبان طبيعي
|
9/41
|
1/28
|
22/0-
|
58
|
829/0
|
كنترل شده
|
2/40
|
75/31
|
پايگاه اريك
|
زبان طبيعي
|
4/50
|
8/26
|
02/6-
|
48
|
000/0
|
كنترل شده
|
7/15
|
45/16
|
دقت فهرست پيوسته كتابخانه كنگره در رويكرد زبان طبيعي و كنترل شده، تفاوتي معنادار با هم ندارند. بررسي ميزان دقت در دو رويكرد كنترل شده و زبان طبيعي در پايگاه اريك، نشان ميدهد كه دقت در رويكرد زبان طبيعي در اين پايگاه بيش از رويكرد كنترل شده ميباشد، به طوري كه ميانگين دقت در رويكرد زبان طبيعي در اين پايگاه 4/50% است در حالي كه اين ميانگين براي رويكرد كنترل شده 7/15% مي باشد كه تفاوتي در حدود 7/34% را نشان ميدهد. جدول3، اين نتايج را نشان ميدهد.
دقت در دادههاي حاصل از اين پژوهش، نتايج ديگري را نيز روشن ميكند. اگر سر عنوانهاي موضوعي موجود در پژوهش برحسب تعداد تقسيم فرعي آنها گروهبندي شده و تعداد پيشينههاي حاصل از هر گروه و دقت بازيابي آنها محاسبه شود، جدول4 به دست خواهد آمد.
جدول4. تعداد پيشينهها و دقت حاصل از سر عنوانهاي موضوعي با تقسيمهاي فرعي متفاوت
سرعنوانهاي موضوعي
|
تعداد سرعنوانها
|
تعداد پيشينههاي بازيابي شده
|
دقت
|
بدون تقسيم فرعي
|
28
|
280
|
17%
|
داراي يك تقسيم فرعي
|
24
|
222
|
34%
|
داراي دو تقسيم فرعي
|
20
|
73
|
77%
|
داراي سه تقسيم فرعي
|
5
|
18
|
78%
|
دادههاي اين جدول نشان ميدهد هرچه تعداد تقسيم فرعي سرعنوان موضوعي افزايش يافته، تعداد پيشينههاي بازيابي شده كاهش يافته و دقت بازيابي آنها افزايش پيدا كرده است.
سؤال سوم كه در حقيقت عكس سؤال دوم تحقيق است، بررسي ميزان ريزش كاذب در دو رويكرد زبان طبيعي و كنترل شده مي باشد . ريزش كاذب در فهرست پيوسته كتابخانه كنگره در رويكرد زبان طبيعي و كنترل شده تفاوتي معنادار با هم ندارد. بررسي ميزان ريزش كاذب در دو رويكرد كنترل شده و زبان طبيعي در پايگاه اريك، نشان ميدهد كه ريزش كاذب در رويكرد زبان طبيعي در اين پايگاه كمتر از رويكرد كنترل شده مي باشد.
بحث، نتيجهگيري و پيشنهاد
نتايج تحقيق و آزمونهاي انجام شده در پاسخ به سؤالهاي تحقيق نشان ميدهد دقت و بازيافت جستجوهاي موضوعي انجام شده با استفاده از رويكرد زبان طبيعي در مقايسه با رويكرد كنترل، در مجموع بهتر بوده است.
به نظر ميرسد كارايي بهتر رويكرد زبان طبيعي در جستجوي اطلاعات پيوسته، ناشي از سنخيت بيشتري است كه اين رويكرد با محيط شبكه و وب دارد. موتورهاي جستجوي پايگاههاي اطلاعاتي اغلب براساس ويژگيهايي عمل ميكنند كه با رويكرد زبان طبيعي هماهنگتر است. اين موتورها ارزيابيهاي ربط خود را براساس تحليلهاي كمّي از واژگان مدارك خود و راهبردهاي جستجوي كاربران انجام ميدهند و امكاني براي تحليل محتوي مدارك يا بررسي روابط معنايي موجود ميان واژگان جستجو ندارند.
از سوي ديگر شايد پيش از آن كه عملكرد بهتر رويكرد زبان طبيعي در اين پژوهش دليل مزيت اين رويكرد باشد ، بايد آن را ناشي از موانع موجود در استفاده از زبان كنترل شده تصور كرد. در رويكرد كنترل شده، وجود واژگان نمايهسازي كامل و روزآمد عنصري تعيين كننده در موفقيت نظام نمايهسازي است. اين نكته زماني روشنتر ميشود كه نتايج تحقيق در دو پايگاه اريك و فهرست پيوسته كتابخانه كنگره را مورد مقايسه قرار دهيم.
در فهرست پيوسته كتابخانه كنگره زبان نمايهسازي، فهرست سرعنوانهاي موضوعي كتابخانه كنگره است. اين فهرست به عنوان يك استاندارد ملي و تا حدي استاندارد بينالمللي مورد استفاده قرار ميگيرد. نتايج پژوهش در فهرست پيوسته كتابخانه كنگره نشان ميدهد از نظر دقت تفاوتي معنادار ميان دو رويكرد زبان طبيعي و كنترل شده در اين پايگاه وجود ندارد. در حالي كه در پايگاه اريك، اين تفاوت كاملاً معنادار است. در پايگاه اريك توصيفگرها از اصطلاح نامه اريك انتخاب ميشوند. در مرحله گردآوري دادهها براي اين پژوهش، اختصاص توصيفگرها با موانعي همراه بود كه به نظر ميرسد ناشي از نقص اصطلاح نامه اريك و روزآمد نبودن آن دست كم در حوزه موضوعي كتابخانه، كتابداري و اطلاعرساني بوده است. با توجه به مطالب ذكرشده، شايد بتوان اين طور نتيجهگيري كرد كه درصدي از تفاوت بسيار زياد موجود ميان نتايج دو رويكرد در پايگاه اريك، ناشي از نقص اصطلاح نامه اريك باشد.
از سوي ديگر، اگر مقايسه اي ميان كلمات عناوين مورد نظر و كلمات اصطلاحات كنترل شده اختصاص يافته به همان موضوعات صورت پذيرد، روشن ميشود كه كلمات عناوين درصد كمي از مفاهيم موجود در موضوعات را تحت پوشش قرار ميدهند كه اين خود ميتواند نشانهاي از عدم جامعيت نتايج جستجوهاي موضوعي با استفاده از رويكرد در زبان طبيعي باشد.
با توجه به همه نكات ذكر شده در اين قسمت ميتوان چنين نتيجهگيري كرد:
با وجود آن كه در جستجوهاي موضوعي با استفاده از رويكرد زبان طبيعي در مقايسه با رويكرد كنترل شده در اين پژوهش دقت و بازيافت بيشتر و ريزش كاذب كمتري حاصل شده است، نمي توان در مورد كارايي بهتر اين رويكرد نظر قطعي ارائه كرد. با توجه به اين كه تعيين تعداد پيشينههاي مربوط كه در پايگاههاي مورد نظر وجود داشته ولي بازيابي نشدهاند ممكن نيست، لذا تعيين دادههاي كمّي در مورد ميزان جامعيت پيشينههاي حاصل از دو رويكرد و مقايسه آنها با هم نيز مقدور نميباشد. بنابراين، نميتوان در مورد جامعيت نتايج حاصل از رويكرد زبان طبيعي بويژه با توجه به نكاتي كه در مورد نقص آنها نسبت به راهبردهاي كنترل شده ارائه شد مطمئن بود. از طرف ديگر، چنانكه گفته شد، احتمال دارد بخشي از اين برتري نسبي رويكرد زبان طبيعي نسبت به رويكرد كنترل شده ناشي از ايرادهاي وارد به زبان نمايهسازي پايگاه اريك باشد. بنابراين، پيشنهاد ميشود در انجام جستجوهاي موضوعي كامل در پايگاههاي پيوسته، تركيبي از دو رويكرد زبان طبيعي و كنترلشده براي به دست آوردن نتايج جامع استفاده شود. براي انجام جستجوهايي كه جامعيت نتايج حاصل از آنها اهميت چنداني ندارد و هدف به دست آوردن تعدادي پيشينه مربوط است، رويكرد زبان طبيعي از مزيت بيشتري برخوردار است. استفاده از واژگان كنترل شدة اخص تر در جستجو، سبب افزايش دقت بازيابي ميگردد.
بهتر است كاربران پايگاهها نيازهاي اطلاعاتي خود را در قالب عناوين روشن و كامل بيان كنند و مؤلفان، عناوين واضح و جامع براي مدارك خود بر گزينند. چنين عناويني، كارايي جستجوهاي موضوعي بويژه جستجوهايي را كه با استفاده از رويكرد زبان طبيعي صورت ميگيرد، افزايش ميدهند.
منابع
ـ بهمنآبادي، عليرضا (1380). «كاربرد اصطلاحنامه در بازيابي اطلاعات» فصلنامه كتاب، 12 (2 ): 77 .
ـ پائو، ميراندا لي(1378). مفاهيم بازيابي اطلاعات، ترجمه اسدالله آزاد و رحمتالله فتاحي. مشهد: دانشگاه فردوسي.
ـ تيلور، آرلين جي(1381). سازماندهي اطلاعات، ترجمه محمدحسين دياني. مشهد: كتابخانه رايانهاي.
ـ چشمه سهرابي، مظفر (1378). تأثير استفاده از اصطلاحنامه در بانكهاي اطلاعاتي كتابشناختي بر ميزان جامعيت، مانعيت و مدت زمان جستجوي اطلاعات بازيابيشده. پاياننامه كارشناسي ارشد، دانشگاه تربيت مدرس، دانشكده علوم.
ـ حريري، نجلا (1377). «مفهوم ربط در بازيابي از نظامهاي اطلاعاتي». فصلنامه كتاب، 9(2):7.
ـ زينس، كيم(1381). «راهبرد كاوش نظاممند بازيابي اطلاعات در عصر نظامهاي جهاني اطلاعات» ، ترجمه فاطمه مكيزاده. فصلنامه كتاب، 3 ( 2 ):155.
ـ شهبازي، رحيم (1378). «تجسس موضوعي در نظامهاي فهرست پيوسته»، فصلنامه اطلاعرساني، 16 (1و2): 38 .
ـ مور، كارول، جك كين (1996). « تكنولوژي نوين و رقمي كردن سرعنوانهاي موضوعي»، ترجمه سعيد اكبرينژاد. گزيدة مقالات ايفلا (چين:25ـ31 اوت 1996): 66.
ـ ويسمان، هرمان (1378). سيستمها، خدمات و مراكز اطلاعرساني، ترجمه جعفر مهراد. شيراز: نويد.
-Arellano, F. (1999). “Subject searching in online catalogs including Spanish and English material” Cataloging and-Classification Quarterly, 28 (2):45.
-Ballard, T. (1998). “Keyword / subject: finding a middle path; this hybrid search approach dramatically improves patron success" Information Today at http://www.findarticles.com (2003/12/29).
-Connell, Tschera Harkness ; Tipple ,Jennifer E. (1999) "Testing the accuracy of information on the WWW using the AltaVista search engine" Reference and User Services Quarterly,38(4):360.
-Hunter, R.N. (1991). “Success and failures of patrons searching the online catalog at a large academic library: a transaction log analysis” RQ, 30(3):395.
-Leighton, H. Vernon (1995) "Performance of four WWW index services: Infoseek, Lycos, Web Crawler and wwworm"http://www. winona.msus.edu/library/webind.htm/ (2005/10/5)
-Muddamalle, M.R. (1998). “Natural language versus controlled vocabulary in information retrieval: a case study in soil mechanics” Journal of American Society for Information Science, 49 (10):881.
-Peters, T.A., M. Kurth (1991). “Controlled and uncontrolled vocabulary subject searching in an academic library catalog” Information Technology and Libraries, 10(3): 201.
-Rudner, L.M. (2003). “How many people search ERIC database each day” Dlibmagazine, 9(4). http://www.dlib.org/dlib/ april03/rudner/04rudner.html.2003/ (2003/12/5).
-Shaw, W.M. (1994). “Retrieval expectations, cluster-based effectiveness, and performance standards in the CF database” Information Processing and Management, 30 (3):23.
-Subject Guide to Books In Print 2000-2001(2000). New York: Bowker .
-Williamson, N.J. (1996). “Standards and rules for subject access” Cataloging and Classification Standards and Rules, 21(314):155.
-Yee, Ingrid Hsieh (1998). “The retrieval power of selected search engines: How well do they address general reference questions and subject questions?” Reference Librarian, 60(27).
1. عضو هيأت علمي بخش علوم كتابداري و اطلاعرساني دانشگاه شيراز
2. كارشناس ارشد علوم كتابداري و اطلاعرساني