نوع مقاله : مقاله پژوهشی
نویسندگان
1 دانشجوی کارشناسی ارشد علوم کتابداری و اطلاع رسانی پزشکی، دانشگاه علوم پزشکی ایران
2 عضو هیئت علمی مرکز اطلاعات و مدارک علمی وزارت جهاد کشاورزی
چکیده
کلیدواژهها
مقدمه
رشد و گسترش اینترنت، روشهای دستیابی به اطلاعات را دگرگون کرده و برای ایجاد سهولت و تسریع در مکانیابی اطلاعات، امکانات بسیاری در وب ایجاد شده است. پایگاههای اطلاعاتی که به نمایهسازی مقالههای مجلهها میپردازند، یکی از این ابزارها میباشند.
با توجه به اینکه هزینههای جستجو زیاد بوده و زمان قابل توجهی برای جستجوی اطلاعات در پایگاهها توسط کاربران صرف میشود، مهم است که بدانیم کدام پایگاهها بیش از همه مؤثرند. در حال حاضر، برای ارزیابی ابزارهای جستجوی اینترنت، معیارهای جدیدی ایجاد شده و مورد استفاده قرار میگیرد. یکی از این معیارها، ربط[1] میباشد که برای ارزیابی نظامهای بازیابی اطلاعات و کارایی جستجوهای انجام شده، بهکار میرود و به وسیلة دو ملاک جامعیت[2] و مانعیت[3] سنجیده میشود (شاکری، 1387).
مانعیت، صحّت یک جستجو را میسنجد. جستجو در صورتی به مانعیت کامل دست مییابد که هر پیشینه بازیابی شده در رابطه با یک پرسش، لزوماً به آن پرسش مربوط باشد و جامعیت مقیاسی از اثربخشی در بازیابی کلیة اطلاعات جستجو شده در یک پایگاه اطلاعاتی است. هنگامی جامعیت کامل محقق میشود که هر پیشینة منفرد که باید در رابطه با یک پرسش خاص یافت شود، حتماً ردیابی گردد (احمدی، 1385). به عبارت دیگر، جامعیت توانایی نظام در بازیابی کلیه مدارک مرتبط و مانعیت توانایی نظام در عدم بازیابی مدارک غیرمرتبط میباشد.
محاسبه مانعیت از طریق تقسیم تعداد مدارک مرتبط بازیابی شده به کل مدارک بازیابی شده در نتایج جستجو میسر است، اما برای محاسبة جامعیت باید علاوه بر تعداد مدارک مرتبط بازیابی شده، تعداد کل مدارک مرتبط موجود در پایگاه هم در دسترس باشد که حاصل آن از تقسیم تعداد مدارک مرتبط بازیابی شده به کل مدارک مرتبط موجود در پایگاه، بهدست میآید.
حجم مقالههای منتشرشده در حوزه علوم پزشکی نیز همچون حوزههای دیگر افزایش قابل توجهی یافته است و به نظر میرسد ارزیابی کارایی پایگاههایی که به نمایهسازی مجلههای این حوزه میپردازند، ضروری است. طی بررسیهای اولیه مشخص شد جستجو و بازیابی مقالههای فارسی در حوزه علوم پزشکی از طریق پایگاههای مگ ایران[4]، ایران مدکس[5] و پایگاه اطلاعات علمی جهاد دانشگاهی[6] ممکن است و از آنجا که جامعیت و مانعیت به عنوان دو معیار مهم برای ارزیابی نظامهای بازیابی اطلاعات بهکار میروند، این پژوهش به بررسی جامعیت نسبی سه پایگاه اطلاعاتی فوق در حوزة دندانپزشکی میپردازد.
اهمیت پژوهش
برای دسترسی به نتایج دقیقتر، کاربران باید با مزایای هر یک از پایگاههای اطلاعاتی آشنا شوند تا پایگاه مناسب را بدون اتلاف وقت، برای جستجو انتخاب کنند. نتیجة این پژوهش به متخصصان و دانشجویان حوزة دندانپزشکی کمک خواهد کرد تا پایگاهی را که برای بازیابی مقالههای فارسی در حوزه تخصصی آنها جامعیت بالاتری دارد، شناسایی کنند.
پیشینة پژوهش
«چشمه سهرابی» (1378) طی پژوهشی تأثیر استفاده از اصطلاحنامه را بر میزان جامعیت، مانعیت و مدت زمان جستجو در بانکهای اطلاعاتی کتابشناختی، بررسی کرده است. 7 بانک اطلاعاتی در 6 گروه علومانسانی، علومپزشکی، علومپایه، کشاورزی، فنی و مهندسی و هنر برای انجام پژوهش در نظر گرفته شد و در هر بانک اطلاعاتی، 10 کلیدواژه به طور تصادفی و با کمک متخصصان انتخاب گردید. هر کلیدواژه، یکبار از طریق اصطلاحنامه و بار دیگر با استفاده از زبان طبیعی، مورد کاوش قرار گرفت. میزان جامعیت، مانعیت و مدت زمان جستجوی اطلاعات بازیابیشده از طریق اصطلاحنامه و زبان طبیعی اندازهگیری شد. یافتههای پژوهش نشان میدهد: نخست، میزان جامعیت نتایج بازیابی در بانکهای اطلاعاتی به هنگام استفاده از اصطلاحنامه 39/24% و به هنگام استفاده از زبان طبیعی 56/89% میباشد. بنابراین، استفاده از اصطلاحنامه باعث کاهش جامعیت میشود. دوم، میزان مانعیت نتایج بازیابی در بانکهای اطلاعاتی به هنگام استفاده از اصطلاحنامه 75/06% و به هنگام استفاده از زبان طبیعی 58/46% است. با وجود این، استفاده از اصطلاحنامه موجب افزایش میزان مانعیت جستجوها میشود. سوم، میانگین مدت زمان جستجوی نتایج بازیابی شده در بانکهای اطلاعاتی به هنگام استفاده از اصطلاحنامه 4/44 دقیقه و به هنگام استفاده از زبان طبیعی 6/38 دقیقه است. لذا استفاده از اصطلاحنامه باعث کاهش مدت زمان جستجو میگردد.
«ارشاد سرابی» (1380) ضمن بررسی و مقایسه نسخههای رایگان مدلاین[7] در وب، میزان بازیافت و ضریب دقت شش نگارش متفاوت از مدلاین را که به طور رایگان در دسترس میباشند، بررسی کرده است. 36 جستجو به زبان طبیعی و زبان مقید در فیلد عنوان انجام داده و در نتایج، تفاوت معناداری در بازیافت و دقت این نگارشها در زبان طبیعی و مقید ملاحظه نشده است. بر اساس نتایج، نگارشهای مورد بررسی هنگام جستجو به زبان طبیعی، تعداد مدارک بازیافتی و ضریب دقت بالاتری را دارا هستند.
«اکبری و شهریاری» (1384) تاثیر اختلاف املای انگلیسی - آمریکایی و بریتانیایی بر میزان جامعیت بازیابی اطلاعات را بررسی کردهاند. در این مطالعه، برای آنکه به صورت کمّی تأثیر اختلاف املای انگلیسی بر معیار جامعیت ارزیابی شود، معیار جامعیّت کاوش برای چند واژه که دارای املای متفاوت در انگلیسی آمریکایی و بریتانیایی هستند، در دو پایگاه اطلاعرسانی انگلیسی زبان (پاب مد[8] و کب[9]) و دو پایگاه اطلاعرسانی فارسی ـ انگلیسی داخل کشور («پژوهشگاه اطلاعات و مدارک علمی ایران» و «ایران مدکس») که به نظام ذخیره و بازیابی فارسی – انگلیسی مجهز هستند؛ محاسبه و مقایسه شده است. در پایگاه اطلاعرسانی تخصصی علوم پزشکی (پاب مد)، که املای مرجح آن انگلیسی ـ آمریکایی است، نتیجة جستجو با املای آمریکایی و بریتانیایی هر واژه همپوشانی کامل دارد. از طرفی، در پایگاه اطلاعرسانی تخصصی علوم زیستی و کشاورزی(کب) که املای مرجح آن انگلیسی ـ بریتانیایی است، چون کاوش از طریق اصطلاحنامه انجام میشود، در صورت ورود واژه با املای آمریکایی، ابتدا جستجوگر به املای بریتانیایی ارجاع داده میشود، و در نهایت امکان انجام جستجو با املای بریتانیایی میسر میگردد. اما پایگاههای «پژوهشگاه اطلاعات و مدارک علمی ایران» و «ایران مدکس» به علت نادیدهگرفتن تفاوت املای دو گونه انگلیسی آمریکایی و بریتانیایی، نمیتوانند مانع از دست رفتن اطلاعات مرتبط و کاهش جامعیت شوند.
«شاکری» (1387) طی پژوهشی میزان جامعیت و مانعیت ابزارهای کاوش اینترنت با واسط جستجوی فارسی را بررسی کرد. 10 ابزار کاوش دارای شرایط تحقیق بود که بررسی گردید و نتایج نشان داد موتور جستجوی وبگاه[10] از نظر میزان مانعیت، بالاترین میزان و موتور جستجوی دهیو[11] در رتبه دوم و گوگل فارسی در رتبه سوم قرار دارند. در ضمن راهنمای موضوعی آفتاب با مانعیت 9%، کمترین میزان مانعیت را داراست. علاوه بر این، جامعیت موتورهای مورد نظر نیز بررسی شد و مطالعه نشان داد که وبگاه بالاترین جامعیت را دارد و دهیو و گوگل فارسی به ترتیب در رتبههای دوم و سوم قرار دارند. راهنمای موضوعی آفتاب نیز با 6/11% کمترین میزان جامعیت را دارا میباشد.
«بار- آیلن»[12] (1998) با استفاده از کلیدواژه Erdos، دقت و بازیافت نسبی شش موتور جستجو را بررسی کرد. وی 10-20 نتیجه اول را بررسی نمود و به این نتیجه رسید که دقت موتورها بالا، بازیافتشان پایین و همپوشانی آنها کم است.
«سار»[13] (2004) دقت و بازیافت موتورهای جستجو را هنگام استفاده از «قابلیت تصحیح کننده متون»[14] بررسی کرد. نتایج پژوهش وی نشان داد استفاده از قابلیت تصحیح کننده متون، دقت را 4% و بازیافت را 5/11% افزایش میدهد.
«شافی و رادر»[15] (2005) جامعیت و مانعیت پنج موتور جستجو (سایروس[16]، هات بات[17]، گوگل، آلتاویستا و بایو وب[18]) را در زمینه بیوتکنولوژی بررسی کردند. نتایج نشان داد سایروس جامعترین موتور جستجو در بازیابی اطلاعات علمی است و گوگل و هات بات در رتبههای بعدی قرار دارند. همچنین، تحقیقات نشان میدهد موتورهای جستجو مورد بررسی (بجز بایو وب) با زبان پرسش ساختار یافته خوب عمل میکنند، در حالی که بایو وب در مورد پرسشهای ساختار نیافته، بهتر عمل میکند.
«او گردی»[19] (2007) طی پژوهشی، نتایج حاصل از جستجوی ژنها و پروتئینها را در پایگاههای اطلاعاتی «مرکز ملی اطلاعات بیوتکنولوژی»[20] تجزیه و تحلیل کرد. مرکز ملی اطلاعات بیوتکنولوژی بخشی از کتابخانه ملی پزشکی ایالات متحده آمریکاست که بیش از 30 پایگاه اطلاعاتی و دیگر منابع را از طریق وبسایت خود در دسترس قرار میدهد. روشهای مختلفی برای جستجو وجود دارد و با توجه به تکنیک جستجوی انتخابی، نتایج متفاوتی بازیابی میشود. معمولا دو روش Enterz [21] و BLAST[22] بیشتر از سایر روشها توسط پژوهشگران در موقعیتهای مختلف استفاده میشوند. (پژوهشگری که در حال جستجوی اطلاعات درباره یک ژن بخصوص و مشخص است، احتمالاً از روش Enterze استفاده میکند؛ در حالی که پژوهشگری که به دنبال اطلاعاتی از یک ژن ناشناخته است، از BLAST استفاده میکند.) هر یک از این روشها، تنظیمها و محدودیتهای مختلفی را برای جستجو پیشنهاد میکنند که میتواند توسط استفادهکننده تغییر داده شود. جستجوی 70 ژن در سه پایگاه[23] NCBI، انجام شد و جامعیت و مانعیت آنها محاسبه گردید. نتایج نشان داد با استفاده از هر یک از روشهای فوق و یا اعمال تنظیمهای مختلف، نتایج متفاوتی به دست میآید. همچنین، برخی نتایج نشان داد تنظیمهای پیش فرض برای جستجو، برای تمام جستجوها مطلوب نیست. این موضوع، یکی از نکات مهمی است که متخصصان اطلاعرسانی هنگام جستجو باید به خاطر داشته باشند و آن را به پژوهشگران منتقل کنند.
جامعه پژوهش
بررسیها نشان داد در حال حاضر 4 پایگاه وجود دارد که مقالههای مجلههای علوم پزشکی از طریق آنها قابل جستجوست. ایران مدکس، مگ ایران، پایگاه اطلاعات علمی جهاد دانشگاهی و پارس مدلاین[24].
از آنجا که پارس مدلاین به علت مشکلات فنی قابل جستجو نبود، از جامعه پژوهش حذف گردید و سه پایگاه باقیمانده بررسی شد.
ایران مدکس، پایگاهی است که به نمایه کردن مقالههای نشریههای فارسی زبان حوزه علوم پزشکی میپردازد. شروع کار آن در سال 1382 بوده است و حدود 150 مجله را در این حوزه پوشش میدهد.
مرکز اطلاعات علمی جهاد دانشگاهی تحت نظارت شورای علمی، خدمات خود را از طریق پایگاه اینترنتی www.sid.ir به عنوان بانک اطلاعات علمی کشور ارائه میدهد. این سایت حدود 296 نشریه در زمینة پزشکی، علوم انسانی، علوم پایه، فنی و مهندسی، کشاورزی، هنر و معماری را نمایه میکند که 104 عنوان از آنها، در حوزة علوم پزشکی است.
فعالیت سایت مگ ایران از سال 1380 آغاز گردیده و ضمن مکاتبهها و رایزنیهای مکرر با مدیران نشریهها، تا کنون موفق به پوشش و ارائه خدمات به بیش از 1300 نشریه در حال انتشار شده است. این خدمات شامل درج شناسنامه نشریه، طرح روی جلد و فهرست مطالب هر شماره و اطلاعات کتابشناختی مقالههای آنها با استفاده از مندرجات نشریه است. این خدمات فقط با ارسال یک نسخه از هر شماره نشریه، به نشریهها ارائه میشود و کاربران میتوانند با استفاده از فهرست الفبایی، فهرست موضوعی و جستجو، به نشریههای مورد نظر خود دست یابند. این سایت، پایگاهی مرجع است که با هدف اطلاع رسانی و دسترسی به همه مجلههای کشور توسط بخش خصوصی و به صورت مستقل اداره می شود و به هیچ اداره، سازمان، نهاد و شرکت دولتی و غیردولتی وابسته نیست. 220 عنوان از مجلههای این سایت در حوزه بهداشت و درمان است.
روش پژوهش
برای انجام این پژوهش از روش پیمایشی و مقایسهای استفاده شده است. شیوه کار به این صورت بوده است که ابتدا با استفاده از اصطلاحنامه پزشکی فارسی، کلیدواژهها مشخص شد. بررسی کلیدواژههای حوزه دندانپزشکی در ساختار درختی اصطلاحنامه پزشکی فارسی نشان داد 51 کلیدواژه مرجح (انتخاب شده) در این حوزه وجود دارد که 18 مورد آنها جزء واژههای پذیرفته شده اصلی هستند. ابتدا تصمیم گرفته شد جستجو با استفاده از 18 کلیدواژه مورد نظر انجام گیرد، اما در هنگام انجام پژوهش با این روش، مشکلاتی پیش آمد که مجبور به تغییر کلیدواژهها شدیم. برای نمونه، در مورد کلیدواژه «ارتدنسی» که یکی از اصطلاحات پذیرفته شده اصلی در این حوزه است، کلیدواژههای «دستگاههای متحرک ارتدنسی» و «ارتدنسی اصلاحی» که از اصطلاحات اخص «ارتدنسی» هستند و یا کلیدواژه «دستگاههای ارتدنسی» که اصطلاح مرتبط آن است و انتخاب شده نیز می باشند، در نظر گرفته نشده اند و فقط کلیدواژه «ارتدنسی» در نظر گرفته شده است. از آنجا که نمایه سازی هیچ یک از این سه پایگاه با استفاده از زبان کنترل شده و یا اصطلاحنامه پزشکی فارسی انجام نمیشود، مشاهده شد که در موارد بسیاری، نتایج جستجو با کلیدواژه منتخب نسبت به نتایج جستجو با کلیدواژه انتخاب نشده، کمتر است. از سویی، گاه مشاهده شد که کلیدواژههایی در اصطلاحات رایج میان متخصصان حوزه دندانپزشکی وجود دارد، که طبعاً در عنوانهای مقالههای تألیف شده توسط آنان نیز به کار میرود، ولی در اصطلاحنامه (در کلیدواژههای انتخاب شده و انتخاب نشده) ذکر نشدهاند. در نهایت، تصمیم گرفته شد کلیدواژههای انتخابی برای انجام پژوهش به قرار زیر باشند:
علاوه بر 18 مورد فوق (کلیدواژههای اصطلاحنامه)، اصطلاحات انتخاب نشده آنها در اصطلاحنامه و اصطلاحاتی که در اصطلاحنامه نیامده است ولی به تجربه مشاهده شده که در میان اهل فن متداول است نیز به جامعه پژوهش افزوده شد. برای مثال، در مورد کلیدواژه «ارتدنسی»، اصطلاح انتخاب نشده آن در اصطلاحنامه یعنی «ارتودانتیکس» و اصطلاح پیشنهادی آن (ارتودنسی) نیز جستجو شد. در نهایت، مجموع کلیدواژههای مورد جستجو، 29 کلیدواژه شد. (فهرست کلیدواژههای مورد استفاده در پیوست ذکر شده است.)
همچنین، ذکر این نکته خالی از فایده نیست که اگرچه کلیدواژه دندانپزشکی در اصطلاحنامه با املای «دندانپزشکی» پیشنهاد شده است اما ملاحظه شد که در صورت استفاده از این املا، در پایگاههای SID و Magiran هیچ موردی بازیابی نمیشود و در Iranmedex نیز مقالههای بازیابی شده با املای «دندانپزشکی» نسبت به «دندانپزشکی» به طور قابل توجهی بیشتر بود. به همین دلیل در تمام موارد، با وجود پیشنهاد اصطلاحنامه، املای «دندانپزشکی» استفاده شده است.
جستجوی 29 کلیدواژه تعیین شده، به منظور اجتناب از تغییراتی که ممکن است به علت روزآمدسازی پایگاهها پیش بیاید، در طی یک روز در سه پایگاه مگ ایران، ایران مدکس و پایگاه اطلاعات علمی جهاد دانشگاهی انجام شد. هر یک از جستجوها به طور جداگانه بررسی و تعداد مدارک مرتبط در هر مورد یادداشت گردید. بررسی نتایج جستجوها نشان داد میان نتایج حاصل از پایگاهها همپوشانی وجود دارد؛ بدین معنا که در اکثر جستجوها، مدارکی مشاهده شد که در میان پایگاهها مشترک میباشند. لذا برای تعیین تعداد مدارک مشترکی که میان آنها وجود دارد، نتایج حاصل با هم مقایسه گردید؛ بدین ترتیب که مثلاً نتایج حاصل از جستجوی کلیدواژه «آسیبشناسی دهان» در پایگاه ایران مدکس، یکبار با نتایج حاصل از همین جستجو در پایگاه مگ ایران و یکبار با نتایج حاصل از همین کلیدواژه در پایگاه SID مقایسه شد و در پایان داده ها برای دستیابی به نتایج تجزیه و تحلیل گردید.
سنجش جامعیت
منظور از جامعیت یا بازیافت، توانایی یک سیستم در بازیابی تمام یا بیشتر مدارک مرتبط در پایگاه است. بنابراین، برای محاسبة مقدار آن نه تنها تعداد مدارک مرتبط بازیابی شده، بلکه تعداد مدارک مرتبط بازیابی نشده را نیز باید داشته باشیم.
با این توصیف، به نظر میرسد محاسبة جامعیت یک پایگاه تقریبا غیرممکن باشد. چون نمیتوان به تعداد مدارک مرتبطی که به دلایلی در بازیابیها ملاحظه نمیشود، دست یافت. «کلارک و ویلت» (1997 ذکر شده در شافی، 2005) روشی برای محاسبه جامعیت نسبی[25] در محیط وب به کار بردهاند که در این مقاله نیز از روش آنها برای محاسبه جامعیت نسبی پایگاههای مورد نظر استفاده شده است. آنان، جامعیت نسبی را به این صورت تعریف میکنند:
جامعیت نسبی:
تعداد کل مدارک مرتبط بازیابی شده توسط یک پایگاه
تعداد کل مدارک مرتبط بازیابی شده توسط کلیه پایگاههای مورد مطالعه
بدین ترتیب که اگر سه پایگاه مورد نظر را با حروف a، b و c نامگذاری کنیم، آنگاه مدارک بازیابی شده به وسیله آنها a1، b1 و c1 خواهد بود. اگر بین پایگاهها همپوشانی وجود نداشته باشد، جامعیت نسبی حاصل تقسیم a1 بر a1+b1+c1 خواهد بود و اگر بین پایگاهها همپوشانی وجود داشته باشد، و برای مثال همپوشانی پایگاه a و b، b2 نامگذاری شود؛ جامعیت نسبی پایگاه a برابر خواهد بود با: a1 در صورت و a1+b2+c2 در مخرج.
تجزیه و تحلیل دادهها
همانطور که در روش پژوهش اشاره شد، بررسی نتایج نشان داد میان مدارک بازیابی شده از پایگاهها همپوشانی وجود دارد. جدول شماره 1، تعداد مدارک بازیابی شده و جدول شماره 2، مدارک مشترک میان پایگاهها را به تفکیک نشان میدهند.
جدول 1. تعداد مقالههای بازیابی شده توسط پایگاهها
تعداد مقالههای مرتبط بازیابی شده |
تعداد مقالههای بازیابی شده |
نام پایگاه |
530 |
783 |
Iranmedex |
173 |
178 |
SID |
169 |
177 |
Magiran |
جدول2. تعداد مقالههای مشترک میان پایگاهها
SID & Magiran |
Iranmedex & SID |
Iranmedex & Magiran |
نام پایگاهها |
106 |
123 |
86 |
تعداد مقالههای مشترک |
با توجه به همپوشانی موجود، برای محاسبه مقدار جامعیت نسبی هر پایگاه، از فرمول دوم استفاده شد. به عبارت دیگر، پس از تعیین تعداد مدارک مرتبط بازیابی شده هر پایگاه، تعداد مدارک مشترک بازیابی شده در میان آنها تعیین و سپس محاسبه انجام گردید.
تجزیه و تحلیل دادهها نشان میدهد ایران مدکس دارای بالاترین میزان جامعیت، معادل 72/0 میباشد. جامعیت نسبی پایگاه مگ ایران 47/. و پایگاه اطلاعات علمی جهاد دانشگاهی 43/. بهدست آمد. (نتایج در نمودار شماره 1، قابل مشاهده است.)
نمودار1. مقایسه جمعیت نسبی پایگاهها
همانطور که در پیوست مشاهده میشود، در میان 18 کلیدواژه اولیهای که از اصطلاحنامه انتخاب شده بود، 7 مورد دارای اصطلاحات نامرجح (ذکر شده در اصطلاحنامه یا پیشنهاد شده توسط پژوهشگر) میباشند که به منظور انجام مقایسهای میان نتایج حاصل از جستجو توسط کلیدواژههای مرجح و نامرجح اصطلاحنامه، از این 7 کلیدواژه استفاده شد (جدول 3). کلیدواژههای مرجح به صورت bold و کلیدواژههای نامرجح در زیر آنها قید شده است. کلیدواژههای زیرخط دار مواردی هستند که توسط پژوهشگر پیشنهاد شدهاند و در اصطلاحنامه به صورت انتخاب شده یا انتخاب نشده وجود ندارند.
جدول 3. فهرست هفت کلیدواژهای که دارای اصطلاحات نامرجح هستند
سیمانی کردن
|
جفت شدن دندانها
|
ارتدنسی
|
آسیب شناسی دهان
|
دندانپزشکی کودکان
|
پریودانتیکس
|
سفید کردن دندان
|
|
ابتدا مقایسه نتایج حاصل از بازیابی کلیدواژههای فوق در هر یک از پایگاهها به طور جداگانه (نمودارهای 2، 3 و 4) انجام شد. در محور افقی فقط به ذکر کلیدواژه مرجح اکتفا شده و میزان نتایج جستجوی اصطلاحات انتخاب شده، انتخاب نشده و پیشنهادی هر کلیدواژه به تفکیک نشان داده شده است.
نمودار2. مقایسه نتایج جستجو میان کلیدواژه های انتخاب شده، انتخاب نشده و پیشنهادی
در پایگاه ایران مدکس
همانطور که در نمودار 2 مشاهده میشود، 100% نتایج حاصل از جستجوی کلیدواژه «سیمانی کردن» مربوط به اصطلاحات نامرجح است. در مورد «پریودانتیکس»، «ارتدنسی» و «جفت شدن دندانها» نیز درصد قابل توجهی از نتایج (به ترتیب 93%، 76% و 94%) به اصطلاحات نامرجح مربوط میباشد. نتایج نشان میدهد که تنها در مورد کلیدواژههای «دندانپزشکی کودکان»، «سفیدکردن دندان» و «آسیبشناسی دهان» درصد بیشتری از نتایج (به ترتیب 85%، 62% و 57%) متعلق به اصطلاح انتخاب شده میباشد.
نمودار3. مقایسه نتایج جستجو میان کلیدواژههای انتخاب شده، انتخاب نشده و پیشنهادی
در پایگاه مگ ایران
مقایسه نتایج در پایگاه مگ ایران نشان میدهد (نمودار 3) 100% نتایج حاصل از جستجوی کلیدواژههای «سیمانی کردن» و «پریودانتیکس» به اصطلاحات نامرجح مربوط میباشد. در مورد «ارتدنسی» و «آسیبشناسی دهان» نیز به ترتیب 82% و 63% نتایج مربوط به جستجوی کلیدواژههای نامرجح است. 95% نتایج در جستجوی کلیدواژه «دندانپزشکی کودکان» و 60% نتایج در مورد «جفت شدن دندانها» به اصطلاح مرجح مربوط میباشد. در مورد کلیدواژه «سفید کردن دندان» 50% نتایج مربوط به کلیدواژه مرجح و 50% به کلیدواژه نامرجح مربوط است.
نمودار4. مقایسه نتایج جستجو میان کلیدواژههای انتخاب شده، انتخاب نشده و پیشنهادی
در پایگاه اطلاعات علمی جهاد دانشگاهی
همانطور که نمودار 4 نشان میدهد، 100% نتایج جستجوی کلیدواژه «سیمانی کردن» در پایگاه SID مربوط به اصطلاحات نامرجح است. نتایج نشان میدهد تنها در مورد کلیدواژه «دندانپزشکی کودکان» اصطلاح مرجح (94%) نتایج بیشتری را به خود اختصاص میدهد و بخش اعظم نتایج جستجوی «جفتشدن دندانها» (90%)، «ارتدنسی» (83%)، «آسیبشناسی دهان» (5/62%)، «پریودانتیکس» (60%) و «سفیدکردن دندان» (67%) به اصطلاحات نامرجح مربوط است.
مقایسة نتایج حاصل از سه نمودار فوق نشان میدهد نتایج حاصل از کلیدواژه «سیمانی کردن» در هر سه پایگاه مربوط به اصطلاحات نامرجح است و تنها در مورد کلیدواژه «دندانپزشکی کودکان» بخش قابل توجهی از نتایج در هر سه پایگاه مربوط به اصطلاح مرجح میباشد.
به طور کلی میتوان گفت، نتایج حاصل از جستجوی اصطلاحات نامرجح بیشتر از نتایج حاصل از جستجوی اصطلاحات مرجح میباشد. برای بررسی دقیقتر ، جامعیت نسبی پایگاهها یکبار بر اساس نتایج کلیدواژههای مرجح هفت مورد فوق و یکبار بر اساس نتایج کلیدواژههای نامرجح آنها (انتخاب نشده و پیشنهادی) محاسبه شد. بر اساس یافتهها، جامعیت نسبی بر اساس اصطلاحات مرجح در ایران مدکس (3/68%)، مگ ایران (5/45%) و اس.آی.دی. (6/39%) میباشد، در حالی که جامعیت نسبی محاسبه شده بر اساس کلیدواژههای نامرجح در ایران مدکس (5/74%)، مگ ایران (3/46%) و اس.آی.دی. (47%) است. نتایج در نمودار 5 قابل مشاهده است. همانطور که مشاهده میشود، جامعیت نسبی حاصل از نتایج اصطلاحات نامرجح در هر سه پایگاه نسبت به نتایج حاصل از اصطلاحات مرجح بیشتر است.
نمودار5. مقایسه جامعیت نسبی پایگاه ها بر اساس کلیدواژههای مرجح و نامرجح
نتیجهگیری
در این پژوهش، تلاش بر این بود تا ضمن مقایسة جامعیت نسبی پایگاههای فارسی زبان ایران مدکس، مگ ایران و اس.آی.دی.؛ پایگاهی که جامعیت نسبی بیشتری در حوزه دندانپزشکی دارد، مشخص شود. برای محاسبه جامعیت نسبی پایگاهها از روشی که «کلارک و ویلت» در سال 1997 پیشنهاد کرده بودند، استفاده شد. همانطور که نتایج نشان داد، جستجو در ایران مدکس، جامعیت نسبی بالاتری نسبت به دو پایگاه دیگر دارد.
از طرفی، استفاده از کلیدواژههای اصطلاحنامه پزشکی فارسی، مسائل دیگری را در این پژوهش مورد توجه قرار داد. تصور میشد استفاده از اصطلاحات انتخاب شده میتواند ملاک مناسبی برای انتخاب کلیدواژه برای انجام جستجو باشد؛ اما در همان ابتدا مشاهده شد که در برخی موارد، حاصل جستجو با کلیدواژه نامرجح، نسبت به نتایج جستجو با کلیدواژه مرجح، جامع تر به نظر می رسد. پس از مقایسه میان جامعیت نسبی حاصل از جستجوی کلیدواژههای مرجح و نامرجح، مشخص شد در هر سه پایگاه، با استفاده از کلیدواژههای نامرجح، جستجوی جامع تری را خواهیم داشت.
گفتنی است، مقایسهای که میان کلیدواژههای مرجح و نامرجح انجام شد، تنها محدود به هفت کلیدواژه بود که در این پژوهش کلیدواژههای نامرجح آنها نیز مورد جستجو قرار گرفته بود. اینها مواردی بودند که کلیدواژه نامرجح آنها یا در اصطلاحنامه آمده و یا توسط پژوهشگر پیشنهاد شده بود. در حالی که اگر بخواهیم نتایج جستجوی تمامی موارد را بررسی کنیم، با کلیدواژههایی روبرو خواهیم شد که جستجوی آنها هیچ نتیجهای در بر ندارد؛ مانند کلیدواژه «پرستودانتیکس». در هیچ یک از پایگاهها مدرکی با این کلیدواژه در نتایج مشاهده نشد. در ساختار درختی اصطلاحنامه، اصطلاح «پروتز دندان» در زیر «پرستودانتیکس» به عنوان اصطلاح مرتبط ذکر شده است. در حالی که به نظر میرسد بهتر بود «پروتز دندان» در رأس قرار میگرفت و اصطلاحات «پروتز ثابت» و «پروتز متحرک» که جایشان در اصطلاحنامه کاملاً خالی است، به عنوان موضوعات اخص پیشنهاد میشد. همچنین، مشاهده میشود که استفاده از املای «ارتودنسی» (اصطلاح نامرجح) به جای «ارتدنسی» (اصطلاح مرجح) در هر سه پایگاه نتایج بیشتری را بازیابی میکند.
پیشنهادهای پژوهش
با توجه به موارد فوق به نظر میرسد لازم است اصطلاحنامة پزشکی فارسی، به عنوان تنها مرجع موجود برای نمایهسازی متون فارسی در حوزه پزشکی، مورد تجدید نظر دوباره قرار گیرد و دقت بیشتری در انتخاب کلیدواژهها به کار رود. همچنین، پایگاههایی که به کار نمایهسازی مجلههای این حوزه مشغول هستند، برای حفظ یکدستی در نمایهسازی باید از کلیدواژههای کنترل شده استفاده کنند. ضمناً پیشنهاد میشود پژوهشهای مشابهی در سایر حوزههای پزشکی انجام شود و جامعیت نسبی پایگاهها بر اساس کلیدواژههای مرجح و نامرجح مورد مقایسه قرار گیرد.
- احمدی، حمید (1385). ارزیابی بازیابی اطلاعات. مجله الکترونیکی پژوهشگاه اطلاعات و مدارک علمی ایران (نما)، دوره 6، شماره 1. (بازیابی شده از طریق اینترنت ) 15 نوامبر 2008. <http://www.irandoc.ac.ir/data/e_j/vol6/ahmadi.htm>
- ارشاد سرابی، رقیه (1380). «بررسی و مقایسه مدلاین های رایگان در وب». پایاننامه کارشناسی ارشد. دانشگاه علوم پزشکی ایرانی، دانشکده مدیریت و اطلاعرسانی پزشکی.
- اکبری، اسماعیل و پرویز شهریاری (1384). «تأثیر اختلاف املایی انگلیسی آمریکایی و بریتانیایی بر میزان جامعیت بازیابی اطلاعات». فصلنامه کتاب. شماره 63: 59-66.
- چشمه سهرابی، مظفر (1378). «تأثیر استفاده از اصطلاحنامه در بانکهای کتابشناختی بر میزان جامعیت، مانعیت و مدت زمان جستجوی اطلاعات بازیابی شده». پایاننامه کارشناسی ارشد. دانشگاه تربیت مدرس، دانشکده علوم انسانی.
- رهادوست، فاطمه، مریم کازرانی و دیگران (1377). «اصطلاحنامه پزشکی فارسی: نمایه درختی، نمایه الفبایی، نمایه گردشی، نمایه انگلیسی به فارسی». تهران: سازمان اسناد و کتابخانه ملی جمهوری اسلامی ایران. 2ج.
- شاکری، صدیقه (1387). میزان جامعیت و مانعیت ابزارهای کاوش فارسی اینترنت در بازیابی اطلاعات در حوزة کتابداری و اطلاعرسانی. فصلنامه کتاب. شماره 73: 177-200. (بازیابی شده از طریق اینترنت) 23 نوامبر 2008
http://nlai.ir/LinkClick.aspx?fileticket=%2frjDSr9Lelw%3d&tabid=204&mid=312
- Bar-Ilan, J. (1998) “On the overlap, the precision and estimated recall of search engines. A case study of the query “ERDOS”” Scientometrics 42(2):207-228
- O’Grady, T. (2007) “Entrez and BLAST: precision and recall in searches of NCBI databases” Issues in Science & Technology Librarianship; Issue 52 viewed 20 Feb 2009, http://www.istl.org/07-fall/refereed2.html
- Sarr, M. (2004) “Improving precision and recall using a spellchecker in a search engine. Master’s thesis in computer science” M.A. Thesis, Stockholm University, department of numerical analysis and computer science royal institute of technology, Viewed 23 Nov 2008, <http://.www.dsv.su.se/ ~hercules/ papers/SarrNodalida 2003. pdf.>
- Shafi, S.M., Rather, R A. (2005) Precision and recall of five search engine for retrieval of scholarly information in the field of biotechnology. Webology 2(2) viewed 27 oct 2008, http://www.webology.ir/2005/v2n2/a12.htm
پیوست1. فهرست کلید واژه های استفاده شده در پژوهش
کلیدواژههایی که در زیر هریک از 18 مورد اصلی آمده، موارد انتخاب نشده هستند و کلید واژه هایی که زیرخطدار میباشند، توسط پژوهشگر پیشنهاد شده و در اصطلاحنامه (به صورت انتخاب شده یا انتخاب نشده) وجود ندارد..
1.سیمانی کردن 1-دن
2.تجهیزات دندان پزشکی 2/دن
3.پیمایشهای دندان پزشکی 3/دن
4.مدل های دندان 4/ دن
5.جفت شدن دندان ها 5/ دن
6.دندان پزشکی ترمیمی 6-دن
7.تشخیص بیماری های دهان 7- دن
8.اندودانتیکس 8- دن
9.زیبایی در دندان پزشکی 9/ دن