مقایسه جامعیت نسبی پایگاه‌های فارسی زبان مگ ایران، پایگاه اطلاعات علمی جهاد دانشگاهی (اس.آی.دی) و ایران‌مدکس در بازیابی اطلاعات حوزة دندانپزشکی

نوع مقاله: مقاله پژوهشی

نویسندگان

1 دانشجوی کارشناسی ارشد علوم کتابداری و اطلاع رسانی پزشکی، دانشگاه علوم پزشکی ایران

2 عضو هیئت علمی مرکز اطلاعات و مدارک علمی وزارت جهاد کشاورزی

چکیده

حجم مقاله‌های منتشر شده در حوزة علوم پزشکی نیز مثل سایر حوزه‌ها افزایش قابل توجهی یافته است و ارزیابی کارایی پایگاه‌هایی که به نمایه‌سازی مجله‌های این حوزه می‌‌پردازند، ضروری است. در حال حاضر، جستجو و بازیابی مقاله‌های فارسی در حوزة علوم پزشکی از طریق پایگاه‌های «مگ ایران»، «ایران مدکس» و پایگاه «اطلاعات علمی جهاد دانشگاهی» امکان‌پذیر است. از آنجا که جامعیت و مانعیت به عنوان دو معیار مهم برای ارزیابی نظامهای بازیابی اطلاعات به‌کار می‌روند، این پژوهش با استفاده از روش پیمایشی و مقایسه‌ای،جامعیت نسبی سه پایگاه اطلاعاتی فوق در حوزة دندانپزشکی را بررسی نمود. به همین منظور 29 کلیدواژه از حوزه دندانپزشکی انتخاب شد و پس از جستجو و تجزیه و تحلیل داده‌ها، نتایج نشان داد «ایران مدکس» دارای بالاترین میزان جامعیت با 72/0 است. همچنین، مشاهده شد که جامعیت نسبی پایگاه «مگ ایران» نسبت به SID بیشتر است.
 

کلیدواژه‌ها


مقدمه

رشد و گسترش اینترنت، روشهای دستیابی به اطلاعات را دگرگون کرده و برای ایجاد سهولت و تسریع در مکان­یابی اطلاعات، امکانات بسیاری در وب ایجاد شده است. پایگاه­های اطلاعاتی که به نمایه­سازی مقاله‌های مجله‌ها می­پردازند، یکی از این ابزارها می­باشند.

با توجه به اینکه هزینه­های جستجو زیاد بوده و زمان قابل توجهی برای جستجوی اطلاعات در پایگاه­ها توسط کاربران صرف می­شود، مهم است که بدانیم کدام پایگاه­ها بیش از همه مؤثرند. در حال حاضر، برای ارزیابی ابزارهای جستجوی اینترنت، معیارهای جدیدی ایجاد شده و مورد استفاده قرار می‌گیرد. یکی از این معیارها، ربط[1] می­باشد که برای ارزیابی نظامهای بازیابی اطلاعات و کارایی جستجوهای انجام شده، به­کار می­رود و به وسیلة دو ملاک جامعیت[2] و مانعیت[3] سنجیده می­شود (شاکری، 1387).

مانعیت، صحّت یک جستجو را می­سنجد. جستجو در صورتی به مانعیت کامل دست می­یابد که هر پیشینه بازیابی شده در رابطه با یک پرسش، لزوماً به آن پرسش مربوط باشد و جامعیت مقیاسی از اثربخشی در بازیابی کلیة اطلاعات جستجو شده در یک پایگاه اطلاعاتی است. هنگامی جامعیت کامل محقق می­شود که هر پیشینة منفرد که ­باید در رابطه با یک پرسش خاص یافت شود، حتماً ردیابی گردد (احمدی، 1385). به عبارت دیگر، جامعیت توانایی نظام در بازیابی کلیه مدارک مرتبط و مانعیت توانایی نظام در عدم بازیابی مدارک غیرمرتبط می­باشد.

محاسبه مانعیت از طریق تقسیم تعداد مدارک مرتبط بازیابی شده به کل مدارک بازیابی شده در نتایج جستجو میسر است، اما برای محاسبة جامعیت باید علاوه بر تعداد مدارک مرتبط بازیابی شده، تعداد کل مدارک مرتبط موجود در پایگاه هم در دسترس باشد که حاصل آن از تقسیم تعداد مدارک مرتبط بازیابی شده به کل مدارک مرتبط موجود در پایگاه، به­دست می‌آید.

حجم مقاله‌های منتشرشده در حوزه علوم پزشکی نیز همچون حوزه‌های دیگر افزایش قابل توجهی یافته است و به نظر می­رسد ارزیابی کارایی پایگاه­هایی که به نمایه‌سازی مجله‌های این حوزه می­پردازند، ضروری است. طی بررسی­های اولیه مشخص شد جستجو و بازیابی مقاله‌های فارسی در حوزه علوم پزشکی از طریق پایگاه­های مگ ایران[4]، ایران مدکس[5] و پایگاه اطلاعات علمی جهاد دانشگاهی[6] ممکن است و از آنجا که جامعیت و مانعیت به عنوان دو معیار مهم برای ارزیابی نظامهای بازیابی اطلاعات به­کار می­روند، این پژوهش به بررسی جامعیت نسبی سه پایگاه اطلاعاتی فوق در حوزة دندانپزشکی می­پردازد.

 

اهمیت پژوهش

برای دسترسی به نتایج دقیق­تر، کاربران باید با مزایای هر یک از پایگاه­های اطلاعاتی آشنا شوند تا پایگاه مناسب را بدون اتلاف وقت، برای جستجو انتخاب کنند. نتیجة این پژوهش به متخصصان و دانشجویان حوزة دندانپزشکی کمک خواهد کرد تا پایگاهی را که برای بازیابی مقاله‌های فارسی در حوزه تخصصی آنها جامعیت بالاتری دارد، شناسایی کنند.

 

پیشینة پژوهش

«چشمه سهرابی» (1378) طی پژوهشی تأثیر استفاده از اصطلاحنامه را بر میزان جامعیت، مانعیت و مدت زمان جستجو در بانکهای اطلاعاتی کتابشناختی، بررسی کرده است. 7 بانک اطلاعاتی در 6 گروه علوم‌انسانی، علوم­پزشکی، علوم­پایه، کشاورزی، فنی و مهندسی و هنر برای انجام پژوهش در نظر گرفته شد و در هر بانک اطلاعاتی، 10 کلیدواژه به طور تصادفی و با کمک متخصصان انتخاب گردید. هر کلیدواژه، یک‌بار از طریق اصطلاحنامه و بار دیگر با استفاده از زبان طبیعی، مورد کاوش قرار گرفت. میزان جامعیت، مانعیت و مدت زمان جستجوی اطلاعات بازیابی­شده از طریق اصطلاحنامه و زبان طبیعی اندازه‌گیری شد. یافته‌های پژوهش نشان می‌دهد: نخست، میزان جامعیت نتایج بازیابی در بانکهای اطلاعاتی به هنگام استفاده از اصطلاحنامه 39/24% و به هنگام استفاده از زبان طبیعی 56/89%  می‌باشد. بنابراین، استفاده از اصطلاحنامه باعث کاهش جامعیت می‌شود. دوم، میزان مانعیت نتایج بازیابی در بانکهای اطلاعاتی به هنگام استفاده از اصطلاحنامه 75/06% و به هنگام استفاده از زبان طبیعی 58/46% است. با وجود این، استفاده از اصطلاحنامه موجب افزایش میزان مانعیت جستجوها می‌شود. سوم، میانگین مدت زمان جستجوی نتایج بازیابی شده در بانکهای اطلاعاتی به هنگام استفاده از اصطلاحنامه 4/44 دقیقه و به هنگام استفاده از زبان طبیعی 6/38 دقیقه است. لذا استفاده از اصطلاحنامه باعث کاهش مدت زمان جستجو می‌گردد.

«ارشاد سرابی» (1380) ضمن بررسی و مقایسه نسخه­های رایگان مدلاین[7] در وب، میزان بازیافت و ضریب دقت شش نگارش متفاوت از مدلاین را که به طور رایگان در دسترس می­باشند، بررسی کرده است. 36 جستجو به زبان طبیعی و زبان مقید در فیلد عنوان انجام داده و در نتایج، تفاوت معنا­داری در بازیافت و دقت این نگارشها در زبان طبیعی و مقید ملاحظه نشده است. بر اساس نتایج، نگارشهای مورد بررسی هنگام جستجو به زبان طبیعی، تعداد مدارک بازیافتی و ضریب دقت بالاتری را دارا هستند.

«اکبری و شهریاری» (1384) تاثیر اختلاف املای انگلیسی - آمریکایی و بریتانیایی بر میزان جامعیت بازیابی اطلاعات را بررسی کرده­اند. در این مطالعه، برای آنکه به صورت کمّی تأثیر اختلاف املای انگلیسی بر معیار جامعیت ارزیابی شود، معیار جامعیّت کاوش برای چند واژه که دارای املای متفاوت در انگلیسی آمریکایی و بریتانیایی هستند، در دو پایگاه اطلاع­رسانی انگلیسی زبان (پاب مد[8] و  کب[9]) و دو پایگاه اطلاع‌رسانی            فارسی ـ انگلیسی داخل کشور («پژوهشگاه اطلاعات و مدارک علمی ایران» و «ایران مدکس») که به نظام ذخیره و بازیابی فارسی – انگلیسی مجهز هستند؛ محاسبه و مقایسه شده است. در پایگاه اطلاع­رسانی تخصصی علوم­ پزشکی (پاب مد)، که املای مرجح آن انگلیسی ـ آمریکایی ا­ست، نتیجة جستجو با املای آمریکایی و بریتانیایی هر واژه همپوشانی کامل دارد. از طرفی، در پایگاه اطلاع­رسانی تخصصی علوم ­زیستی و کشاورزی(کب) که املای مرجح آن انگلیسی ـ بریتانیایی­ است، چون کاوش از طریق اصطلاحنامه انجام می‌شود، در صورت ورود واژه با املای آمریکایی، ابتدا جستجوگر به املای بریتانیایی ارجاع داده می­شود، و در نهایت امکان انجام جستجو با املای بریتانیایی میسر می‌گردد. اما پایگاه­های «پژوهشگاه اطلاعات و مدارک علمی ایران» و «ایران مدکس» به علت نادیده‌گرفتن تفاوت املای دو گونه انگلیسی آمریکایی و بریتانیایی، نمی­توانند مانع          از دست رفتن اطلاعات مرتبط و کاهش جامعیت شوند.

«شاکری» (1387) طی پژوهشی میزان جامعیت و مانعیت ابزارهای کاوش اینترنت با واسط جستجوی فارسی را بررسی کرد. 10 ابزار کاوش دارای شرایط تحقیق بود که بررسی گردید و نتایج نشان داد موتور جستجوی وبگاه[10] از نظر میزان مانعیت، بالاترین میزان و موتور جستجوی دهیو[11] در رتبه دوم و گوگل فارسی در رتبه سوم قرار دارند. در ضمن راهنمای موضوعی آفتاب با مانعیت 9%، کمترین میزان مانعیت را داراست. علاوه بر این، جامعیت موتورهای مورد نظر نیز بررسی شد و مطالعه نشان داد که وبگاه بالاترین جامعیت را دارد و دهیو و گوگل فارسی به ترتیب در رتبه­های دوم و سوم قرار دارند. راهنمای موضوعی آفتاب نیز با 6/11% کمترین میزان جامعیت را دارا می­باشد.

«بار- آیلن»[12] (1998) با استفاده از کلیدواژه Erdos، دقت و بازیافت نسبی شش موتور جستجو را بررسی کرد. وی 10-20 نتیجه اول را بررسی نمود و به این نتیجه رسید که دقت موتورها بالا، بازیافتشان پایین و همپوشانی آنها کم است.

«سار»[13] (2004) دقت و بازیافت موتورهای جستجو را هنگام استفاده از «قابلیت تصحیح کننده متون»[14] بررسی کرد. نتایج پژوهش وی نشان داد استفاده از قابلیت تصحیح کننده متون، دقت را 4% و بازیافت را 5/11% افزایش می­دهد.

«شافی و رادر»[15] (2005) جامعیت و مانعیت پنج موتور جستجو (سایروس[16]، هات بات[17]، گوگل، آلتاویستا و بایو وب[18]) را در زمینه بیوتکنولوژی بررسی کردند. نتایج نشان داد سایروس جامع­‌ترین موتور جستجو در بازیابی اطلاعات علمی است و گوگل و هات بات در رتبه­های بعدی قرار دارند. همچنین، تحقیقات نشان می­دهد موتورهای جستجو مورد بررسی (بجز بایو وب) با زبان پرسش ساختار یافته خوب عمل می­کنند، در حالی که بایو وب در مورد پرسشهای ساختار نیافته، بهتر عمل می­‌کند.

«او گردی»[19] (2007) طی پژوهشی، نتایج حاصل از جستجوی ژنها و پروتئینها را در پایگاه­های اطلاعاتی «مرکز ملی اطلاعات بیوتکنولوژی»[20] تجزیه و تحلیل کرد. مرکز ملی اطلاعات بیوتکنولوژی بخشی از کتابخانه ملی پزشکی ایالات متحده آمریکاست که بیش از 30 پایگاه اطلاعاتی و دیگر منابع را از طریق وب‌سایت خود در دسترس قرار می‌­دهد. روشهای مختلفی برای جستجو وجود دارد و با توجه به تکنیک جستجوی انتخابی، نتایج متفاوتی بازیابی می­شود. معمولا دو روش Enterz [21] و BLAST[22] بیشتر از سایر روشها توسط پژوهشگران در موقعیتهای مختلف استفاده می­شوند. (پژوهشگری که در حال جستجوی اطلاعات درباره یک ژن بخصوص و مشخص است، احتمالاً از روش Enterze استفاده می­کند؛ در حالی که پژوهشگری که به دنبال اطلاعاتی از یک ژن ناشناخته است، از BLAST استفاده می­کند.) هر یک از این روشها، تنظیمها و محدودیتهای مختلفی را برای جستجو پیشنهاد می­کنند که می­تواند توسط استفاده‌کننده تغییر داده شود. جستجوی 70 ژن در سه پایگاه[23] NCBI، انجام شد و جامعیت و مانعیت آنها محاسبه گردید. نتایج نشان داد با استفاده از هر یک از روشهای فوق و یا اعمال تنظیمهای مختلف، نتایج متفاوتی به دست می‌آید. همچنین، برخی نتایج نشان داد تنظیمهای پیش فرض برای جستجو، برای تمام جستجوها مطلوب نیست. این موضوع، یکی از نکات مهمی است که متخصصان اطلاع­رسانی هنگام جستجو باید به خاطر داشته باشند و آن را به پژوهشگران منتقل کنند.

 

جامعه پژوهش

بررسیها نشان داد در حال حاضر 4 پایگاه وجود دارد که مقاله‌های مجله‌های علوم پزشکی از طریق آنها قابل جستجوست. ایران مدکس، مگ ایران، پایگاه اطلاعات علمی جهاد دانشگاهی و پارس مدلاین[24].

از آنجا که پارس مدلاین به علت مشکلات فنی قابل جستجو نبود، از جامعه پژوهش حذف گردید و سه پایگاه باقی‌مانده بررسی شد.

ایران مدکس، پایگاهی است که به نمایه کردن مقاله‌های نشریه‌های فارسی زبان حوزه علوم پزشکی می­پردازد. شروع کار آن در سال 1382 بوده است و حدود 150 مجله را در این حوزه  پوشش می­دهد.

مرکز اطلاعات علمی جهاد دانشگاهی تحت نظارت شورای علمی، خدمات خود را از طریق پایگاه اینترنتی www.sid.ir  به عنوان بانک اطلاعات علمی کشور ارائه می­دهد. این سایت حدود 296 نشریه در زمینة پزشکی، علوم انسانی، علوم پایه، فنی و مهندسی، کشاورزی، هنر و معماری را نمایه می­کند که 104 عنوان از آنها، در حوزة علوم پزشکی است.

فعالیت سایت مگ ایران از سال 1380 آغاز گردیده و ضمن مکاتبه‌ها و رایزنی­های مکرر با مدیران نشریه‌ها، تا کنون موفق به پوشش و ارائه خدمات به بیش از 1300 نشریه در حال انتشار شده است. این خدمات شامل درج شناسنامه نشریه، طرح روی جلد و فهرست مطالب هر شماره و اطلاعات کتابشناختی مقاله‌های آنها با استفاده از مندرجات نشریه است. این خدمات فقط با ارسال یک نسخه از هر شماره نشریه، به نشریه‌ها ارائه می­شود و کاربران می­توانند با استفاده از فهرست الفبایی، فهرست موضوعی و جستجو، به نشریه‌های مورد نظر خود دست یابند. این سایت، پایگاهی مرجع است که با هدف اطلاع رسانی و دسترسی به همه مجله‌های کشور توسط بخش خصوصی و به صورت مستقل اداره می شود و به هیچ اداره، سازمان، نهاد و شرکت دولتی و غیردولتی وابسته نیست. 220 عنوان از مجله‌های این سایت در حوزه بهداشت و درمان است.

 

روش پژوهش

برای انجام این پژوهش از روش پیمایشی و مقایسه­ای استفاده شده است. شیوه کار به این صورت بوده است که ابتدا با استفاده از اصطلاحنامه پزشکی فارسی، کلیدواژه­ها مشخص شد. بررسی کلیدواژه­های حوزه دندانپزشکی در ساختار درختی اصطلاحنامه پزشکی فارسی نشان داد 51 کلیدواژه مرجح (انتخاب شده) در این حوزه وجود دارد که 18 مورد آنها جزء واژه­های پذیرفته شده اصلی هستند. ابتدا تصمیم گرفته شد جستجو با استفاده از 18 کلیدواژه مورد نظر انجام گیرد، اما در هنگام انجام پژوهش با این روش، مشکلاتی پیش آمد که مجبور به تغییر کلیدواژه­ها شدیم. برای نمونه، در مورد کلیدواژه «ارتدنسی» که یکی از اصطلاحات پذیرفته شده اصلی در این حوزه است، کلیدواژه­های «دستگاه‌‌­های متحرک ارتدنسی» و «ارتدنسی اصلاحی» که از اصطلاحات اخص «ارتدنسی» هستند و یا کلیدواژه «دستگاه‌­های ارتدنسی» که اصطلاح مرتبط آن است و انتخاب شده نیز می باشند، در نظر گرفته نشده اند و فقط کلیدواژه «ارتدنسی» در نظر گرفته شده است. از آنجا که نمایه سازی هیچ یک از این سه پایگاه با استفاده از زبان کنترل شده و یا اصطلاحنامه پزشکی فارسی انجام نمی­شود، مشاهده شد که در موارد بسیاری، نتایج جستجو با کلیدواژه منتخب نسبت به نتایج جستجو با کلیدواژه انتخاب نشده، کمتر است. از سویی، گاه مشاهده شد که کلیدواژه­هایی در اصطلاحات رایج میان متخصصان حوزه دندانپزشکی وجود دارد، که طبعاً در عنوانهای مقاله‌های تألیف شده توسط آنان نیز به کار می­‌رود، ولی در اصطلاحنامه (در کلیدواژه­های انتخاب شده و انتخاب نشده) ذکر نشده‌اند. در نهایت، تصمیم گرفته شد کلیدواژه­های انتخابی برای انجام پژوهش به قرار زیر ­باشند:

علاوه بر 18 مورد فوق­ (کلیدواژه­های اصطلاحنامه)، اصطلاحات انتخاب نشده آنها در اصطلاحنامه و اصطلاحاتی که در اصطلاحنامه نیامده است ولی به تجربه مشاهده شده که در میان اهل فن متداول است نیز به جامعه پژوهش افزوده شد. برای مثال، در مورد کلیدواژه «ارتدنسی»، اصطلاح انتخاب نشده آن در اصطلاحنامه یعنی «ارتودانتیکس» و اصطلاح پیشنهادی آن (ارتودنسی) نیز جستجو شد. در نهایت، مجموع کلیدواژه­های مورد جستجو،  29 کلیدواژه شد. (فهرست کلیدواژه­های مورد استفاده در پیوست ذکر شده است.)

همچنین، ذکر این نکته خالی از فایده نیست که اگرچه کلیدواژه دندانپزشکی در اصطلاحنامه با املای «دندان‌پزشکی» پیشنهاد شده است اما ملاحظه شد که در صورت استفاده از این املا، در پایگاه‌های SID و Magiran هیچ موردی بازیابی نمی­شود و در Iranmedex نیز مقاله‌های بازیابی شده با املای «دندانپزشکی» نسبت به «دندان‌پزشکی» به طور قابل توجهی بیشتر بود. به همین دلیل در تمام موارد، با وجود پیشنهاد اصطلاحنامه، املای «دندانپزشکی» استفاده شده است.

جستجوی 29 کلیدواژه تعیین شده، به منظور اجتناب از تغییراتی که ممکن است به علت روزآمدسازی پایگاه­ها پیش بیاید، در طی یک روز در سه پایگاه مگ ایران، ایران مدکس و پایگاه اطلاعات علمی جهاد دانشگاهی انجام شد. هر یک از جستجوها به طور جداگانه بررسی و تعداد مدارک مرتبط در هر مورد یادداشت گردید. بررسی نتایج جستجوها نشان داد میان نتایج حاصل از  پایگاه­ها همپوشانی وجود دارد؛ بدین معنا که در اکثر جستجوها، مدارکی مشاهده شد که در میان پایگاه­ها مشترک می­باشند. لذا برای تعیین تعداد مدارک مشترکی که میان آنها وجود دارد، نتایج حاصل با هم مقایسه گردید؛ بدین ترتیب که مثلاً نتایج حاصل از جستجوی کلیدواژه «آسیب‌شناسی دهان» در پایگاه ایران مدکس، یکبار با نتایج حاصل از همین جستجو در پایگاه مگ ایران و یکبار با نتایج حاصل از همین کلیدواژه در پایگاه SID مقایسه شد و در پایان داده ها برای دستیابی به نتایج تجزیه و تحلیل گردید.

 

سنجش جامعیت

منظور از جامعیت یا بازیافت، توانایی یک سیستم در بازیابی تمام یا بیشتر مدارک مرتبط در پایگاه است. بنابراین، برای محاسبة مقدار آن نه تنها تعداد مدارک مرتبط بازیابی شده، بلکه تعداد مدارک مرتبط بازیابی نشده را نیز باید داشته باشیم.

با این توصیف، به نظر می­رسد محاسبة جامعیت یک پایگاه تقریبا غیرممکن باشد. چون نمی‌­توان به تعداد مدارک مرتبطی که به دلایلی در بازیابی­ها ملاحظه نمی­شود، دست یافت. «کلارک و ویلت» (1997 ذکر شده در شافی، 2005) روشی برای محاسبه جامعیت نسبی[25] در محیط وب به کار برده­اند که در این مقاله نیز از روش آنها برای محاسبه جامعیت نسبی پایگاه­های مورد نظر استفاده شده است. آنان، جامعیت نسبی را به این صورت تعریف می­کنند:

جامعیت نسبی:

 

تعداد کل مدارک مرتبط بازیابی شده توسط یک پایگاه

تعداد کل مدارک مرتبط بازیابی شده توسط کلیه پایگاه­های مورد مطالعه

 

بدین ترتیب که اگر سه پایگاه مورد نظر را با حروف a، b و c نامگذاری کنیم، آنگاه مدارک بازیابی شده به وسیله آنها a1، b1 و c1 خواهد بود. اگر بین پایگاه­ها همپوشانی وجود نداشته باشد، جامعیت نسبی حاصل تقسیم a1 بر a1+b1+c1 خواهد بود و اگر بین پایگاه­ها همپوشانی وجود داشته باشد، و برای مثال همپوشانی پایگاه a و b، b2 نامگذاری شود؛ جامعیت نسبی پایگاه a برابر خواهد بود با: a1 در صورت و a1+b2+c2 در مخرج.

 

تجزیه و تحلیل داده‌ها

همان‌طور که در روش پژوهش اشاره شد، بررسی نتایج نشان داد میان مدارک بازیابی شده از پایگاه­ها همپوشانی وجود دارد. جدول شماره 1، تعداد مدارک بازیابی شده و جدول شماره 2، مدارک مشترک میان پایگاه­ها را به تفکیک نشان می­دهند.

جدول 1. تعداد مقاله‌های بازیابی شده توسط پایگاه­ها

تعداد مقاله‌های مرتبط بازیابی شده

تعداد مقاله‌های بازیابی شده

نام پایگاه

530

783

Iranmedex

173

178

SID

169

177

Magiran

 

جدول2. تعداد مقاله‌های مشترک میان پایگاه­ها

SID & Magiran

Iranmedex & SID

Iranmedex & Magiran

نام پایگاه‌ها

106

123

86

تعداد مقاله‌های مشترک

 

با توجه به همپوشانی موجود، برای محاسبه مقدار جامعیت نسبی هر پایگاه، از فرمول دوم استفاده شد. به عبارت دیگر، پس از تعیین تعداد مدارک مرتبط بازیابی شده هر پایگاه، تعداد مدارک مشترک بازیابی شده در میان آنها تعیین و سپس محاسبه انجام گردید.

تجزیه و تحلیل داده‌ها نشان می­‌دهد ایران مدکس دارای بالاترین میزان جامعیت، معادل 72/0 می‌باشد. جامعیت نسبی پایگاه مگ ایران 47/. و پایگاه اطلاعات علمی جهاد دانشگاهی 43/. به­دست آمد. (نتایج در نمودار شماره 1، قابل مشاهده است.)

 

 

 

 

 

 

 

 

 

 

 

نمودار1. مقایسه جمعیت نسبی پایگاه‌ها

 

همان‌طور که در پیوست مشاهده می­شود، در میان 18 کلیدواژه اولیه­ای که از اصطلاحنامه انتخاب شده بود، 7 مورد دارای اصطلاحات نامرجح (ذکر شده در اصطلاحنامه یا پیشنهاد شده توسط پژوهشگر) می­باشند که به منظور انجام مقایسه­ای میان نتایج حاصل از جستجو توسط کلیدواژه­های مرجح و نامرجح اصطلاحنامه، از این             7 کلیدواژه استفاده شد (جدول 3). کلیدواژه­های مرجح به صورت bold و کلیدواژه­های نامرجح در زیر آنها قید شده است. کلیدواژه­های زیرخط دار مواردی هستند که توسط پژوهشگر پیشنهاد شده­اند و در اصطلاحنامه به صورت انتخاب شده یا انتخاب نشده وجود ندارند.

 

 

جدول 3. فهرست هفت کلیدواژه­ای که دارای اصطلاحات نامرجح هستند

سیمانی کردن

  • · سمان
  • · سمنت

جفت شدن دندانها

  • اکلوژن دندان

ارتدنسی

  • ارتودانتیکس
  • ارتودنسی

آسیب شناسی دهان

  • پاتولوژی دهان

دندانپزشکی کودکان

  • · پدودانتیکس
  • · دندانپزشکی اطفال

پریودانتیکس

  • پریودنتیکس
  • پریودنتولوژی

سفید کردن دندان

  • بلیچینگ

 

 

ابتدا مقایسه نتایج حاصل از بازیابی کلیدواژه­های فوق­ در هر یک از پایگاه­ها به طور جداگانه (نمودارهای 2، 3 و 4) انجام شد. در محور افقی فقط به ذکر کلیدواژه مرجح اکتفا شده و میزان نتایج جستجوی اصطلاحات انتخاب شده، انتخاب نشده و پیشنهادی هر کلیدواژه به تفکیک نشان داده شده است.

 

 

 

 

 

 

 

 

 

 

 

 

نمودار2. مقایسه نتایج جستجو میان کلیدواژه های انتخاب شده، انتخاب نشده و پیشنهادی

در پایگاه ایران مدکس

 

همان‌طور که در نمودار 2 مشاهده می­شود، 100% نتایج حاصل از جستجوی کلیدواژه­ «سیمانی کردن» مربوط به اصطلاحات نامرجح است. در مورد «پریودانتیکس»، «ارتدنسی» و «جفت شدن دندانها» نیز درصد قابل توجهی از نتایج (به ترتیب 93%، 76% و 94%) به اصطلاحات نامرجح مربوط می­‌باشد. نتایج نشان می‌دهد که تنها در مورد کلیدواژه­‌های «دندانپزشکی کودکان»، «سفیدکردن دندان» و «آسیب‌شناسی دهان» درصد بیشتری از نتایج (به ترتیب 85%، 62% و 57%) متعلق به اصطلاح انتخاب شده می­باشد.

 

 

 

 

 

 

 

 

 

 

 

نمودار3. مقایسه نتایج جستجو میان کلیدواژه‌های انتخاب شده، انتخاب نشده و پیشنهادی

در پایگاه مگ ایران

 

مقایسه نتایج در پایگاه مگ ایران نشان می­دهد (نمودار 3) 100% نتایج حاصل از جستجوی کلیدواژه‌­های «سیمانی کردن» و «پریودانتیکس» به اصطلاحات نامرجح مربوط می­باشد. در مورد «ارتدنسی» و «آسیب‌شناسی دهان» نیز به ترتیب 82% و 63% نتایج مربوط به جستجوی کلیدواژه­های نامرجح است. 95% نتایج در جستجوی کلیدواژه «دندانپزشکی کودکان» و 60% نتایج در مورد «جفت شدن دندانها» به اصطلاح مرجح مربوط می­باشد. در مورد کلیدواژه «سفید کردن دندان» 50% نتایج مربوط به کلیدواژه مرجح و 50% به کلیدواژه نامرجح مربوط است.

 

 

 

 

 

 

 

 

 

 

 

 

نمودار4. مقایسه نتایج جستجو میان کلیدواژه‌های انتخاب شده، انتخاب نشده و پیشنهادی

در پایگاه اطلاعات علمی جهاد دانشگاهی

 

همان‌طور که نمودار 4 نشان می­دهد، 100% نتایج جستجوی کلیدواژه­ «سیمانی کردن» در پایگاه SID مربوط به اصطلاحات نامرجح است. نتایج نشان می­دهد تنها در مورد کلیدواژه «دندانپزشکی کودکان» اصطلاح مرجح (94%) نتایج بیشتری را به خود اختصاص می­دهد و بخش اعظم نتایج جستجوی «جفت‌شدن دندانها» (90%)، «ارتدنسی» (83%)، «آسیب‌شناسی دهان» (5/62%)، «پریودانتیکس» (60%) و «سفیدکردن دندان» (67%) به اصطلاحات نامرجح مربوط است.

 مقایسة نتایج حاصل از سه نمودار فوق نشان می‌­دهد نتایج حاصل از کلیدواژه­ «سیمانی کردن» در هر سه پایگاه مربوط به اصطلاحات نامرجح است و تنها در مورد کلیدواژه «دندانپزشکی کودکان» بخش قابل توجهی از نتایج در هر سه پایگاه مربوط به اصطلاح مرجح می­باشد.

به طور کلی می­توان گفت، نتایج حاصل از جستجوی اصطلاحات نامرجح بیشتر از نتایج حاصل از جستجوی اصطلاحات مرجح می­باشد. برای بررسی دقیق­تر ، جامعیت نسبی پایگاه­ها یکبار بر اساس نتایج کلیدواژه­های مرجح هفت مورد فوق­ و یکبار بر اساس نتایج کلیدواژه­های نامرجح آنها (انتخاب نشده و پیشنهادی) محاسبه شد. بر اساس یافته­ها، جامعیت نسبی بر اساس اصطلاحات مرجح در ایران مدکس (3/68%)، مگ ایران (5/45%) و اس.آی.دی. (6/39%) می­باشد، در حالی که جامعیت نسبی محاسبه شده بر اساس کلیدواژه­های نامرجح در ایران مدکس (5/74%)، مگ ایران (3/46%) و اس.آی.دی. (47%) است. نتایج در نمودار 5 قابل مشاهده است. همان‌طور که مشاهده می­شود، جامعیت نسبی حاصل از نتایج اصطلاحات نامرجح در هر سه پایگاه نسبت به نتایج حاصل از اصطلاحات مرجح بیشتر است.

 

 

 

 

 

 

 

 

 

 

 

 

نمودار5. مقایسه جامعیت نسبی پایگاه ها بر اساس کلیدواژه‌های مرجح و نامرجح

نتیجه‌گیری

در این پژوهش، تلاش بر این بود تا ضمن مقایسة جامعیت نسبی پایگاه­های فارسی زبان ایران مدکس، مگ ایران و اس.آی.دی.؛ پایگاهی که جامعیت نسبی بیشتری در حوزه دندانپزشکی دارد، مشخص شود. برای محاسبه جامعیت نسبی پایگاه­ها از روشی که «کلارک و ویلت» در سال 1997 پیشنهاد کرده بودند، استفاده شد. همان‌طور که نتایج نشان داد، جستجو در ایران مدکس، جامعیت نسبی بالاتری نسبت به دو پایگاه دیگر دارد.

از طرفی، استفاده از کلیدواژه­های اصطلاحنامه پزشکی فارسی، مسائل دیگری را در این پژوهش مورد توجه قرار داد. تصور می‌شد استفاده از اصطلاحات انتخاب شده می‌تواند ملاک مناسبی برای انتخاب کلیدواژه برای انجام جستجو باشد؛ اما در همان ابتدا مشاهده شد که در برخی موارد، حاصل جستجو با کلیدواژه نامرجح، نسبت به نتایج جستجو با کلیدواژه مرجح، جامع تر به نظر می رسد. پس از مقایسه میان جامعیت نسبی حاصل از جستجوی کلیدواژه­های مرجح و نامرجح، مشخص شد در هر سه پایگاه، با استفاده از کلیدواژه­های نامرجح، جستجوی جامع تری را خواهیم داشت.

گفتنی است، مقایسه­ای که میان کلیدواژه­های مرجح و نامرجح انجام شد، تنها محدود به هفت کلیدواژه بود که در این پژوهش کلیدواژه­های نامرجح آنها نیز مورد جستجو قرار گرفته بود. اینها مواردی بودند که کلیدواژه نامرجح آنها یا در اصطلاحنامه آمده و یا توسط پژوهشگر پیشنهاد شده بود. در حالی که اگر بخواهیم نتایج جستجوی تمامی موارد را بررسی کنیم، با کلیدواژه­هایی روبرو خواهیم شد که جستجوی آنها هیچ نتیجه­ای در بر ندارد؛ مانند کلیدواژه «پرستودانتیکس». در هیچ یک از پایگاه­‌ها مدرکی با این کلیدواژه در نتایج مشاهده نشد. در ساختار درختی اصطلاحنامه، اصطلاح «پروتز دندان» در زیر «پرستودانتیکس» به عنوان اصطلاح مرتبط ذکر شده است. در حالی که به نظر می‌رسد بهتر بود «پروتز دندان» در رأس قرار می‌گرفت و اصطلاحات «پروتز ثابت» و «پروتز متحرک» که جایشان در اصطلاحنامه کاملاً خالی است، به عنوان موضوعات اخص پیشنهاد می­شد. همچنین، مشاهده می­شود که استفاده از املای «ارتودنسی» (اصطلاح نامرجح) به جای «ارتدنسی» (اصطلاح مرجح) در هر سه پایگاه نتایج بیشتری را بازیابی می­کند.

 

پیشنهادهای پژوهش

با توجه به موارد فوق به نظر می­رسد لازم است اصطلاحنامة پزشکی فارسی، به عنوان تنها مرجع موجود برای نمایه­سازی متون فارسی در حوزه پزشکی، مورد تجدید نظر دوباره­ قرار گیرد و دقت بیشتری در انتخاب کلیدواژه­ها به کار رود. همچنین، پایگاه­هایی که به کار نمایه­سازی مجله‌های این حوزه مشغول هستند، برای حفظ یکدستی در نمایه‌سازی باید از کلیدواژه­های کنترل شده استفاده کنند. ضمناً پیشنهاد می­شود پژوهشهای مشابهی در سایر حوزه­های پزشکی انجام شود و جامعیت نسبی پایگاه­ها بر اساس کلیدواژه­های مرجح و نامرجح مورد مقایسه قرار گیرد.

 



1. Relevance.

2. Recall.

3. Precision.

1. www.magiran.com

2. www.iranmedex.com

3. www.sid.ir

1. Medline.

2. Pubmed.

3. CAB.

1. www.webgah.com

2. www.dahio.com

3. Bar_ilan.

1. Sarr.

2. Spellchecker.

3. Shafi & Rather.

4. www.scirus.com

5. Hotbot.

6. Bioweb.

7. O’ Grady.

8. National Center for Biotechnology Information (NCBI).

9. برنامه جستجوی کلیدواژه­ای

10.:Basic Local Alignment Search Tool برنامه­ای که از مجموعه­ای از سؤالهای آماده که شامل نام اسیدهای نوکلئیک و پروتین می‌باشد، استفاد می­کند و در بازیابی، رکورهایی را که شبیه به سؤال می­باشد، ارائه می‌دهد.

1. Gene database, RefSeq RAN collection, RefSeq Protein collection.

2. www.parsmedline.com

1. Relative recall.

- احمدی، حمید (1385). ارزیابی بازیابی اطلاعات. مجله الکترونیکی پژوهشگاه اطلاعات و مدارک علمی ایران (نما)، دوره 6، شماره 1. (بازیابی شده از طریق اینترنت ) 15 نوامبر 2008.   <http://www.irandoc.ac.ir/data/e_j/vol6/ahmadi.htm>

- ارشاد سرابی، رقیه (1380). «بررسی و مقایسه مدلاین های رایگان در وب». پایان‌نامه کارشناسی ارشد. دانشگاه علوم پزشکی ایرانی، دانشکده مدیریت و اطلاع‌رسانی پزشکی.

- اکبری، اسماعیل و پرویز شهریاری (1384). «تأثیر اختلاف املایی انگلیسی آمریکایی و بریتانیایی بر میزان جامعیت بازیابی اطلاعات». فصلنامه کتاب. شماره 63: 59-66.

- چشمه سهرابی، مظفر (1378). «تأثیر استفاده از اصطلاحنامه در بانکهای کتابشناختی بر میزان جامعیت، مانعیت و مدت زمان جستجوی اطلاعات بازیابی شده». پایان‌نامه کارشناسی ارشد. دانشگاه تربیت مدرس، دانشکده علوم انسانی.

- رهادوست، فاطمه، مریم کازرانی و دیگران (1377). «اصطلاحنامه پزشکی فارسی: نمایه درختی، نمایه الفبایی، نمایه گردشی، نمایه انگلیسی به فارسی». تهران: سازمان اسناد و کتابخانه ملی جمهوری اسلامی ایران. 2‍ج.

- شاکری، صدیقه (1387). میزان جامعیت و مانعیت ابزارهای کاوش فارسی اینترنت در بازیابی اطلاعات در حوزة کتابداری و اطلاع‌رسانی. فصلنامه کتاب. شماره 73: 177-200. (بازیابی شده از طریق اینترنت) 23 نوامبر 2008

 

- Bar-Ilan, J. (1998) “On the overlap, the precision and estimated recall of search engines. A case study of the query “ERDOS”” Scientometrics 42(2):207-228

 

- O’Grady, T. (2007) “Entrez and BLAST: precision and recall in searches of NCBI databases” Issues in Science & Technology Librarianship; Issue 52 viewed 20 Feb 2009, http://www.istl.org/07-fall/refereed2.html

 

- Sarr, M. (2004) “Improving precision and recall using a spellchecker in a search engine. Master’s thesis in computer science” M.A. Thesis, Stockholm University, department of numerical analysis and computer science royal institute of technology, Viewed 23 Nov 2008, <http://.www.dsv.su.se/ ~hercules/ papers/SarrNodalida 2003. pdf.>

 

- Shafi, S.M., Rather, R A. (2005) Precision and recall of five search engine for retrieval of scholarly information in the field of biotechnology. Webology 2(2) viewed 27 oct 2008, http://www.webology.ir/2005/v2n2/a12.htm

 

پیوست1. فهرست کلید واژه های استفاده شده در پژوهش

کلیدواژه‌هایی که در زیر هریک از 18 مورد اصلی آمده، موارد انتخاب نشده هستند و کلید واژه هایی که زیرخط‌دار می‌باشند، توسط پژوهشگر پیشنهاد شده و در اصطلاحنامه (به صورت انتخاب شده یا انتخاب نشده) وجود ندارد..

1.سیمانی کردن 1-دن

  • سمان
  • ·           سمنت

2.تجهیزات دندان پزشکی 2/دن

3.پیمایشهای دندان پزشکی 3/دن

4.مدل های دندان 4/ دن

5.جفت شدن دندان ها 5/ دن

  • اکلوژن دندان

6.دندان پزشکی ترمیمی 6-دن

7.تشخیص بیماری های دهان 7- دن

8.اندودانتیکس 8- دن

9.زیبایی در دندان پزشکی 9/ دن

  1. تون بخشی دهان 10- دن
  2. ارتدنسی 11- دن
  • ·           ارتودانتیکس
  • ·           ارتودنسی
  1. آسیب شناسی دهان 12- دن
  • ·           پاتولوژی دهان
  1. دندان پزشکی کودکان 13- دن
  • ·           پدودانتیکس
  • ·           دندانپزشکی اطفال
  1. پریودانتیکس 14- دن
  • ·           پریودنتیکس
  • ·           پریودنتولوژی
  1. دندان پزشکی پیشگیری 15- دن
  2. پرستودانتیکس 16- دن
  3. تکنولوژی دندان پزشکی 17- دن
  4. سفید کردن دندان 18- دن
  • بلیچینگ