مقایسه عملکرد موتورهای کاوش در هدایت کاربران به صفحات خانگی در پاسخ به پرسش های راهبری

نوع مقاله : مقاله پژوهشی

نویسندگان

1 دانشجوی دکتری علم اطلاعات و دانش‌شناسی دانشگاه آزاد اسلامی، واحد علوم و تحقیقات تهران، ایران.

2 دانشجوی دکترای علم اطلاعات و دانش‌شناسی، دانشگاه آزاد اسلامی، واحد علوم و تحقیقات تهران، ایران.

3 دانشیار گروه علم اطلاعات و دانش‌شناسی، دانشگاه آزاد اسلامی، واحد علوم و تحقیقات تهران، ایران

چکیده

جستجو برای پرسشهای اطلاعاتی مقایسه می‌کند. برای انجام این پژوهش، پنج موتور جستجوی گوگل، یاهو، بینگ، اسک و آ‌او‌ال بر پایة رتبه‌بندی موتورهای کاوش در سایت الکسا در انتخاب شدند. 100 پرسش به زبان فارسی همراه با عبارت دقیق پرسش، توصیف کوتاهی از نیاز اطلاعاتی و آدرس اینترنتی صفحه مورد نظر از یکایک دانشجویان گردآوری و سپس توسط پژوهشگر در قسمت جستجوی هر یک از موتورهای جستجوی مذکور وارد و موقعیت نتایج صحیح ثبت شد. اگر صفحه خانگی در میان ده نتیجة اول یافت نمی‌شد، جستجو متوقف می‌شد. برای محاسبة عملکرد بازیابی جهت پرسشهای راهبری، از سنجه‌های بازیابی متعددی نظیر سنجه موفقیت N و رتبه معکوس میانگین استفاده شده است. یافته‏های پژوهش نشان می‎دهند سه موتور جستجوی گوگل، آ‌او‌ال و اسک تقریباً با 96، 91 و 87% موفقیت در بازیابی، عملکرد نسبتاً خوبی در بازیابی پاسخ پرسشهای راهبری به زبان فارسی دارند، اما دو موتور جستجوی یاهو و بینگ تقریباً با 35 و 47% عدم موفقیت، عملکرد ضعیفی در بازیابی پاسخ پرسشهای راهبری به زبان فارسی دارند. اکثر نتایج به دست آمده توسط گوگل و اسک و آ‌او‌ال در رتبه اول صفحه نتایج قرار دارند. علاوه بر آن، همه موتور‌های جستجوی مورد نظر در این پژوهش از نتیجة اول به نتیجة پنجم پیشرفت دارند. به عبارت دیگر، آنها تقریباً در بیش از 90% موارد قادرند صفحات درخواستی خود را بدون مرور کردن نتایج ارائه شده در پایین فهرست نتایج ارائه شده به کاربر در اولین صفحه نتایج نشان دهند.
 

کلیدواژه‌ها


مقدمه

شبکه جهانی وب منبع عظیمی از اطلاعات است که به طور روز افزون بر حجم آن افزوده و امروزه به ابزاری ضروری در زندگی بسیاری از مردم تبدیل شده‌ است. موتورهای جستجو نیز مدخل اصلی ورود به آن به شمار می‌روند (وسترولد[4]، کراییژ[5] و هایمسترا[6]، 2001). موتورهای جستجو «ابزارهای شناخته‌ شده‌ای» برای دست‌یابی به اطلاعات، سایتهای اینترنتی و خدمات وبی هستند که بسیاری از مردم در زندگی روزانه خود از آنها استفاده می‌کنند (جانسن[7]، بوث[8] و اسپینک[9]، 2007). اهمیت موتورهای جستجو برای یافتن اطلاعات مرتبط در وب انکارناپذیر استبه طوری‏که نزدیک به 70% جستجوگران وب از یک موتور جستجو به عنوان نقطه شروع در دستیابی به اطلاعات استفاده می‌کنند. موتورهای جستجوی مهم، روزانه میلیونها پرسش از سوی کاربران دریافت می‌کنند و هر هفته در جواب پرسشهای مذکور چندین میلیون پاسخ بازیابی و در اختیار کاربران قرار داده می‌شود (سولیوان[10]، 2006).

پرس‌ و جو‌های وبی معمولاً به سه دسته تقسیم می‌شوند: اطلاعاتی[11]، راهبری[12] و تراکنشی[13]. در پرسشهای اطلاعاتی کاربران قصد دارند در مورد یک موضوع خاص اطلاعاتی پیدا کنند. چنین پرسشهایی اغلب به یک مجموعه از نتایج می‌انجامد تا تنها یک مدرک مناسب. پرسشهای اطلاعاتی شبیه پرسشهایی هستند که به سیستم‌های بازیابی اطلاعات مبتنی بر متن ارائه می‌گردند. برای مثال «ابولؤلؤ کیست؟» یک پرسش اطلاعاتی است که کاربر می‌خواهد در مورد یک موضوع خاص اطلاعاتی را به دست آورد. چنین پرسشهایی معمولاً صفحات وب ایستا را مورد هدف قرار می‌دهند. اصطلاح «ایستا» در این‏جا به این مسئله اشاره دارد که وقتی صفحه به کاربر ارائه می‌شود، تعامل بیشتری برای به دست آوردن اطلاعات درخواست شده لازم نیست (برودر[14]، 2002؛ نقل در مک‌فارلان[15]، 2007).

در یک پرسش تراکنشی، کاربران علاقه‌مند به یافتن مدرکی هستند که خدمات توصیف شده در پرسش تراکنشی را ارائه می‌دهد. نتایج پرس و جوهای تراکنشی وب‌سایتهایی هستند که برای رسیدن به مقصود، تعاملات بیشتری را طلب می‌کنند. تراکنش می‌تواند دانلود یک برنامه یا فایل، خرید یک محصول یا جستجوهای بعدی در یک سایت باشد. برای مثال، کاربری که برای بازیهای رایگان در وب جستجو می‌کند، تمایل دارد یا بازی را دانلود کند و یا به صورت آنلاین آن‏ را انجام دهد. در هر دو صورت، در سایت بازیابی شده تراکنش ضروری خواهد بود. کاربران از موتور جستجو به عنوان وسیله‌ای برای انجام تراکنش در تجارت الکترونیکی (مانند سیستم پرداخت گوگل[16]) استفاده می‌کنند. آنها در مقایسه با پاسخ مستقیم به یک نیاز اطلاعاتی با موضوع خاص، بیشتر دسترسی به محتوای مجموعه‌ای از عکس‌ها، موسیقی‌ها، ویدئوها و ... را فراهم می‌کنند. آنها همچنین امکان دسترسی به سرویسهای تراکنشی مانند نقشه‌ها، مزایده‌های آنلاین، راهنماهای رانندگی و حتی دیگر موتورهای جستجو را فراهم می‌کنند. در نتیجة، محققان توجه زیادی به کیفیت نتایج موتورهای جستجو دارند (رز و لوینسون، 2004) .

هرچند این رویکرد تا حدودی در مورد جستجوگران صدق می‌کند، یافته‌ها حکایت از آن دارد که کاربران در جستجوی وبی پرسشهای خود را به منظور دیگری هم طرح می‌کنند (جانسون، بوث و اسپینک[17]، 2008)؛ به منظور هدایت شدن به صفحة وب خاصی که از پیش می‌شناسند یا گمان می‌کنند وجود دارد. این وب‌سایت می‌تواند متعلق به یک شخص یا سازمان باشد. موفقیت این نوع پرسشها عامل موفقیت مهمی برای موتورهای جستجوی وب است. برای مثال «آدرس اینترنتی سایت بیمارستان علوم پزشکی تهران؟» یا «بیمارستان علوم پزشکی تهران» یک پرسش راهبری است که هدف از طرح آن یافتن صفحه وب ورودی دانشگاه علوم پزشکی تهران است. ملاک قضاوت دربارة نتایج بازیابی شده آن است که آیا این صفحه، صفحه‌ای است که به دنبال آن بوده است؟ آیا این صفحه‌خانگی همان است که مّدنظر وی بوده یا او آن را نامگذاری کرده است؟ (حریری[18]، 2010).

پرسشهای راهبری اغلب تنها با یک نتیجة پاسخ داده می‌شوند و به محض اینکه نتیجة درست پیدا شود، نیاز اطلاعاتی شخص برطرف می‌شود. با این حال، همة پرسشها برای جستجوی افراد راهبری نیستند. «روز و لوینسون[19]» (2004) معتقدند بیشتر پرسشهایی که برای جستجوی افراد انجام می‌گیرند، راهبری نیستند. بنا به اظهارات آنها «در جستجو برای افراد مشهوری نظیر کامرون دیاز یا بن‌افلک نتایج متفاوتی از سایتهای هواداران، سایتهای رسانه‌ها و نظایر آن بازیابی خواهد شد. به عبارت دیگر، احتمال اینکه کاربری که نام یک فرد مشهور را به عنوان یک پرسش جستجو می‌کند قصد دیدن یک سایت خاص را داشته باشد، کم است.» این مورد ممکن است درست باشد، اما از سوی دیگر این پرسشها را نمی‌توان به عنوان پرسشهای اطلاعاتی در نظر گرفت، زیرا نمی‌توان فرض کرد که کاربر می‌خواهد اسناد و مدارک مختلفی را در این مورد مطالعه کند. آنچه می‌توان تصور کرد آن است که این پرسشها چیزی بین پرسشهای اطلاعاتی و راهبری هستند (لواندوسکی، درچسلر و ماچ، 2012).

مفهوم پرسشهای راهبری مبتنی است بر جستجوی اقلام مشخص شده در مجموعه‌های کتابخانه‌ای یا به صورت کلی‌تر، مبتنی است بر تفکیک نیازهای اطلاعاتی مسئله – محور و نیازهای اطلاعاتی عینی. در پرسشهای راهبری، کاربر اثر موجود در یک مجموعه را می‌شناسد و می‌خواهد همان اثر را بازیابی کند. بنابراین، تنها یک نتیجه، نتیجة مرتبط است و زمانی جستجو کامل می‌شود که اثر مورد نظر پیدا شود. راهبری می‌تواند به یک سایت تراکنشی باشد یا راهبری به یک سایت اطلاعاتی. از لحاظ یک موتور جستجو، هدف بردن کاربر به وب‌سایت مناسب است. طبیعتاً از دید کاربر، زمانی که وی به یک مقصد خاص می‌رسد، ممکن است سایر هدفهایش را دنبال کند. بنابراین، کاربر می‌تواند جستجوی راهبری را به عنوان وسیله‌ای برای رسیدن به هدفهای بزرگتر جستجو در نظر بگیرد (بلکین[20] و دیگران، 1982).

 
بیان مسئله

درحالی که شمار دقیق نسبت پرسشهای راهبری در بررسی‌های گوناگون متفاوت است، نتیجة مسلم همه مطالعات آن است که پرسشهای راهبری شمار قابل توجهی از پرسشها را به خود اختصاص داده‌اند (هاوکینگ و کراسول[21]، 2004). اصطلاح متفاوتی که برای این نوع پرسشها وجود دارد «پیدا کردن صفحه خانگی[22]» است(لواندوسکی[23]،2008). به دلیل آنکه در بیشتر موارد صفحه خانگی، اولین صفحه‌ای است که کاربران خواهند دید، این صفحه اهمیت بالایی دارد. علاوه بر آن، صفحة خانگی زمینة آشنایی با سایت، طراح و محتوای آن را فراهم می‌سازد؛ معمولاً به صفحات دیگر سایت لینک می‌دهد و امکان دسترسی به دیگر امکانات سایت مانند جستجو را فراهم می‌سازد. یو‌آر‌ال صفحة خانگی، اغلب به عنوان یو‌آر‌ال تمام سایت فرض می‌شود (هاوکینگ و کراسول، 2004). 

از طرف دیگر، نمایه این موتورها با هم متفاوت هستند، و تمام مدارک موجود در شبکه در نمایه یک موتور موجود نیست (اسمیت، 2001) همچنین، مدارکی که از طریق یک موتور جستجو یافت می‌شود، ممکن است توسط موتور دیگر به دست نیاید. هنگام جستجو در وب، نظر به اینکه کاربران نمی‌توانند مقایسه‏ای نظام‌مند از نتایج موتورهای جستجوی مختلف داشته باشند، باید صرفاً بر مشاهدات خود تکیه کنند. به علاوه، از آنجا ‌که آنها معمولاً یک یا چند نتیجة را برای یک پرسش مورد توجه قرار می‌دهند، باید به برداشت خود از فهرست نتایج اعتماد کنند (گرانکا، جوچییمز و گی[24]، 2004؛ کین، ابراین و اسمایف[25]، 2008).

با توجه به پوشش متنوع موضوعی در نمایه موتورهای جستجو و تحقیقاتی که تا حال بر روی موتورهای جستجو در مورد توانایی پاسخگویی آنها به سؤالهای مختلف انجام شده است، می‌توان انتظار داشت این موتورها توانایی پاسخگویی به سؤالها را داشته باشند. از سوی دیگر، ارزیابی‌ها در مورد عملکرد موتورهای کاوش در بازیابی برای پرسشهای اطلاعاتی نشان می‌دهد گوگل در این زمینه پیشتاز است (لواندوسکی،2008). گوگل بالاترین نسبت از شرح نتایج مرتبط را ارائه می‌دهد و کاربران آن ‌را بهترین موتور جستجو می‌دانند (ماچایل[26] و دیگران، 2003؛ اسچمایدمینز و بومهاردت[27]، 2005). اما در مورد سؤالهای راهبری وضعیت چگونه است؟ آیا در جستجوی سؤالهای راهبری نیز گوگل بهترین عملکرد را دارد؟

 
فرضیة‌ پژوهش

برای این پژوهش، فرضیه‌ای به شکل ذیل مطرح می‌گردد:

در بازیابی پاسخ پرسشهای راهبری، موتور جستجوی گوگل نسبت به سایر موتورهای جستجوی مورد استفاده در این پژوهش، بهترین عملکرد را دارد.

 
پرسشهای پژوهش

برای این پژوهش چهار پرسش به شکل ذیل مطرح می‌گردد.

1. پاسخ چه تعداد و چند درصد از پرسشهای راهبری ارائه شده به موتورهای جستجوی مورد نظر در این پژوهش، بازیابی می‌‌گردد؟

2. کدام یک از موتورهای جستجوی مورد نظر در این پژوهش، پاسخ پرسشهای راهبری را در رتبه اول فهرست نتایج بازیابی شده ارائه می‌دهند؟

3. موقعیت نتایج بازیابی شده توسط موتور‌های جستجوی مورد نظر در این پژوهش چگونه است؟

4.     در پاسخ به پرسشهای راهبری، نسبت یافته‌ها در موتورهای جستجوی مورد نظر در این پژوهش چگونه است؟

 
پیشینة پژوهش

بررسیهای زیادی در مورد عملکرد بازیابی در موتورهای جستجوی وب انجام شده است. با این حال، در اکثر موارد در این بررسی‌ها از پرسشهای اطلاعاتی استفاده شده است. پرسشهای اطلاعاتی، پرسشهایی هستند که کاربر می‌خواهد حداقل چند مدرک را در مورد موضوع مورد جستجوی خود پیدا کند. نیاز اطلاعاتی معمولاً با یک نتیجة برطرف نمی‌شود و کاربر پیشاپیش نمی‌داند که کدام مدرک (یا در محیط وب، کدام صفحه) بهترین نتیجة را به دست می‌دهد.

«آزادی» (1384) در پژوهشی با عنوان «میزان دقت موتورهای کاوش وب در بازیابی اطلاعات کتابداری و اطلاع‏رسانی» نحوة عملکرد 7 موتور کاوش را بررسی کرد. نتایج نشان داد اختلاف معناداری در میزان دقت موتورهای کاوش مورد بررسی در بازیابی‏ اطلاعات کتابداری و اطلاع‏رسانی وجود ندارد. در این پژوهش، موتورهای کاوش از نظر دقت به این ترتیب رتبه‏بندی‏ شدند: اینفوسیک[28]، هات‌بات[29]،گوگل، آلتاویستا[30]، اکسایت[31]، لایکاس[32] و وب‌کراولر[33].

«کمیجانی» (1381) در پایان‏نامة خود با عنوان «مقایسه‏ کارآیی موتورهای کاوش عمومی و تخصصی وب در بازیابی‏ اطلاعات کشاورزی» 5 موتور کاوش وب شامل‏ اگری‌سرف[34]، وب‌اگری[35]، گوگل، لایکاس و یاهو را در بازیابی اطلاعات تخصصی‏ حوزة کشاورزی با هم مقایسه کرد. این مقایسه نشان داد در معیار ارتباط و اعتبار، سه موتور کاوش گوگل، لایکاس و یاهو به ترتیب رتبه اول تا سوم را داشتند و موتورهای کاوش تخصصی کشاورزی در رتبه‎های آخر بودند.

«شیلکتینگ و نیلسن»[36] (1966) چهار موتور جستجوی‏ پر استفاده در وب جهانگستر شامل لایکاس، آلتاویستا، اکسایت و اینفوسیک را ارزشیابی کردند. ساده‏ترین گزارش از یافته‏ها این‏ بود که از مجموع 200 پیوند ارائه شده با پنج جستجو، در مجموع 54 پیوند مربوط به موضوع پیدا شد. لایکاس بیشترین‏ پیوندهای مربوط را با 19 مورد پیدا کرد. اکسایت با 14 مورد، اینفوسیک با 12 مورد و آلتاویستا با 9 مورد پیوند مربوط، در ردیفهای بعدی قرار داشتند.

«گانگ‌وو و جی‌لی»[37]‏ (1999) هفت‏ موتور جستجوی آلتاویستا، اینفوسیک، اکسایت، نورثرن‌لایت[38]، یاهو، هات‌بات، و مدیکال ورلد سرچ‏[39] را مقایسه کردند تا کارایی آنها را در پاسخگویی به سؤالهای کاربران علوم بهداشتی‏ بسنجند. آنها سه موتور جستجوی اینفوسیک، آلتاویستا و اکسایت را به عنوان موتورهای کاوش رده بالا رتبه‏بندی کردند. این‏ موتورها در مجموع از نظر روزآمد بودن منابع اطلاعاتی و ویژگیهای پیشرفتة جستجو، عملکرد خوبی داشتند. یاهو و نورثرن لایت برای جستجوی منابع دارویی و محصولات‏ طبیعی موتورهای خوبی بودند، ولی همچنین دارای بالاترین تعداد پیوندهای غیرفعال می‌باشند. هات بات پوشش جامع و ویژگیهای جستجوی پیشرفته را دارد و موتور خوبی برای‏ جستجوی تصاویر و فایلهای چندرسانه‏ای ا‏ست، اما مشکل‏ پیوندهای تکراری در این موتور کاوش به چشم می‏خورد. همچنین، این مطالعه نشان داد حتی با استفاده از بهترین‏ موتورهای کاوش، فقط نیمی از موارد بازیابی شده، مرتبط خواهند بود.

«مارتینز و سانچه»[40] در مقاله‏ای با عنوان «مقایسه‏ای بین‏ ابزارهای جستجوی اینترنت» ده موتور کاوش را برای تحقیق‏ انتخاب کردند. در این پژوهش، امکانات مختلف جستجو مانند عملکرد بولی،کوتاه‏سازی، استفاده از پرانتز و امکانات‏ پیشرفته نظیر اصلاح نتیجة جستجو، جستجو در فیلدهای‏ خاص، امکان محدود کردن موضوع و نیز زبان کنترل‏شده، مقایسه و ارزیابی شد. آنها به این نتیجه رسیدند که هیچ‏ رابطه‏ای میان رایج و عامه‏پسند بودن ابزارهای کاوش مورد مطالعه با امکانات جستجوی اطلاعات آنها وجود ندارد. دو نمونة آشکار در راهنمای موضوعی یاهو و موتور کاوش نورثرن‌لایت قابل مشاهده است. اگرچه موتور کاهش نورثرن‌لایت از نظر درجه مقبولیت آخرین رتبه را دارد، در فهرست‏ رتبه‏بندی امکانات جستجو اولین رتبه را از آن خود کرد.حال‏ آنکه یاهو که از رایج‏ترین و عامه‏پسندترین ابزارهای کاوش‏ است، از لحاظ بازیابی اطلاعات رتبة بالایی را کسب نکرده است (به نقل از آزادی، 1384)‏.

«برودر»(2004) بر پایة تحلیل لاگ‌فایل‌ها و بررسی کاربران موتور جستجوی آلتاویستا، دریافت که هر یک از انواع پرسشها نمایندة شمار قابل توجهی از کل جستجوهاست. پرسشهای راهبری 20 تا 5/24٪، پرسشهای اطلاعاتی 39 تا 48%، و پرسشهای تراکنشی 22 تا 36% از کل پرسشها را شامل می‌شوند.

«رز و لوینسون»[41] (2004) تعریفهای مختلفی از پرسشهای راهبری و تراکنشی ارائه داده‌اند. با توجه به بررسی رز،پرسشهای اطلاعاتی 61 تا 63% ، پرسشهای تراکنشی 21 تا 27% و پرسشهای اطلاعاتی 11 تا 15% از کل پرسشها را شامل می‌شوند.

«لواندووسکی» (2006) در یک بررسی که از داده‌های مربوط به سه موتور جستجوی آلمانی استفاده شد، دریافت که پرسشهای راهبری 40% کل پرسشها را تشکل می‌دهند.

 

روش‎شناسی پژوهش

در این پژوهش، از دو روش متفاوت استفاده شده است. برای‏ پیدا کردن موتورهای کاوش عمومی وب که کاربرد بیشتری‏ دارند، از روش‏ اسنادی یا کتابخانه‏ای‏ و برای سنجش میزان دقت‏ موتورهای کاوش، از روش مقایسه‏ای‏استفاده شده است.

برای انجام مقایسه، پنج موتور جستجوی گوگل، یاهو، بینگ،اسک و موتور جستجویآ‌او‌ال بر پایة این شرط که باید نمایه شخصی خود را داشته باشند، انتخاب شدند.

Google        https://www.google.com/
Yahoo         http://search.yahoo.com/
Bing            http://www.bing.com
Ask             http://www.ask.com/
AOL           http://www.aol.com/

این ابزارهای کاوش در دسته موتورهای کاوش عمومی و جزء پر استفاده‏ترین آنها هستند. راهنماهای موضوعی، ابر‌موتورهای کاوش، و موتورهای کاوش کم استفاده، در این‏ جامعه وارد نشده‏اند. برای انتخاب موتورهای کاوش از رتبه‌بندی موتورهای کاوش در سایت الکسا[42]استفاده شد. سایت الکسا یک سایت رتبه‌بندی سایتها بر اساس میزان ترافیک مصرفی آنهاست؛ به این معنا که متناسب با میزان پهنای باند مصرفی، رتبه سایت را مشخص می‌کند. رتبه‌ها از ۱ شروع شده و تا اعدادی حدود ۱۰ میلیون ادامه دارد. در این سایت، برعکس پیج رنک، هرچه عدد پایین‏تر باشد بهتر است؛ یعنی رتبه‌هایی که به یک نزدیکتر، سایتهایی با میزان بازدید بیشتری هستند. البته، ذکر این نکته لازم است که لزوماً ترافیک سایت تابعی از تعداد بازدید نیست، اما برای به دست آوردن یک تقریب، معیار خوبی است (الکسا، 2012).

برای جمع‌آوری اطلاعات، نخست مفهوم پرسشهای راهبری برای گروهی از دانشجویان دانشگاه تهران تعریف و از آنها خواسته شد آخرین پرسشهایی از این دست را که در موتور جستجو استفاده کرده‌اند، ارائه کنند. 100 پرسش به زبان فارسی همراه عبارت دقیق پرسش، توصیف کوتاهی از نیاز اطلاعاتی و آدرس اینترنتی صفحه مورد نظر، از یکایک دانشجویان گردآوری شد.

تمامی پرسشها توسط پژوهشگر در قسمت جستجوی هر یک از موتورهای جستجوی مورد بررسی وارد و موقعیت نتایج صحیح ثبت شد. اگر صفحه درست میان 10 نتیجة اول یافت نمی‌شد، جستجو متوقف می‌شد.

 برخلاف بررسی‌هایی که در مورد پرسشهای اطلاعاتی انجام شده است، قضاوت در مورد ربط نتایج در این مطالعه مشکل‌ نیست، زیرا واضح است که کدام نتیجة مرتبط و کدام نتیجة نامرتبط است.

بعضی از شرکتهای بزرگ، صفحات خانگی منطقه‌ای یا مختص به یک زبان را ایجاد می‌کنند. از آنجا که پرسشهای مطرح شده در این پژوهش به زبان فارسی هستند، فقط صفحة خانگی فارسی مورد نظر است.

در این پژوهش، صفحه درخواستی، صفحه‌ای تعریف شده است که دقیقاً با آدرس اینترنتی که کاربر تعیین کرده است مطابقت دارد؛ یا صفحه‌ای است که با تمامی معیارهای مدنظر کاربر در توصیف نیاز اطلاعاتی او مطابقت دارد. برای پرسشهای راهبری، مقیاسهای مختلفی را که در پژوهش «هاوکینگ و کراسول» (2005) تشریح شده است، برای داده‌ها محاسبه شده است. به منظور محاسبة عملکرد بازیابی برای پرسشهای راهبری، از سنجه‌های بازیابی متعددی نظیر سنجه موفقیت N [43] و رتبه معکوس میانگین[44] که در پژوهش‌های مک‌فارلان (2007)، کراسول و هاوکینگ[45] (2005) به کار گرفته شده، استفاده شد.

 
یافته‌ها

نمودار 1، تعداد و درصد سؤالهای راهبری پاسخ داده شده توسط پنج موتور جستجوی گوگل،یاهو، بینگ،اسکو موتور جستجویآ‌او‌ال را نشان می‌دهد. از کل پرسشهای ارائه شده به موتورهای جستجو، بیشترین درصد بازیابی با 8/95٪ (96 سوال) متعلق به موتور جستجوی گوگل می‌باشد. ضعیف‌ترین عملکرد با 2/59٪ (68 سؤال) و 9/64٪ (74 سؤال) به ترتیب به دو موتور جستجوی بینگ و یاهو تعلق دارند.

 
 
 
 
 
 

نمودار 1. عملکرد هر یک از موتورهای جستجو در پاسخ به سؤالها

 

از مجموع 100 سؤال راهبری ارائه شده به موتورهای جستجو، تنها پاسخ 60٪ آنها توسط همه موتورهای جستجو بازیابی شده است (جدول 1). از سویی دیگر، هیچ یک از موتورهای جستجوی مذکور قادر به یافتن پاسخی برای 2٪ از پرسشها نبوده‌اند. جزئیات مربوط به عملکرد کلی موتورهای جستجو، در جدول 1 قابل مشاهده است.

 

جدول 1. عملکرد کلی موتورهای جستجو

پرسشها

موتورهای جستجو

پاسخ داده شده

بدون پاسخ
فراوانی
درصد
فراوانی
درصد
هیچ کدام
-
-
2

یک موتور جستجو

2
-
-

دو موتور جستجو

2
-
-

سه موتور جستجو

24
24٪
-
-

چهار موتور جستجو

10
10٪
-
-

پنج موتور جستجو

60
60٪
-
-

داده‌های جدول 2 نشان می‌دهد در مجموع موتور جستجوی گوگل با 96٪ بهترین عملکرد را در بازیابی به خود اخنتصاص می‌دهد و موتور جستجوی آ‌او‌ال و اسک به ترتیب با 92٪ و 88٪ در رتبه‌های بعدی قرار دارند. در موتور جستجوی گوگل از مجموع 96 مورد پاسخ بازیابی شده 92/72٪ آن در رتبه اول فهرست نتایج بازیابی شده قرار دارد و از لحاظ قرار گرفتن نتایج در رتبه اول فهرست نتایج بازیابی شده، بهترین عملکرد را به خود نسبت داده است. دو موتور جستجوی اسک و آ‌او‌ال به ترتیب با 18/68٪ و 39/67٪ مورد پاسخ بازیابی شده در رتبه اول فهرست نتایج در مقامهای بعدی قرار دارند. همچنین، موتور جستجوی بینگ و یاهو به ترتیب با 06/47٪ و 54/40٪ در قرار دادن صفحات درخواستی در رتبه‌ اول موفق عمل کرده‌اند و در مقامهای بعدی قرار دارند.

 

جدول 2. تعداد کلی نتایج بازیابی شده در رتبه‌های اول تا دهم

موتور جستجو
Google
Yahoo
Bing
Ask
Aol
رتبه
فراوانی
افزایش
درصد
فراوانی
افزایش
درصد
فراوانی
افزایش
درصد
فراوانی
افزایش
درصد
فراوانی
افزایش
درصد
رتبه 1
70
-
92/72
30
-
54/40
32
-
06/47
60
-
18/68
62
-
39/67
رتبه 2
78
8
25/81
58
28
38/78
50
18
53/73
68
8
27/77
74
12
43/80
رتبه 3
88
10
67/91
64
6
49/86
56
6
35/82
76
8
36/86
82
8
13/89
رتبه 4
94
6
92/97
70
6
59/94
62
6
18/91
82
6
18/93
88
6
65/95
رتبه 5
96
2
100
72
2
30/97
64
2
12/94
86
4
73/97
90
2
83/97
رتبه 6
96
0
100
72
0
30/97
64
0
12/94
86
0
73/97
90
0
83/97
رتبه 7
96
0
100
72
0
30/97
64
0
12/94
86
0
73/97
90
0
83/97
رتبه 8
96
0
100
72
0
30/97
64
0
12/94
86
0
73/97
90
0
83/97
رتبه 9
96
0
100
72
0
30/97
66
2
06/97
86
0
73/97
90
0
83/97
رتبه 10
96
0
100
74
2
100
68
2
100
88
2
100
92
2
100
درصد بازیابی
96٪
74٪
68٪
88٪
92٪
 

نمودار 2 تعداد دفعات قرار گرفتن پاسخ پرسشهای راهبری در رتبة اول تا دهم، برای هر یک از موتورهای جستجو را نشان می‌دهد. همان‌طور که در نمودار مذکور قابل مشاهده است، در اکثر این موتورهای جستجو از رتبه‌های چهارم به بعد شیب نمودار بسیار کم و گاه صفر می‌گردد. در برخی از این موتورهای جستجو نظیر گوگل و آ‌او‌ال و اسک، تعداد نتایج ظاهر شده در رتبه‌های اول بالاست و از رتبه‌های چهارم به بعد در تعداد نتایج مورد نظر بهبود چندانی حاصل نمی‌شود. در دو موتور جستجوی یاهو و بینگ، میزان نمایان شدن صفحات درخواستی در رتبه‌های دوم قابل توجه است.

 

نمودار 2. عملکرد موتورهای جستجو در بازیابی صفحات درخواستی در رتبه‌های اول تا دهم

 

چنان که در جدول 3 ملاحظه می‌شود، با در نظر گرفتن 5 و 10 نتیجة اول فهرست نتایج بازیابی شده، کمترین درصدها به ترتیب با 14/27٪ و 14/37٪ به موتور جستجوی گوگل و بیشترین درصدها به ترتیب با 140٪ و 67/146٪ به موتور جستجوی یاهو تعلق دارند. این بدان معناست که با در نظر گرفتن تعداد نتایج بیشتر، بهبود قابل توجهی در نتایج بازیابی شده توسط موتور جستجوی گوگل حاصل نشده است بر عکس، در موتور جستجوی یاهو در تعداد نتایج بازیابی شده، بهبود نسبتاً خوبی حاصل شده است. نسبت یافته‏ها در موتورهایی که درصد پایین‏تری از نتایج دلخواه را در رتبه اول قرار می‎دهند، بالاتر است.

 

جدول 3. نسبت بازیابی موتورهای کاوش با در نظر گرفتن تعداد نتایج مختلف

موتور جستجو
Google
Yahoo
Bing
Ask
Aol

نسبت یافته‌ها[46]

درصد
درصد
درصد
درصد
درصد
اولین ‌به پنجمین
14/37٪
140٪
100٪
33/43٪
16/45٪
اولین به دهمین
14/27٪
67/146٪
5/112٪
67/46٪
39/48٪
پنجمین به ‌دهمین
0
78/2٪
25/6٪
33/2٪
22/2٪
 

برای محاسبة عملکرد بازیابی برای پرسشهای راهبری، از شاخصهای بازیابی متعددی نظیر سنجه موفقیت N و رتبه معکوس میانگین که در پژوهشهای مک‌فارلان (2007)، کراسول و هاوکینگ (2005) به کار گرفته شده، استفاده می‌کنیم. نمودار 3 نشان‌دهندة شاخص موفقیت N برای بیان میزان اثربخشی موتورهای جستجوست. همان‏طور که در نمودار مذکور مشاهد می‌شود، با در نظر گرفتن نتیجة اول، موتور جستجوی گوگل دارای بهترین و موتور جستجوی یاهو دارای بدترین شاخص موفقیت می‌باشد (70/0 و 30/0). با در نظر گرفتن 5 نتیجة اول، موتورهای جستجوی گوگل و بینگ به ترتیب با 96/0 و 64/0 دارای بهترین و بدترین میزان بازیابی هستند و با در نظر گرفتن 10 نتیجة اول، موتور جستجوی گوگل و بینگ با 96/0 و 68/0 دارای بهترین و بدترین میزان اثربخشی می‌باشند. مقادیر به دست آمده برای موتور‌های جستجو که در جدول 4 نتایج بیان شده برای سنجه موفقیت N را تأیید می‌نمایند. علاوه بر آن، رتبه معکوس میانگین پنج موتور جستجوی مورد استفاده در این پژوهش، در جدول 4 نشان داده شده است. بیشترین مقدار متعلق به موتور جستجوی گوگل (79/0) و کمترین مقدار متعلق به موتور جستجوی بینگ(45/0) می‌باشد.

 

نمودار 3. میزان موفقیت در ارائه نتایج توسط موتورهای جستجو

 

جدول 4. وضعیت بازیابی موتورهای جستجو در رتبه‌های مختلف

موتورهای کاوش
رتبه
معکوس
میانگین
رتبه اول
رتبه اول تا پنجم
رتبه اول تا دهم
موفقیت
عدم موفقیت
موفقیت
عدم موفقیت
موفقیت
عدم موفقیت
Google
79/0
70/0
30/0
96/0
04/0
96/0
04/0
Yahoo
48/0
30/0
70/0
72/0
28/0
84/0
36/0
Bing
45/0
32/0
68/0
64/0
36/0
68/0
32/0
Ask
69/0
60/0
40/0
86/0
34/0
88/0
12/0
Aol
73/0
62/0
38/0
90/0
10/0
92/0
08/0
 

بنابراین، با توجه به مقادیر شاخص موفقیت N و رتبة معکوس میانگین به دست آمده برای موتور جستجوی گوگل، فرضیة پژوهش مبنی بر اینکه «در بازیابی پاسخ پرسشهای راهبری، موتور جستجوی گوگل نسبت به سایر موتورهای جستجوی مورد استفاده در این پژوهش بیشترین اثربخشی را دارد» تأیید می‌گردد.

 
بحث و نتیجه‏گیری

یافته‏های پژوهش نشان می‏دهند سه موتور جستجوی گوگل، آ‌او‌ال و اسک تقریباً با 96، 91 و 87% موفقیت در بازیابی، عملکرد نسبتاً خوبی در بازیابی پاسخ پرسشهای راهبری به زبان فارسی دارند، اما دو موتور جستجوی یاهو و بینگ تقریباً با 35 و 47% عدم موفقیت، عملکرد ضعیفی در بازیابی پاسخ پرسشهای راهبری به زبان فارسی دارند. یافته‌های ما در مورد عملکرد موتور جستجوی گوگل در بازیابی سؤالهای راهبری، با یافته‌های لواندوسکی (2008) همسوست، اما با نتایج ارائه شده برای موتور جستجوی یاهو همسویی ندارد. این نکته که موتور جستجوی گوگل در بازیابی پاسخ پرسشهای راهبری به زبان دیگری غیر از زبان انگلیسی عملکرد خوبی دارد، حایز اهمیت است. از بین 100 سوال ارائه شده به موتورهای جستجو، تنها 2 سؤال وجود داشت که هیچ یک از موتورهای جستجو مورد استفاده در این پژوهش قادر نبودند پاسخی برای آنها بیابند. از سویی دیگر، تنها 60٪ کل پرسشها توسط همة موتورهای جستجو پاسخ داده شدند. هر چند درصد سؤالهای که پاسخ آنها توسط همه پنج موتور جستجو بازیابی می‌شوند نسبتاً بالاست، باید به این‌نکته توجه داشت که حدود 40٪ سؤالهای مورد استفاده در این پژوهش هستند که تنها بعضی از موتورهای جستجو توانستند به آن پاسخ گویند. شاید یکی از دلایل آن نمایه‌ نشدن صفحات وب فارسی توسط آن موتورهای جستجو باشد. یکی از نکات کاربری قابل استنباط از یافته‌های این بخش آن است که کاربران هنگام مواجه شدن با ناکامی در استفاده از موتور جستجویی خاص، برای نیل به پاسخ مناسب می‌توانند از دیگر موتورهای جستجو نیز استفاده کنند.  

نکتة دیگری که از نتایج به دست آمده قابل استنباط است، آن است که نتایجی که توسط گوگل و اسک و آ‌او‌ال به دست آمده‏اند، اغلب در رتبه اول صفحه نتایج قرار دارند. علاوه بر آن، همة موتور‌های جستجوی مورد نظر در این پژوهش از نتیجة اول به نتیجة پنجم پیشرفت دارند. به عبارت دیگر، آنها تقریباً در بیش از 90% موارد قادرند صفحات درخواستی خود را بدون مرور کردن نتایج ارائه شده در پایین فهرست نتایج ارائه شده به کاربر در اولین صفحه نتایج نشان دهند. این مسئله در بازیابی سؤالهای راهبری با بهره‌گیری از موتورهای جستجو دارای اهمیت بسزایی است، زیرا کاربران به بررسی نتایجی که پایین‏تر از وسط اولین صفحه نمایش قرار دارند(گرانکا و همکاران، 2004)، یا حتی نتایجی که بعد از 10 نتیجة اول ارائه می‌گردند، تمایل چندانی ندارند. با در نظر گرفتن 10 نتیجة اول، عملکرد آ‌او‌ال و اسک در بازیابی پاسخ سؤالهای راهبری به عملکرد موتور جستجوی گوگل بسیار نزدیک می‌باشند. اما اگر رتبه‌های اول مد نظر قرار گیرد، عملکرد این موتورهای جستجو ضعیف‌تر است و موتور جستجوی آ‌او‌ال درصد کمتری از صفحات درخواستی را بازیابی می‌کند. اگر چه موتورهای جستجوی یاهو و بینگ در قرار دادن صفحات درخواستی در رتبه اول فهرست رکوردهای بازیابی شده موفق عمل نکرده‌اند (54/40٪ و 06/47٪) با این‏حال، با در نظر گرفتن رتبه‌های دوم، عملکرد این موتورها بهبود قابل توجهی می‌یابد و در صورتی که کل 10 نتیجة بازیابی شده در نظر گرفته شود، این موتورها نیز عملکرد نسبتاً بالایی دارند. با توجه به اهمیت قرار دادن صفحه درخواستی در مکان اول، این نتیجه قابل استنباط است که مشکل بسیاری از موتور‌های جستجو، پیدا کردن صفحه درخواستی نیست، بلکه رتبه‌بندی آن بر اساس نیت کاربر است.

هر چند دو موتور جستجوی یاهو و بینگ در مقایسه با سه موتور جستجوی دیگر مورد استفاده در این پژوهش عملکرد ضعیف‌تری دارند، با نگاهی به نتایج ارائه شده در جدول 2 می‌توان عملکرد آنها را خوب قلمداد کرد. درحالی که این موتورهای جستجو در مورد ارئه نتایج در رتبه اول نسبت به گوگل، اسک و آ‌او‌ال عملکرد بدتری داشته‌اند، اما با در نظر گرفتن چند نتیجه بعد آنها بهبود می‏یابد تا جایی که نسبت یافته‌های این موتورهای جستجو نشان‌دهنده افزایش بازیابی صفحات درخواستی در رتبه‌های بعدی در فهرست 5 و 10 نتیجه ارائه شده در صفحه اول می‌باشد (جدول 3).

طبق نتایج به دست آمده در این پژوهش، از آنجا که‌ در بازیابی پرسشهای راهبری به زبان فارسی توسط موتورهای جستجو اکثر نتایج در رتبه اول تا پنجم (جدول 2) صفحه نتایج قرار می‌گیرند، جستجو‌گری که دنبال یافتن پاسخ برای یک پرسش راهبری می‌باشد، چنانچه جواب مورد نظر خود را میان چند نتیجه اول پیدا نکند، نگاه کردن به صفحات بیشتر در فهرست نتایج بی‏حاصل است. بنابراین، چنین به نظر می‌رسد که جستجوگر باید دوباره پرسش خود را صورت‏بندی کند و از هدر دادن وقت برای مرور سایر نتایج بپرهیزد.

همان‌طور که انتظار می‌رفت، نسبت یافته‌ها در موتورهایی که درصد بالاتری از نتایج دلخواه را در رتبه اول فهرست نتایج قرار می‌دهند، پایین‌تر است. اکثر نتایجی که توسط گوگل و آ‌او‌ال و اسک به دست آمده‏اند، در رتبه اول صفحه نتایج قرار داشته‌اند و به همین علت نسبت یافته‏ها از رتبه اول نسبت به کل رتبه‏های بررسی شده بسیار پایین است. هر سه موتور جستجو از نتیجة اول به نتیجة دوم پیشرفت داشته‌اند، درحالی که موتورهای جستجوی یاهو و بینگ در مورد ارائه نتایج در رتبه اول نسبت به گوگل، اسک و آ‌او‌ال عملکرد بدتری داشته‌اند، اما با در نظر گرفتن چند نتیجة بعد آنها بهبود می‏یابد تا جایی که نسبت یافته‌های این موتورهای جستجو (از اول به دهم) به ترتیب 67/146% و 5/112% است که نشان‌دهندة افزایش بازیابی صفحات درخواستی در رتبه‌های بعدی در فهرست 10 نتیجه ارائه شده در صفحة اول است. به عبارت دیگر، در این دو موتور جستجو نتایج اغلب در انتهای فهرست نتایج بازیابی شده ظاهر می‌شوند. نکته دیگر آنکه در هر پنج موتور جستجوی مورد استفاده در این پژوهش، با آنکه نسبت یافته‌ها از اولین نتیجة به پنجمین نتیجة افزایش چشمگیری دارد، نسبت یافته‌ها از پنجمین نتیجة به دهمین نتیجة افزایش بسیار اندکی دارد. این امر حکایت از آن دارد که اغلب نتایج بازیابی شده در این موتورهای جستجو، در رتبه‌های اول تا پنجم ظاهر می‌شوند.

در کل، با توجه به نتایج به دست آمده در این پژوهش برای موتورهای جستجو، موتور جستجوی گوگل در بازیابی پاسخ پرسشهای راهبری نیز همانند پرسشهای اطلاعاتی دارای بهترین عملکرد است (جدول 4 و نمودار 3). این امر می‌تواند دلیلی برای پرسش باشد که چرا کاربران موتور جستجوی گوگل را به سایر موتورهای جستجو ترجیح می‌دهند.

-آزادی، قاسم (1384). میزان دقت موتورهای کاوش وب در بازیابی اطلاعات کتابداری و اطلاع‌رسانی. فصلنامه کتاب، 63: 111-122.
-کمیجانی، احمد (1381). مقایسة کارآیی موتورهای کاوش‏ عمومی و تخصصی وب در بازیابی اطلاعات کشاورزی. پایان‏نامه کارشناسی ارشد کتابداری و اطلاع‏رسانی، دانشکده‏ روانشناسی و علوم‌تربیتی، دانشگاه تهران.
-      Brooks, T.A. (2003), Web Search: how the Web has changed information retrieval. Information Research, 8(3), paper no. 154. Available at: http://informationr.net/ir/8-3/paper154.html. (accessed 9 July 2012).
-      Craswell, N. and Hawking, D. (2005), Overview of the TREC-2004 Web Track. Available at: trec.nist.gov/pubs/trec13/papers/WEB.OVERVIEW.pdf (accessed 9 July 2012).
-      Granka, L.A., Joachims, T. and Gay, G. (2004), Eye-tracking analysis of user behavior in WWW search, Proceedings of Sheffield SIGIR, Twenty-Seventh Annual International ACM SIGIR Conference on Research and Development in Information Retrieval, 56: 478-479. Available at:
http://www.summarization.com/~radev/767w10/papers/Week09/search_log_mining/Granka04.pdf (accessed 9 July 2012).
-      Hariri, N. (2011), Relevance ranking on Google: Are top ranked results really considered more relevant by the users?, nline Information Review, 35(4): 598 – 610. Available at:
-      Hawking, D. and Craswell, N. (2004), The Very Large Collection and Web Tracks. Available at: http://es.csiro.au/pubs/trecbook_for_website.pdf (accessed 9 July 2012).
-      Jansen, B. J, Booth, D.L and Spink A. (2007), Determining the user intent of web search engine queries. In: Proceedings of the 16th international conference on World Wide Web, ACM, New York, USA, 1149–1150. Available at:
-      Jansen, B.J., Booth, D.L., and Spink, A. (2008), Determining the informational, navigational, and transactional intent of Web queries, Information Processing & Management, 44(3): 1251-1266.
-      Kang, I.H., and Kim, G. (2003), Query type classification for web document retrieval. In: SIGIR 2003: Proceedings of the 26th annual international ACM SIGIR conference on Research and development in informaion retrieval, 64–71. ACM Press, New York. Available at:
-      Keane, M.T., O'Brien, M. and Smyth, B. (2008), Are people biased in their use of search engines?, Communications of the ACM, 51(2):49-52. Available at:
-      Kilgour, F.G. (1999), Retrieval effectiveness of surname-title-word searches for known items by academic library users, Journal of the American Society for Information Science, 50(3): 265-270. Available at:
http://onlinelibrary.wiley.com/store/10.1002/(SICI)1097-4571(1999)50:3%3C 265::AID-ASI9%3E3.0.CO;2-R/asset/9_ftp.pdf?v=1&t=h9e1mks2&s=02ed9b8c651d6268b6 00ccbbd033cf62408e6bd4. (accessed 9 July 2012).
-      Lewandowski, D. (2006), Query types and search topics of German Web search engine users, Information Services & Use, 26(4): 261-269. Available at:
-      Lewandowski, D. (2008), The Retrieval Effectiveness of Web Search Engines: Considering Results Descriptions, Journal of Documentation, 64(6): 915 - 937. Available at:
-      Lewandowski, D. and Höchstötter, N. (2008), Web Searching: A Quality Measurement Perspective.‌Available‌at: http://eprints.rclis.org/bitstream/10760/9595/1/LewHoech_Preprint.pdf. (accessed 9 July 2012).
-      Lewandowski, D., Drechsler, J. and Mach S.V. (2012). Deriving Query Intents from Web‌Search‌Engine‌Queries.‌Available at:
hamburg.de/fileadmin/user_upload/lewandowski/doc/JASIST Query_ Intents_ Preprint. pdf. (accessed 9 July 2012).
-      MacFarlane, A. (2007), Evaluation of Web search for the information practitioner, Aslib Proceedings: New Information Perspectives, 59(4-5): 352-366. Available at: www.emeraldinsight.com/journals.htm?articleid=1626450. (accessed 9 July 2012).
-      Westerveld, T., Kraaij, W. and Hiemstra, D. (2002), Retrieving web pages using content, links, URLs, and anchors. In: The Tenth Text REtrieval Conf (TREC-10), NIST SP 500-250: 663–672. Available at: