نوع مقاله : مقاله پژوهشی
نویسندگان
1 دانشجوی دکتری علم اطلاعات و دانششناسی دانشگاه آزاد اسلامی، واحد علوم و تحقیقات تهران، ایران.
2 دانشجوی دکترای علم اطلاعات و دانششناسی، دانشگاه آزاد اسلامی، واحد علوم و تحقیقات تهران، ایران.
3 دانشیار گروه علم اطلاعات و دانششناسی، دانشگاه آزاد اسلامی، واحد علوم و تحقیقات تهران، ایران
چکیده
کلیدواژهها
شبکه جهانی وب منبع عظیمی از اطلاعات است که به طور روز افزون بر حجم آن افزوده و امروزه به ابزاری ضروری در زندگی بسیاری از مردم تبدیل شده است. موتورهای جستجو نیز مدخل اصلی ورود به آن به شمار میروند (وسترولد[4]، کراییژ[5] و هایمسترا[6]، 2001). موتورهای جستجو «ابزارهای شناخته شدهای» برای دستیابی به اطلاعات، سایتهای اینترنتی و خدمات وبی هستند که بسیاری از مردم در زندگی روزانه خود از آنها استفاده میکنند (جانسن[7]، بوث[8] و اسپینک[9]، 2007). اهمیت موتورهای جستجو برای یافتن اطلاعات مرتبط در وب انکارناپذیر استبه طوریکه نزدیک به 70% جستجوگران وب از یک موتور جستجو به عنوان نقطه شروع در دستیابی به اطلاعات استفاده میکنند. موتورهای جستجوی مهم، روزانه میلیونها پرسش از سوی کاربران دریافت میکنند و هر هفته در جواب پرسشهای مذکور چندین میلیون پاسخ بازیابی و در اختیار کاربران قرار داده میشود (سولیوان[10]، 2006).
پرس و جوهای وبی معمولاً به سه دسته تقسیم میشوند: اطلاعاتی[11]، راهبری[12] و تراکنشی[13]. در پرسشهای اطلاعاتی کاربران قصد دارند در مورد یک موضوع خاص اطلاعاتی پیدا کنند. چنین پرسشهایی اغلب به یک مجموعه از نتایج میانجامد تا تنها یک مدرک مناسب. پرسشهای اطلاعاتی شبیه پرسشهایی هستند که به سیستمهای بازیابی اطلاعات مبتنی بر متن ارائه میگردند. برای مثال «ابولؤلؤ کیست؟» یک پرسش اطلاعاتی است که کاربر میخواهد در مورد یک موضوع خاص اطلاعاتی را به دست آورد. چنین پرسشهایی معمولاً صفحات وب ایستا را مورد هدف قرار میدهند. اصطلاح «ایستا» در اینجا به این مسئله اشاره دارد که وقتی صفحه به کاربر ارائه میشود، تعامل بیشتری برای به دست آوردن اطلاعات درخواست شده لازم نیست (برودر[14]، 2002؛ نقل در مکفارلان[15]، 2007).
در یک پرسش تراکنشی، کاربران علاقهمند به یافتن مدرکی هستند که خدمات توصیف شده در پرسش تراکنشی را ارائه میدهد. نتایج پرس و جوهای تراکنشی وبسایتهایی هستند که برای رسیدن به مقصود، تعاملات بیشتری را طلب میکنند. تراکنش میتواند دانلود یک برنامه یا فایل، خرید یک محصول یا جستجوهای بعدی در یک سایت باشد. برای مثال، کاربری که برای بازیهای رایگان در وب جستجو میکند، تمایل دارد یا بازی را دانلود کند و یا به صورت آنلاین آن را انجام دهد. در هر دو صورت، در سایت بازیابی شده تراکنش ضروری خواهد بود. کاربران از موتور جستجو به عنوان وسیلهای برای انجام تراکنش در تجارت الکترونیکی (مانند سیستم پرداخت گوگل[16]) استفاده میکنند. آنها در مقایسه با پاسخ مستقیم به یک نیاز اطلاعاتی با موضوع خاص، بیشتر دسترسی به محتوای مجموعهای از عکسها، موسیقیها، ویدئوها و ... را فراهم میکنند. آنها همچنین امکان دسترسی به سرویسهای تراکنشی مانند نقشهها، مزایدههای آنلاین، راهنماهای رانندگی و حتی دیگر موتورهای جستجو را فراهم میکنند. در نتیجة، محققان توجه زیادی به کیفیت نتایج موتورهای جستجو دارند (رز و لوینسون، 2004) .
هرچند این رویکرد تا حدودی در مورد جستجوگران صدق میکند، یافتهها حکایت از آن دارد که کاربران در جستجوی وبی پرسشهای خود را به منظور دیگری هم طرح میکنند (جانسون، بوث و اسپینک[17]، 2008)؛ به منظور هدایت شدن به صفحة وب خاصی که از پیش میشناسند یا گمان میکنند وجود دارد. این وبسایت میتواند متعلق به یک شخص یا سازمان باشد. موفقیت این نوع پرسشها عامل موفقیت مهمی برای موتورهای جستجوی وب است. برای مثال «آدرس اینترنتی سایت بیمارستان علوم پزشکی تهران؟» یا «بیمارستان علوم پزشکی تهران» یک پرسش راهبری است که هدف از طرح آن یافتن صفحه وب ورودی دانشگاه علوم پزشکی تهران است. ملاک قضاوت دربارة نتایج بازیابی شده آن است که آیا این صفحه، صفحهای است که به دنبال آن بوده است؟ آیا این صفحهخانگی همان است که مّدنظر وی بوده یا او آن را نامگذاری کرده است؟ (حریری[18]، 2010).
پرسشهای راهبری اغلب تنها با یک نتیجة پاسخ داده میشوند و به محض اینکه نتیجة درست پیدا شود، نیاز اطلاعاتی شخص برطرف میشود. با این حال، همة پرسشها برای جستجوی افراد راهبری نیستند. «روز و لوینسون[19]» (2004) معتقدند بیشتر پرسشهایی که برای جستجوی افراد انجام میگیرند، راهبری نیستند. بنا به اظهارات آنها «در جستجو برای افراد مشهوری نظیر کامرون دیاز یا بنافلک نتایج متفاوتی از سایتهای هواداران، سایتهای رسانهها و نظایر آن بازیابی خواهد شد. به عبارت دیگر، احتمال اینکه کاربری که نام یک فرد مشهور را به عنوان یک پرسش جستجو میکند قصد دیدن یک سایت خاص را داشته باشد، کم است.» این مورد ممکن است درست باشد، اما از سوی دیگر این پرسشها را نمیتوان به عنوان پرسشهای اطلاعاتی در نظر گرفت، زیرا نمیتوان فرض کرد که کاربر میخواهد اسناد و مدارک مختلفی را در این مورد مطالعه کند. آنچه میتوان تصور کرد آن است که این پرسشها چیزی بین پرسشهای اطلاعاتی و راهبری هستند (لواندوسکی، درچسلر و ماچ، 2012).
مفهوم پرسشهای راهبری مبتنی است بر جستجوی اقلام مشخص شده در مجموعههای کتابخانهای یا به صورت کلیتر، مبتنی است بر تفکیک نیازهای اطلاعاتی مسئله – محور و نیازهای اطلاعاتی عینی. در پرسشهای راهبری، کاربر اثر موجود در یک مجموعه را میشناسد و میخواهد همان اثر را بازیابی کند. بنابراین، تنها یک نتیجه، نتیجة مرتبط است و زمانی جستجو کامل میشود که اثر مورد نظر پیدا شود. راهبری میتواند به یک سایت تراکنشی باشد یا راهبری به یک سایت اطلاعاتی. از لحاظ یک موتور جستجو، هدف بردن کاربر به وبسایت مناسب است. طبیعتاً از دید کاربر، زمانی که وی به یک مقصد خاص میرسد، ممکن است سایر هدفهایش را دنبال کند. بنابراین، کاربر میتواند جستجوی راهبری را به عنوان وسیلهای برای رسیدن به هدفهای بزرگتر جستجو در نظر بگیرد (بلکین[20] و دیگران، 1982).
درحالی که شمار دقیق نسبت پرسشهای راهبری در بررسیهای گوناگون متفاوت است، نتیجة مسلم همه مطالعات آن است که پرسشهای راهبری شمار قابل توجهی از پرسشها را به خود اختصاص دادهاند (هاوکینگ و کراسول[21]، 2004). اصطلاح متفاوتی که برای این نوع پرسشها وجود دارد «پیدا کردن صفحه خانگی[22]» است(لواندوسکی[23]،2008). به دلیل آنکه در بیشتر موارد صفحه خانگی، اولین صفحهای است که کاربران خواهند دید، این صفحه اهمیت بالایی دارد. علاوه بر آن، صفحة خانگی زمینة آشنایی با سایت، طراح و محتوای آن را فراهم میسازد؛ معمولاً به صفحات دیگر سایت لینک میدهد و امکان دسترسی به دیگر امکانات سایت مانند جستجو را فراهم میسازد. یوآرال صفحة خانگی، اغلب به عنوان یوآرال تمام سایت فرض میشود (هاوکینگ و کراسول، 2004).
از طرف دیگر، نمایه این موتورها با هم متفاوت هستند، و تمام مدارک موجود در شبکه در نمایه یک موتور موجود نیست (اسمیت، 2001) همچنین، مدارکی که از طریق یک موتور جستجو یافت میشود، ممکن است توسط موتور دیگر به دست نیاید. هنگام جستجو در وب، نظر به اینکه کاربران نمیتوانند مقایسهای نظاممند از نتایج موتورهای جستجوی مختلف داشته باشند، باید صرفاً بر مشاهدات خود تکیه کنند. به علاوه، از آنجا که آنها معمولاً یک یا چند نتیجة را برای یک پرسش مورد توجه قرار میدهند، باید به برداشت خود از فهرست نتایج اعتماد کنند (گرانکا، جوچییمز و گی[24]، 2004؛ کین، ابراین و اسمایف[25]، 2008).
با توجه به پوشش متنوع موضوعی در نمایه موتورهای جستجو و تحقیقاتی که تا حال بر روی موتورهای جستجو در مورد توانایی پاسخگویی آنها به سؤالهای مختلف انجام شده است، میتوان انتظار داشت این موتورها توانایی پاسخگویی به سؤالها را داشته باشند. از سوی دیگر، ارزیابیها در مورد عملکرد موتورهای کاوش در بازیابی برای پرسشهای اطلاعاتی نشان میدهد گوگل در این زمینه پیشتاز است (لواندوسکی،2008). گوگل بالاترین نسبت از شرح نتایج مرتبط را ارائه میدهد و کاربران آن را بهترین موتور جستجو میدانند (ماچایل[26] و دیگران، 2003؛ اسچمایدمینز و بومهاردت[27]، 2005). اما در مورد سؤالهای راهبری وضعیت چگونه است؟ آیا در جستجوی سؤالهای راهبری نیز گوگل بهترین عملکرد را دارد؟
برای این پژوهش، فرضیهای به شکل ذیل مطرح میگردد:
در بازیابی پاسخ پرسشهای راهبری، موتور جستجوی گوگل نسبت به سایر موتورهای جستجوی مورد استفاده در این پژوهش، بهترین عملکرد را دارد.
برای این پژوهش چهار پرسش به شکل ذیل مطرح میگردد.
1. پاسخ چه تعداد و چند درصد از پرسشهای راهبری ارائه شده به موتورهای جستجوی مورد نظر در این پژوهش، بازیابی میگردد؟
2. کدام یک از موتورهای جستجوی مورد نظر در این پژوهش، پاسخ پرسشهای راهبری را در رتبه اول فهرست نتایج بازیابی شده ارائه میدهند؟
3. موقعیت نتایج بازیابی شده توسط موتورهای جستجوی مورد نظر در این پژوهش چگونه است؟
4. در پاسخ به پرسشهای راهبری، نسبت یافتهها در موتورهای جستجوی مورد نظر در این پژوهش چگونه است؟
بررسیهای زیادی در مورد عملکرد بازیابی در موتورهای جستجوی وب انجام شده است. با این حال، در اکثر موارد در این بررسیها از پرسشهای اطلاعاتی استفاده شده است. پرسشهای اطلاعاتی، پرسشهایی هستند که کاربر میخواهد حداقل چند مدرک را در مورد موضوع مورد جستجوی خود پیدا کند. نیاز اطلاعاتی معمولاً با یک نتیجة برطرف نمیشود و کاربر پیشاپیش نمیداند که کدام مدرک (یا در محیط وب، کدام صفحه) بهترین نتیجة را به دست میدهد.
«آزادی» (1384) در پژوهشی با عنوان «میزان دقت موتورهای کاوش وب در بازیابی اطلاعات کتابداری و اطلاعرسانی» نحوة عملکرد 7 موتور کاوش را بررسی کرد. نتایج نشان داد اختلاف معناداری در میزان دقت موتورهای کاوش مورد بررسی در بازیابی اطلاعات کتابداری و اطلاعرسانی وجود ندارد. در این پژوهش، موتورهای کاوش از نظر دقت به این ترتیب رتبهبندی شدند: اینفوسیک[28]، هاتبات[29]،گوگل، آلتاویستا[30]، اکسایت[31]، لایکاس[32] و وبکراولر[33].
«کمیجانی» (1381) در پایاننامة خود با عنوان «مقایسه کارآیی موتورهای کاوش عمومی و تخصصی وب در بازیابی اطلاعات کشاورزی» 5 موتور کاوش وب شامل اگریسرف[34]، وباگری[35]، گوگل، لایکاس و یاهو را در بازیابی اطلاعات تخصصی حوزة کشاورزی با هم مقایسه کرد. این مقایسه نشان داد در معیار ارتباط و اعتبار، سه موتور کاوش گوگل، لایکاس و یاهو به ترتیب رتبه اول تا سوم را داشتند و موتورهای کاوش تخصصی کشاورزی در رتبههای آخر بودند.
«شیلکتینگ و نیلسن»[36] (1966) چهار موتور جستجوی پر استفاده در وب جهانگستر شامل لایکاس، آلتاویستا، اکسایت و اینفوسیک را ارزشیابی کردند. سادهترین گزارش از یافتهها این بود که از مجموع 200 پیوند ارائه شده با پنج جستجو، در مجموع 54 پیوند مربوط به موضوع پیدا شد. لایکاس بیشترین پیوندهای مربوط را با 19 مورد پیدا کرد. اکسایت با 14 مورد، اینفوسیک با 12 مورد و آلتاویستا با 9 مورد پیوند مربوط، در ردیفهای بعدی قرار داشتند.
«گانگوو و جیلی»[37] (1999) هفت موتور جستجوی آلتاویستا، اینفوسیک، اکسایت، نورثرنلایت[38]، یاهو، هاتبات، و مدیکال ورلد سرچ[39] را مقایسه کردند تا کارایی آنها را در پاسخگویی به سؤالهای کاربران علوم بهداشتی بسنجند. آنها سه موتور جستجوی اینفوسیک، آلتاویستا و اکسایت را به عنوان موتورهای کاوش رده بالا رتبهبندی کردند. این موتورها در مجموع از نظر روزآمد بودن منابع اطلاعاتی و ویژگیهای پیشرفتة جستجو، عملکرد خوبی داشتند. یاهو و نورثرن لایت برای جستجوی منابع دارویی و محصولات طبیعی موتورهای خوبی بودند، ولی همچنین دارای بالاترین تعداد پیوندهای غیرفعال میباشند. هات بات پوشش جامع و ویژگیهای جستجوی پیشرفته را دارد و موتور خوبی برای جستجوی تصاویر و فایلهای چندرسانهای است، اما مشکل پیوندهای تکراری در این موتور کاوش به چشم میخورد. همچنین، این مطالعه نشان داد حتی با استفاده از بهترین موتورهای کاوش، فقط نیمی از موارد بازیابی شده، مرتبط خواهند بود.
«مارتینز و سانچه»[40] در مقالهای با عنوان «مقایسهای بین ابزارهای جستجوی اینترنت» ده موتور کاوش را برای تحقیق انتخاب کردند. در این پژوهش، امکانات مختلف جستجو مانند عملکرد بولی،کوتاهسازی، استفاده از پرانتز و امکانات پیشرفته نظیر اصلاح نتیجة جستجو، جستجو در فیلدهای خاص، امکان محدود کردن موضوع و نیز زبان کنترلشده، مقایسه و ارزیابی شد. آنها به این نتیجه رسیدند که هیچ رابطهای میان رایج و عامهپسند بودن ابزارهای کاوش مورد مطالعه با امکانات جستجوی اطلاعات آنها وجود ندارد. دو نمونة آشکار در راهنمای موضوعی یاهو و موتور کاوش نورثرنلایت قابل مشاهده است. اگرچه موتور کاهش نورثرنلایت از نظر درجه مقبولیت آخرین رتبه را دارد، در فهرست رتبهبندی امکانات جستجو اولین رتبه را از آن خود کرد.حال آنکه یاهو که از رایجترین و عامهپسندترین ابزارهای کاوش است، از لحاظ بازیابی اطلاعات رتبة بالایی را کسب نکرده است (به نقل از آزادی، 1384).
«برودر»(2004) بر پایة تحلیل لاگفایلها و بررسی کاربران موتور جستجوی آلتاویستا، دریافت که هر یک از انواع پرسشها نمایندة شمار قابل توجهی از کل جستجوهاست. پرسشهای راهبری 20 تا 5/24٪، پرسشهای اطلاعاتی 39 تا 48%، و پرسشهای تراکنشی 22 تا 36% از کل پرسشها را شامل میشوند.
«رز و لوینسون»[41] (2004) تعریفهای مختلفی از پرسشهای راهبری و تراکنشی ارائه دادهاند. با توجه به بررسی رز،پرسشهای اطلاعاتی 61 تا 63% ، پرسشهای تراکنشی 21 تا 27% و پرسشهای اطلاعاتی 11 تا 15% از کل پرسشها را شامل میشوند.
«لواندووسکی» (2006) در یک بررسی که از دادههای مربوط به سه موتور جستجوی آلمانی استفاده شد، دریافت که پرسشهای راهبری 40% کل پرسشها را تشکل میدهند.
روششناسی پژوهش
در این پژوهش، از دو روش متفاوت استفاده شده است. برای پیدا کردن موتورهای کاوش عمومی وب که کاربرد بیشتری دارند، از روش اسنادی یا کتابخانهای و برای سنجش میزان دقت موتورهای کاوش، از روش مقایسهایاستفاده شده است.
برای انجام مقایسه، پنج موتور جستجوی گوگل، یاهو، بینگ،اسک و موتور جستجویآاوال بر پایة این شرط که باید نمایه شخصی خود را داشته باشند، انتخاب شدند.
این ابزارهای کاوش در دسته موتورهای کاوش عمومی و جزء پر استفادهترین آنها هستند. راهنماهای موضوعی، ابرموتورهای کاوش، و موتورهای کاوش کم استفاده، در این جامعه وارد نشدهاند. برای انتخاب موتورهای کاوش از رتبهبندی موتورهای کاوش در سایت الکسا[42]استفاده شد. سایت الکسا یک سایت رتبهبندی سایتها بر اساس میزان ترافیک مصرفی آنهاست؛ به این معنا که متناسب با میزان پهنای باند مصرفی، رتبه سایت را مشخص میکند. رتبهها از ۱ شروع شده و تا اعدادی حدود ۱۰ میلیون ادامه دارد. در این سایت، برعکس پیج رنک، هرچه عدد پایینتر باشد بهتر است؛ یعنی رتبههایی که به یک نزدیکتر، سایتهایی با میزان بازدید بیشتری هستند. البته، ذکر این نکته لازم است که لزوماً ترافیک سایت تابعی از تعداد بازدید نیست، اما برای به دست آوردن یک تقریب، معیار خوبی است (الکسا، 2012).
برای جمعآوری اطلاعات، نخست مفهوم پرسشهای راهبری برای گروهی از دانشجویان دانشگاه تهران تعریف و از آنها خواسته شد آخرین پرسشهایی از این دست را که در موتور جستجو استفاده کردهاند، ارائه کنند. 100 پرسش به زبان فارسی همراه عبارت دقیق پرسش، توصیف کوتاهی از نیاز اطلاعاتی و آدرس اینترنتی صفحه مورد نظر، از یکایک دانشجویان گردآوری شد.
تمامی پرسشها توسط پژوهشگر در قسمت جستجوی هر یک از موتورهای جستجوی مورد بررسی وارد و موقعیت نتایج صحیح ثبت شد. اگر صفحه درست میان 10 نتیجة اول یافت نمیشد، جستجو متوقف میشد.
برخلاف بررسیهایی که در مورد پرسشهای اطلاعاتی انجام شده است، قضاوت در مورد ربط نتایج در این مطالعه مشکل نیست، زیرا واضح است که کدام نتیجة مرتبط و کدام نتیجة نامرتبط است.
بعضی از شرکتهای بزرگ، صفحات خانگی منطقهای یا مختص به یک زبان را ایجاد میکنند. از آنجا که پرسشهای مطرح شده در این پژوهش به زبان فارسی هستند، فقط صفحة خانگی فارسی مورد نظر است.
در این پژوهش، صفحه درخواستی، صفحهای تعریف شده است که دقیقاً با آدرس اینترنتی که کاربر تعیین کرده است مطابقت دارد؛ یا صفحهای است که با تمامی معیارهای مدنظر کاربر در توصیف نیاز اطلاعاتی او مطابقت دارد. برای پرسشهای راهبری، مقیاسهای مختلفی را که در پژوهش «هاوکینگ و کراسول» (2005) تشریح شده است، برای دادهها محاسبه شده است. به منظور محاسبة عملکرد بازیابی برای پرسشهای راهبری، از سنجههای بازیابی متعددی نظیر سنجه موفقیت N [43] و رتبه معکوس میانگین[44] که در پژوهشهای مکفارلان (2007)، کراسول و هاوکینگ[45] (2005) به کار گرفته شده، استفاده شد.
نمودار 1، تعداد و درصد سؤالهای راهبری پاسخ داده شده توسط پنج موتور جستجوی گوگل،یاهو، بینگ،اسکو موتور جستجویآاوال را نشان میدهد. از کل پرسشهای ارائه شده به موتورهای جستجو، بیشترین درصد بازیابی با 8/95٪ (96 سوال) متعلق به موتور جستجوی گوگل میباشد. ضعیفترین عملکرد با 2/59٪ (68 سؤال) و 9/64٪ (74 سؤال) به ترتیب به دو موتور جستجوی بینگ و یاهو تعلق دارند.
|
|
نمودار 1. عملکرد هر یک از موتورهای جستجو در پاسخ به سؤالها
از مجموع 100 سؤال راهبری ارائه شده به موتورهای جستجو، تنها پاسخ 60٪ آنها توسط همه موتورهای جستجو بازیابی شده است (جدول 1). از سویی دیگر، هیچ یک از موتورهای جستجوی مذکور قادر به یافتن پاسخی برای 2٪ از پرسشها نبودهاند. جزئیات مربوط به عملکرد کلی موتورهای جستجو، در جدول 1 قابل مشاهده است.
جدول 1. عملکرد کلی موتورهای جستجو
پرسشها
موتورهای جستجو |
پاسخ داده شده |
بدون پاسخ
|
||
فراوانی
|
درصد
|
فراوانی
|
درصد
|
|
هیچ کدام
|
-
|
-
|
2
|
2٪
|
یک موتور جستجو |
2
|
2٪
|
-
|
-
|
دو موتور جستجو |
2
|
2٪
|
-
|
-
|
سه موتور جستجو |
24
|
24٪
|
-
|
-
|
چهار موتور جستجو |
10
|
10٪
|
-
|
-
|
پنج موتور جستجو |
60
|
60٪
|
-
|
-
|
دادههای جدول 2 نشان میدهد در مجموع موتور جستجوی گوگل با 96٪ بهترین عملکرد را در بازیابی به خود اخنتصاص میدهد و موتور جستجوی آاوال و اسک به ترتیب با 92٪ و 88٪ در رتبههای بعدی قرار دارند. در موتور جستجوی گوگل از مجموع 96 مورد پاسخ بازیابی شده 92/72٪ آن در رتبه اول فهرست نتایج بازیابی شده قرار دارد و از لحاظ قرار گرفتن نتایج در رتبه اول فهرست نتایج بازیابی شده، بهترین عملکرد را به خود نسبت داده است. دو موتور جستجوی اسک و آاوال به ترتیب با 18/68٪ و 39/67٪ مورد پاسخ بازیابی شده در رتبه اول فهرست نتایج در مقامهای بعدی قرار دارند. همچنین، موتور جستجوی بینگ و یاهو به ترتیب با 06/47٪ و 54/40٪ در قرار دادن صفحات درخواستی در رتبه اول موفق عمل کردهاند و در مقامهای بعدی قرار دارند.
جدول 2. تعداد کلی نتایج بازیابی شده در رتبههای اول تا دهم
موتور جستجو
|
Google
|
Yahoo
|
Bing
|
Ask
|
Aol
|
||||||||||
رتبه
|
فراوانی
|
افزایش
|
درصد
|
فراوانی
|
افزایش
|
درصد
|
فراوانی
|
افزایش
|
درصد
|
فراوانی
|
افزایش
|
درصد
|
فراوانی
|
افزایش
|
درصد
|
رتبه 1
|
70
|
-
|
92/72
|
30
|
-
|
54/40
|
32
|
-
|
06/47
|
60
|
-
|
18/68
|
62
|
-
|
39/67
|
رتبه 2
|
78
|
8
|
25/81
|
58
|
28
|
38/78
|
50
|
18
|
53/73
|
68
|
8
|
27/77
|
74
|
12
|
43/80
|
رتبه 3
|
88
|
10
|
67/91
|
64
|
6
|
49/86
|
56
|
6
|
35/82
|
76
|
8
|
36/86
|
82
|
8
|
13/89
|
رتبه 4
|
94
|
6
|
92/97
|
70
|
6
|
59/94
|
62
|
6
|
18/91
|
82
|
6
|
18/93
|
88
|
6
|
65/95
|
رتبه 5
|
96
|
2
|
100
|
72
|
2
|
30/97
|
64
|
2
|
12/94
|
86
|
4
|
73/97
|
90
|
2
|
83/97
|
رتبه 6
|
96
|
0
|
100
|
72
|
0
|
30/97
|
64
|
0
|
12/94
|
86
|
0
|
73/97
|
90
|
0
|
83/97
|
رتبه 7
|
96
|
0
|
100
|
72
|
0
|
30/97
|
64
|
0
|
12/94
|
86
|
0
|
73/97
|
90
|
0
|
83/97
|
رتبه 8
|
96
|
0
|
100
|
72
|
0
|
30/97
|
64
|
0
|
12/94
|
86
|
0
|
73/97
|
90
|
0
|
83/97
|
رتبه 9
|
96
|
0
|
100
|
72
|
0
|
30/97
|
66
|
2
|
06/97
|
86
|
0
|
73/97
|
90
|
0
|
83/97
|
رتبه 10
|
96
|
0
|
100
|
74
|
2
|
100
|
68
|
2
|
100
|
88
|
2
|
100
|
92
|
2
|
100
|
درصد بازیابی
|
96٪
|
74٪
|
68٪
|
88٪
|
92٪
|
نمودار 2 تعداد دفعات قرار گرفتن پاسخ پرسشهای راهبری در رتبة اول تا دهم، برای هر یک از موتورهای جستجو را نشان میدهد. همانطور که در نمودار مذکور قابل مشاهده است، در اکثر این موتورهای جستجو از رتبههای چهارم به بعد شیب نمودار بسیار کم و گاه صفر میگردد. در برخی از این موتورهای جستجو نظیر گوگل و آاوال و اسک، تعداد نتایج ظاهر شده در رتبههای اول بالاست و از رتبههای چهارم به بعد در تعداد نتایج مورد نظر بهبود چندانی حاصل نمیشود. در دو موتور جستجوی یاهو و بینگ، میزان نمایان شدن صفحات درخواستی در رتبههای دوم قابل توجه است.
نمودار 2. عملکرد موتورهای جستجو در بازیابی صفحات درخواستی در رتبههای اول تا دهم
چنان که در جدول 3 ملاحظه میشود، با در نظر گرفتن 5 و 10 نتیجة اول فهرست نتایج بازیابی شده، کمترین درصدها به ترتیب با 14/27٪ و 14/37٪ به موتور جستجوی گوگل و بیشترین درصدها به ترتیب با 140٪ و 67/146٪ به موتور جستجوی یاهو تعلق دارند. این بدان معناست که با در نظر گرفتن تعداد نتایج بیشتر، بهبود قابل توجهی در نتایج بازیابی شده توسط موتور جستجوی گوگل حاصل نشده است بر عکس، در موتور جستجوی یاهو در تعداد نتایج بازیابی شده، بهبود نسبتاً خوبی حاصل شده است. نسبت یافتهها در موتورهایی که درصد پایینتری از نتایج دلخواه را در رتبه اول قرار میدهند، بالاتر است.
جدول 3. نسبت بازیابی موتورهای کاوش با در نظر گرفتن تعداد نتایج مختلف
موتور جستجو
|
Google
|
Yahoo
|
Bing
|
Ask
|
Aol
|
نسبت یافتهها[46] |
درصد
|
درصد
|
درصد
|
درصد
|
درصد
|
اولین به پنجمین
|
14/37٪
|
140٪
|
100٪
|
33/43٪
|
16/45٪
|
اولین به دهمین
|
14/27٪
|
67/146٪
|
5/112٪
|
67/46٪
|
39/48٪
|
پنجمین به دهمین
|
0
|
78/2٪
|
25/6٪
|
33/2٪
|
22/2٪
|
برای محاسبة عملکرد بازیابی برای پرسشهای راهبری، از شاخصهای بازیابی متعددی نظیر سنجه موفقیت N و رتبه معکوس میانگین که در پژوهشهای مکفارلان (2007)، کراسول و هاوکینگ (2005) به کار گرفته شده، استفاده میکنیم. نمودار 3 نشاندهندة شاخص موفقیت N برای بیان میزان اثربخشی موتورهای جستجوست. همانطور که در نمودار مذکور مشاهد میشود، با در نظر گرفتن نتیجة اول، موتور جستجوی گوگل دارای بهترین و موتور جستجوی یاهو دارای بدترین شاخص موفقیت میباشد (70/0 و 30/0). با در نظر گرفتن 5 نتیجة اول، موتورهای جستجوی گوگل و بینگ به ترتیب با 96/0 و 64/0 دارای بهترین و بدترین میزان بازیابی هستند و با در نظر گرفتن 10 نتیجة اول، موتور جستجوی گوگل و بینگ با 96/0 و 68/0 دارای بهترین و بدترین میزان اثربخشی میباشند. مقادیر به دست آمده برای موتورهای جستجو که در جدول 4 نتایج بیان شده برای سنجه موفقیت N را تأیید مینمایند. علاوه بر آن، رتبه معکوس میانگین پنج موتور جستجوی مورد استفاده در این پژوهش، در جدول 4 نشان داده شده است. بیشترین مقدار متعلق به موتور جستجوی گوگل (79/0) و کمترین مقدار متعلق به موتور جستجوی بینگ(45/0) میباشد.
نمودار 3. میزان موفقیت در ارائه نتایج توسط موتورهای جستجو
جدول 4. وضعیت بازیابی موتورهای جستجو در رتبههای مختلف
موتورهای کاوش
|
رتبه
معکوس
میانگین
|
رتبه اول
|
رتبه اول تا پنجم
|
رتبه اول تا دهم
|
|||
موفقیت
|
عدم موفقیت
|
موفقیت
|
عدم موفقیت
|
موفقیت
|
عدم موفقیت
|
||
Google
|
79/0
|
70/0
|
30/0
|
96/0
|
04/0
|
96/0
|
04/0
|
Yahoo
|
48/0
|
30/0
|
70/0
|
72/0
|
28/0
|
84/0
|
36/0
|
Bing
|
45/0
|
32/0
|
68/0
|
64/0
|
36/0
|
68/0
|
32/0
|
Ask
|
69/0
|
60/0
|
40/0
|
86/0
|
34/0
|
88/0
|
12/0
|
Aol
|
73/0
|
62/0
|
38/0
|
90/0
|
10/0
|
92/0
|
08/0
|
بنابراین، با توجه به مقادیر شاخص موفقیت N و رتبة معکوس میانگین به دست آمده برای موتور جستجوی گوگل، فرضیة پژوهش مبنی بر اینکه «در بازیابی پاسخ پرسشهای راهبری، موتور جستجوی گوگل نسبت به سایر موتورهای جستجوی مورد استفاده در این پژوهش بیشترین اثربخشی را دارد» تأیید میگردد.
یافتههای پژوهش نشان میدهند سه موتور جستجوی گوگل، آاوال و اسک تقریباً با 96، 91 و 87% موفقیت در بازیابی، عملکرد نسبتاً خوبی در بازیابی پاسخ پرسشهای راهبری به زبان فارسی دارند، اما دو موتور جستجوی یاهو و بینگ تقریباً با 35 و 47% عدم موفقیت، عملکرد ضعیفی در بازیابی پاسخ پرسشهای راهبری به زبان فارسی دارند. یافتههای ما در مورد عملکرد موتور جستجوی گوگل در بازیابی سؤالهای راهبری، با یافتههای لواندوسکی (2008) همسوست، اما با نتایج ارائه شده برای موتور جستجوی یاهو همسویی ندارد. این نکته که موتور جستجوی گوگل در بازیابی پاسخ پرسشهای راهبری به زبان دیگری غیر از زبان انگلیسی عملکرد خوبی دارد، حایز اهمیت است. از بین 100 سوال ارائه شده به موتورهای جستجو، تنها 2 سؤال وجود داشت که هیچ یک از موتورهای جستجو مورد استفاده در این پژوهش قادر نبودند پاسخی برای آنها بیابند. از سویی دیگر، تنها 60٪ کل پرسشها توسط همة موتورهای جستجو پاسخ داده شدند. هر چند درصد سؤالهای که پاسخ آنها توسط همه پنج موتور جستجو بازیابی میشوند نسبتاً بالاست، باید به ایننکته توجه داشت که حدود 40٪ سؤالهای مورد استفاده در این پژوهش هستند که تنها بعضی از موتورهای جستجو توانستند به آن پاسخ گویند. شاید یکی از دلایل آن نمایه نشدن صفحات وب فارسی توسط آن موتورهای جستجو باشد. یکی از نکات کاربری قابل استنباط از یافتههای این بخش آن است که کاربران هنگام مواجه شدن با ناکامی در استفاده از موتور جستجویی خاص، برای نیل به پاسخ مناسب میتوانند از دیگر موتورهای جستجو نیز استفاده کنند.
نکتة دیگری که از نتایج به دست آمده قابل استنباط است، آن است که نتایجی که توسط گوگل و اسک و آاوال به دست آمدهاند، اغلب در رتبه اول صفحه نتایج قرار دارند. علاوه بر آن، همة موتورهای جستجوی مورد نظر در این پژوهش از نتیجة اول به نتیجة پنجم پیشرفت دارند. به عبارت دیگر، آنها تقریباً در بیش از 90% موارد قادرند صفحات درخواستی خود را بدون مرور کردن نتایج ارائه شده در پایین فهرست نتایج ارائه شده به کاربر در اولین صفحه نتایج نشان دهند. این مسئله در بازیابی سؤالهای راهبری با بهرهگیری از موتورهای جستجو دارای اهمیت بسزایی است، زیرا کاربران به بررسی نتایجی که پایینتر از وسط اولین صفحه نمایش قرار دارند(گرانکا و همکاران، 2004)، یا حتی نتایجی که بعد از 10 نتیجة اول ارائه میگردند، تمایل چندانی ندارند. با در نظر گرفتن 10 نتیجة اول، عملکرد آاوال و اسک در بازیابی پاسخ سؤالهای راهبری به عملکرد موتور جستجوی گوگل بسیار نزدیک میباشند. اما اگر رتبههای اول مد نظر قرار گیرد، عملکرد این موتورهای جستجو ضعیفتر است و موتور جستجوی آاوال درصد کمتری از صفحات درخواستی را بازیابی میکند. اگر چه موتورهای جستجوی یاهو و بینگ در قرار دادن صفحات درخواستی در رتبه اول فهرست رکوردهای بازیابی شده موفق عمل نکردهاند (54/40٪ و 06/47٪) با اینحال، با در نظر گرفتن رتبههای دوم، عملکرد این موتورها بهبود قابل توجهی مییابد و در صورتی که کل 10 نتیجة بازیابی شده در نظر گرفته شود، این موتورها نیز عملکرد نسبتاً بالایی دارند. با توجه به اهمیت قرار دادن صفحه درخواستی در مکان اول، این نتیجه قابل استنباط است که مشکل بسیاری از موتورهای جستجو، پیدا کردن صفحه درخواستی نیست، بلکه رتبهبندی آن بر اساس نیت کاربر است.
هر چند دو موتور جستجوی یاهو و بینگ در مقایسه با سه موتور جستجوی دیگر مورد استفاده در این پژوهش عملکرد ضعیفتری دارند، با نگاهی به نتایج ارائه شده در جدول 2 میتوان عملکرد آنها را خوب قلمداد کرد. درحالی که این موتورهای جستجو در مورد ارئه نتایج در رتبه اول نسبت به گوگل، اسک و آاوال عملکرد بدتری داشتهاند، اما با در نظر گرفتن چند نتیجه بعد آنها بهبود مییابد تا جایی که نسبت یافتههای این موتورهای جستجو نشاندهنده افزایش بازیابی صفحات درخواستی در رتبههای بعدی در فهرست 5 و 10 نتیجه ارائه شده در صفحه اول میباشد (جدول 3).
طبق نتایج به دست آمده در این پژوهش، از آنجا که در بازیابی پرسشهای راهبری به زبان فارسی توسط موتورهای جستجو اکثر نتایج در رتبه اول تا پنجم (جدول 2) صفحه نتایج قرار میگیرند، جستجوگری که دنبال یافتن پاسخ برای یک پرسش راهبری میباشد، چنانچه جواب مورد نظر خود را میان چند نتیجه اول پیدا نکند، نگاه کردن به صفحات بیشتر در فهرست نتایج بیحاصل است. بنابراین، چنین به نظر میرسد که جستجوگر باید دوباره پرسش خود را صورتبندی کند و از هدر دادن وقت برای مرور سایر نتایج بپرهیزد.
همانطور که انتظار میرفت، نسبت یافتهها در موتورهایی که درصد بالاتری از نتایج دلخواه را در رتبه اول فهرست نتایج قرار میدهند، پایینتر است. اکثر نتایجی که توسط گوگل و آاوال و اسک به دست آمدهاند، در رتبه اول صفحه نتایج قرار داشتهاند و به همین علت نسبت یافتهها از رتبه اول نسبت به کل رتبههای بررسی شده بسیار پایین است. هر سه موتور جستجو از نتیجة اول به نتیجة دوم پیشرفت داشتهاند، درحالی که موتورهای جستجوی یاهو و بینگ در مورد ارائه نتایج در رتبه اول نسبت به گوگل، اسک و آاوال عملکرد بدتری داشتهاند، اما با در نظر گرفتن چند نتیجة بعد آنها بهبود مییابد تا جایی که نسبت یافتههای این موتورهای جستجو (از اول به دهم) به ترتیب 67/146% و 5/112% است که نشاندهندة افزایش بازیابی صفحات درخواستی در رتبههای بعدی در فهرست 10 نتیجه ارائه شده در صفحة اول است. به عبارت دیگر، در این دو موتور جستجو نتایج اغلب در انتهای فهرست نتایج بازیابی شده ظاهر میشوند. نکته دیگر آنکه در هر پنج موتور جستجوی مورد استفاده در این پژوهش، با آنکه نسبت یافتهها از اولین نتیجة به پنجمین نتیجة افزایش چشمگیری دارد، نسبت یافتهها از پنجمین نتیجة به دهمین نتیجة افزایش بسیار اندکی دارد. این امر حکایت از آن دارد که اغلب نتایج بازیابی شده در این موتورهای جستجو، در رتبههای اول تا پنجم ظاهر میشوند.
در کل، با توجه به نتایج به دست آمده در این پژوهش برای موتورهای جستجو، موتور جستجوی گوگل در بازیابی پاسخ پرسشهای راهبری نیز همانند پرسشهای اطلاعاتی دارای بهترین عملکرد است (جدول 4 و نمودار 3). این امر میتواند دلیلی برای پرسش باشد که چرا کاربران موتور جستجوی گوگل را به سایر موتورهای جستجو ترجیح میدهند.