نوع مقاله : مقاله پژوهشی
نویسندگان
1 عضو هیئت علمی گروه علم اطلاعات و دانش شناسی دانشگاه قم
2 گروه علوم کتابداری و اطلاع رسانی، دانشکده علوم انسانی، دانشگاه آزاد اسلامی واحد همدان، همدان، ایران
چکیده
کلیدواژهها
انسان امروزی در همه جا و در هر شرایطی در محاصرۀ تصاویر قرار دارد و آن را در تمام جنبههای زندگی خود به کار میگیرد (اسمیت[3]، 2001). چنان که «هوو»[4] (2004) نیز بیان میکند، تصاویر ابزار قدرتمندی برای انتقال اطلاعات به شمار میروند و در ترکیب با متون میتوانند اطلاعاتی را که با کلمات قابل توصیف نیستند، به نحو بهتری منتقل کنند. ماهیت چند بُعدی تصاویر باعث میشود هر کاربری با توجه به نیاز خود، نگاه ویژهای به یک تصویر داشته باشد، و حتی با هدفی جدا از هدف خالق تصویر، آن را به کارگیرد. این مسئله بهخصوص زمانی که تصاویر رمزی و نمادین هستند، بسیار جدیتر است (کرمی، 1385). «حسن و ژانگ»[5] (2001) نیز معتقدند در حقیقت، مفاهیم موجود در هر تصویر با توجه به جنبههای فرهنگی، آموزشی، پژوهشی، علمی و...متفاوت است. وجود یک تصویر در ترکیب با متن میتواند به درک و انتقال مفاهیم موجود در آن کمک کند، حال آن که همان تصویر در متنی دیگر مفهوم دیگری را تداعی میکند. از سوی دیگر، با توجه به ارزش ذاتی تصاویر، باید اذعان داشت که نحوۀ سازماندهی تصاویر تا حدود زیادی میزان بهرهگیری و نتایج حاصل از آن را مشخص میکند. واژگان نمایهسازی تصاویر نه تنها باید مواردی مانند عنوان و خالق و ناشر آنها را پوشش دهد، بلکه مفاهیم مورد نظر خالق از خلق آن اثر را نیز باید مدنظر قرار دهد. به عبارت دیگر، وقتی در یک پایگاه اطلاعاتی، یک مقالۀ کوتاه باحدود 20واژه نمایهسازی میشود، تصاویر آن را نیز باید دست کم با همان عمق تجزیهوتحلیل کرد(رابرتز[6]، 2001). بنابراین، روشن است که نمایهسازی تصاویر، فعالیتی آسان و ساده نیست. فراهم کردن نقاط دسترسی متعدد برای کاربرانی که قصد دارند تصاویر را بازیابی کنند، مستلزم هزینۀ فراوان و فعالیتی مداوم است (عباسپور، 1384). به لحاظ روش، نمایهسازی تصاویر دو بُعد اصلی متن و محتوا را دربر میگیرد که در هنگام نمایهسازی باید به آنها توجه نمود. در نمایهسازی مبتنی بر متن، اطلاعات مربوط به متن خود تصویر بر اساس موقعیتهایشان ردهبندی میشوند که گروههایی مانند: نام فایل تصویر، عنوان تصویر، موضوع تصویر، برچسب اچ.تی.ام. ال.[7]، سیاه و سفید در برابر رنگی، اندازۀ تصویر، نوع فایل، اندازه فایل و تاریخ فایل را در بر میگیرد (باکستر، 1995). چنان که در نمایهسازی مبتنی بر محتوا ویژگیهای اصلی و اولیۀ تصویر مانند رنگ، شکل، بافت؛ ویژگیهای منطقی نظیر موجودیت اشیای نمایش داده شده در تصویر؛ و ویژگیهای خاص تصویر مانند مفهوم و معنای تصویر را در بر میگیرد (چو، 2001).
از سوی دیگر، با ظهور محیطهای اطلاعاتی جدید، شیوههای ذخیره و بازیابی تصاویر از جمله نمایهسازی آنها با تغییرات عمدهای مواجه شده است. از جمله، ابزارهای قدرتمندی که در این عرصه شروع به فعالیت کردهاند، موتورهای جستجو هستند که پس از درک اهمیت تصاویر به عنوان منابع اطلاعاتی ارزشمند، امکان نمایهسازی و بازیابی آن را نیز فراهم آوردند و به کاربران این فرصت را دادند تا تصاویر مورد نظر خود را بازیابی و جایابی کنند(حسن و ژانگ،2001). بنابراین، موتورهای جستجو در حال حاضر نه تنها وسیلهای براى دسترسی به اطلاعات متنی هستند، بلکه سازماندهی و بازیابی تصاویر را نیز جزء اهداف خود برای جلب بیشتر رضایت کاربران قرار دادهاند. اما باید این مسئله را مدنظر قرار داد که توانمندی موتورهای جستجو، به ویژه جامعۀ مورد مطالعه پژوهش حاضر، در این زمینه چگونه است و این موتورها تا چه حد توانستهاند شیوههای مربوط به نمایهسازی تصاویر را رعایت کنند. بنابراین، چنان که «کوشا» (1381) بیان میدارد، آشنایی با امکانات، قابلیتها و تواناییهاى موتورهای جستجوی اینترنتی اهمیت خاصی دارد. پژوهش حاضر نیز با توجه به اهمیت و ضرورت ارزیابی، موتورهای جستجوی گوگل[8]، یاهو[9]، لایکاس[10]، پیک سرچ[11] و اکسالید[12]را در بازیابی تصاویر بر اساس نمایهسازی مبتنی بر متن و محتوا در دستور کار خود قرارداد. البته، در این راستا تاکنون، مطالعات و ارزیابیهایی نیز انجام شده است که به طور مستقیم و غیر مستقیم این مسئله را مدنظر قرار داده و بر نقش مهم و ارزندۀ موتورهای جستجو در بازیابی تصاویر و شناخت برخی امکانات آنها برای جستجوگران و دیگر کاربران، تأکید کردهاند. در این رابطه میتوان به برخی از این پژوهشها از جمله، مهرآبادی (1385)، منصوری (1387)، اسفندیاریمقدم و بهاریموفق (1388)، لاکدشتی (1388)، پورسیستانی (1389)، فتحیان (1390)، فرخزاد (1390)، چویی و راسموسن[13](2003)، دایامنت[14] (2007)، گوپین ویرمی و زونلی[15] (2007)،تیسی[16] (2008)، اینکپن[17] و همکاران (2008)، واسیلیوا[18](2009)، اوزندی[19] (2010) و کیدامبی[20] (2010) اشاره کرد. نیز، در زمینۀ پژوهش در نمایهسازی تصاویر و ارزیابی موتورهای جستجو تاکنون پژوهشهای مختلفی از زوایای متعدد صورت گرفته است. در ادامه، به برخی از این پژوهشها که به لحاظ روش و برخورداری ازمعیارهای خاص شباهت بیشتری با موضوع پژوهش حاضر دارند، اشاره میشود.
در ایران «مهرآبادی» (1385) در پژوهش خود به مقایسه موتورهای کاوش عمومی وب از لحاظ نحوۀ نمایهسازی اطلاعات پرداخت. موتورهای کاوش مورد بررسی در این پژوهش عبارت بودند از: گوگل، آلتاویستا[21] و آلدوب[22]. بر اساس نتایج حاصل، آلدوب در تمام معیارها بیشترین امتیاز را کسب کرد. «منصوری» (1387) در پژوهش خود تلاش کرد تا ساختاری برای پیادهسازی یک سیستم بازیابی تصاویر ارائه دهد. در این سیستم از ویژگیهای رنگ و بافت برای بازیابی تصاویر استفاده و در نهایت مدلی بر این مبنا ارائه شد. «اسفندیاری مقدم و بهاری موفق» (1388) در پژوهشی با هدف ارائه سیاهۀ وارسی برای بررسی امکانات جستجو، 19فراموتور را بررسی و ارزیابی کردند. نتایج به دست آمده از این پژوهش نشان داد تمامی 19 فراموتور بررسی با وجود استفاده از برخی امکانات جستجو، برخی قابلیت جستجوی کلمات فرامتنی در سایتها و نمایش حجم صفحات جستجو شده، در هیچ فراموتوری مشاهده نشد. «لاکدشتی» (1388) در رسالۀ خود با استفاده از روش پیمایشی، مدلی را برای طراحی و پیادهسازی روش جدیدی برای بازیابی تصویر، بر اساس محتوا و معانی نهفته در تصویر ارائه کرد. همچنین «پورسیستانی» (1389)پژوهشی را با هدف این که در بازیابی تصاویر باید ابتدا ویژگیهای دیداری آنها استخراج و سپس تصاویر نمایهسازی شوند، انجام داد است. در نهایت، یک روش جدید برای استخراج ویژگیهای رنگ و بافت از تصاویر فشرده شده در قلمروJPEG ارائه داده است. «فتحیان» (1390) نیز پژوهشی را با هدف استفاده از دو ویژگی رنگ و بافت تصاویر با هدف توصیف شباهت تصاویر انجام و ساختاری را برای پیادهسازی یک سیستم بازیابی تصاویر بر اساس محتویات بصری با استفاده از یادگیری نظرهای کاربران ارائه داد. در نهایت، «فرخزاد» (1390) در پژوهش خود، میزان دقت ابرموتور Yippy، در بازیابی تصاویر همراه با متن با استفاده از روش خوشهبندی نتایج جستجو را بررسی نمود. از بین خوشههای ارائه شده به کاربر، خوشهای با عنوان تصویر وجود دارد که تصاویر همراه با متن را گردآوری میکند. تعیین ضریب دقت این ابرموتور با استفاده از فرمول دقت و ارزیابی ربط، انجام گرفت.
در خارج از ایران، «چویی و راسموسن»(2003) پرسشهای فرمولبندی شده توسط اعضای هیئت علمی و دانشآموختگانی که اطلاعات تصویری دربارة تاریخ آمریکا را در مجموعه حافظه کتابخانه کنگره آمریکا جستجو میکردند، بررسی نمودند. نتایج نشان داد در بیشتر موارد برچسبهای تصاویر با محتوای آنها همخوانی دارد. «دایامنت» (2007) در پژوهش خود، نرمافزاری پیوسته برای پردازش اطلاعات دیداری معرفی کرد که با شناسایی و قابلیت حل دشواریهای پردازش ادارکی و شناختی تصاویر، ویژگیهای اساسی آن را توصیف میکرد. در پژوهش دیگری که توسط «گوپین، یرمی و زونلی» (2007) انجام گرفت، فناوریهای نوینی معرفی شد که به کاربر اجازه میدهد در پایگاههای اطلاعاتی تصویرهای بزرگ به مرور و هدایت جستوجو بپردازد و تصاویری را با تکیه بر روشهای مرور و سپس هدایت سریع و قابل کنترل، بازیابی کند. همچنین «اینکپن و همکاران» (2008) در پژوهش خود با بررسی روش خوشهبندی خاصی برای بازیابی تصاویرکه در قالب خوشهبندی سلسله مراتبی ظاهر میشود، ابعاد این مسئله را بررسی کردند. نتایج نشان داد روشهای متعدد خوشهبندی تصاویر به بازیابی بهتر و دقیقتر تصاویر مورد نظر منجر میشود. ازسوی دیگر، «واسیلیوا» (2009) در پژوهش خود به نظام بازیابی تصاویر بر مبنای محتوا اشاره میکند که به حل بخشی از مشکلات این حوزه نظر دارد و نتیجة پژوهش خود را تحلیل ویژگیهایسطحپایینتصاویروساختار خصوصیاتبرداری، درکنارنمایهسازی چندبُعدی، طراحیمناسبرابطکاربرو مصورسازیداده که میتواندبهبازیابیمؤثرتصاویرمنجرشود، بیان نمود. «اوزندی» (2010) با هدف ارائه روشی در بازیابی تصاویر، پژوهشی انجام داد. وی چارچوب تغییر ناپذیری هندسی را ارائه کرد که از مقاطع مخروطی از مرزهای جسم در تصاویر تولید میشود و به دلیل خاصیت تغییرناپذیری آن مورد استفاده قرارگرفته است. وی آن را برای تشخیص و بازیابی تصاویر پیشنهاد داد و در نهایت این روش بازیابی را به نام امضای ثابت تصاویر نامگذاری کرد. «کیدامبی» (2010) در پژوهشی با هدف تعامل انسان و رایانه در نمایهسازی تصاویر در موتورهای جستجو، به بررسی سه موتور جستجوی گوگل، یاهو، ام.اس.ان.[23]پرداخت. طبق نتیجه، موتورجستجوی گوگل عملکرد بهتری در بازیابی تصاویر به دست آورد.
از بررسی اجمالی پژوهشهای فوق مشخص میشود که بازیابی تصاویر از نظر متخصصان فنی (رایانه و الکترونیک) و ارزیابی موتورهای جستجو از نظر متخصصان علومانسانی (علم اطلاعات) مورد توجه بوده است، هر چند اغلب پژوهشهای نمایهسازی تصاویر از دیدگاه متخصصان رایانه و الکترونیک انجام شده است. نیز ارزیابی موتورهای جستجو بیشتر در زمینۀ بازیابی اطلاعات متنی است، ولی با ترکیب این دو مقولۀ فنی و نظری با هم، یعنی، در زمینه بازیابی تصاویر بر اساس نمایهسازی آنها در موتورهای جستجو، مجالی برای پژوهشهای بیشتر وجود دارد. بنابراین، پژوهش حاضر با هدف شناسایی توانمندیهای موتورهای جستجوی مورد مطالعه در بازیابی تصاویر بر اساس نمایهسازی مبتنی بر متن و محتوا اجرا و سعی شد تا به پرسشهای زیر پاسخ داده شود:
1. قابلیتهای بازیابی تصاویر در موتورهای جستجوی مورد مطالعة این پژوهش چه تفاوتهایی با یکدیگر دارد؟
2. بازیابی تصاویر در موتورهای جستجوی مورد مطالعة این پژوهش بر اساس نمایهسازی مبتنی بر متن، چگونه است؟
3. بازیابی تصاویر در موتورهای جستجوی مورد مطالعة این پژوهش بر اساس نمایهسازی مبتنی بر محتوا چگونه است؟
4. کارآمدترین موتور جستجو در بازیابی تصاویر بر اساس حوزههای مورد مطالعه در این پژوهش کدام است؟
1. در بازیابی تصاویرِ موتورهای جستجوی مورد مطالعة در این پژوهش بر اساس نمایهسازی مبتنی بر متن، تفاوت معناداری وجود دارد.
2. در بازیابی تصاویرِ موتورهای جستجوی مورد مطالعة در این پژوهش بر اساس نمایهسازی مبتنی بر محتوا، تفاوت معناداری وجود دارد.
پژوهش حاضر از نوع کاربردی و روش مورد استفاده در آن از نوع تحقیقات ارزیابانه است. بررسی بازیابی تصاویر در موتورهای جستجو به صورت مشاهده مستقیم انجام شد. جامعۀ آماری پژوهش را موتورهای جستجوی گوگل، یاهو، لایکاس، پیک سرچ و اکسالید تشکیل میدهد، که دو موتور جستجوی عمومی گوگل و یاهو به دلیل جامعیت، و سه موتور جستجوی تخصصی بازیابی چندرسانهای و تصاویر انتخاب شدند. ابزار گردآوری اطلاعات مورد استفاده در این پژوهش، سیاهۀ محقق ساخته است که بر اساس بررسیهای متون و منابع طراحی شد. همچنین، در تهیۀ بخش اول این سیاهه یعنی معیارهای ارزیابی موتورهای جستجو، از معیارهای تیسی[24] (2008) استفاده شد. سیاهۀ مورد استفاده در مجموع شامل40 مؤلفه بود که شامل سه بخش اصلی است: معیارهای ارزیابی موتورهای جستجوی تصاویر، بازیابی تصاویر بر اساس نمایهسازی مبتنی بر متن و بازیابی تصاویر بر اساس نمایهسازی مبتنی بر محتوا نیز در ارزیابی، فقط10 صفحۀ اول تصاویر بازیابی شده در هر موتور جستجو بررسی شد. با استفاده از نظرهای متخصصان علم اطلاعات و دانششناسی، از اعتبار (روایی) سیاهۀ وارسی اطمینان حاصل و نظرهای سودمند آنها در سیاهۀ نهایی اعمال گردید. در واقع، چک لیست متشکل از معیارهاست، بنابراین قابل اعتماد است. همچنین برای اندازهگیری پایایی (اعتماد) مقیاس، پس از گردآوری و آمادهسازی اولیۀ دادههای استخراج شده از سیاهه ارزیابی، برای تجزیه و تحلیل آماری از نرمافزار آماری SPSS16استفاده شد. از جدولهای فراوانی و درصد فراوانی تجمعی برای توصیف سؤالهای سیاهه ارزیابی، و برای آزمون فرضیههای تحقیق نیز از آزمون T گروههای مستقل استفاده شد.
سؤال اول: قابلیتهای بازیابی تصاویر در موتورهای جستجوی مورد مطالعة این پژوهش چه تفاوتهایی با یکدیگر دارد؟
برای پاسخ به این پرسش، سؤالهای مربوط به معیارهای ارزیابی موتورهای جستجوی تصاویر (دامنۀ پوشش، گزینههای جستجو، عملکرد و کارآیی، نحوۀ نمایش، پشتیبانی و حقّ مؤلف) در سیاهۀ ارزیابی بررسی شد که به تفکیک در ادامه میآید.
جدول 1.دامنۀ پوشش در بازیابی تصاویر در موتورهای جستجوی مورد مطالعه برحسب درصد فراوانی
موتورهای جستجو
|
بسیار ضعیف
|
ضعیف
|
متوسط
|
خوب
|
بسیار خوب
|
یاهو
|
50
|
0
|
50
|
0
|
0
|
پیک سرچ
|
50
|
0
|
0
|
50
|
0
|
گوگل
|
0
|
0
|
0
|
0
|
100
|
لایکاس
|
100
|
0
|
0
|
0
|
0
|
اکسالید
|
100
|
0
|
0
|
0
|
0
|
چنان که از جدول 1 و درصد فراوانی دامنۀ پوشش در هر یک از موتورهای جستجو مورد مطالعۀ پژوهش مشهود، دامنه پوشش در گوگل با 100% فراوانی بسیار خوب و در لایکاس و اکسالید با 100% فراوانی بسیار ضعیف است.
جدول 2.گزینههای جستجو در بازیابی تصاویر در موتورهای جستجوی مورد مطالعه برحسب درصد فراوانی
موتورهای جستجو
|
بسیار ضعیف
|
ضعیف
|
متوسط
|
خوب
|
بسیار خوب
|
یاهو
|
0
|
0
|
33
|
0
|
67
|
پیک سرچ
|
0
|
33
|
33
|
33
|
0
|
گوگل
|
0
|
0
|
0
|
0
|
100
|
لایکاس
|
33
|
33
|
33
|
0
|
0
|
اکسالید
|
0
|
0
|
0
|
0
|
100
|
چنان که در جدول 2 و وضعیت گزینههای جستجو در هر یک از موتورهای جستجوی مورد مطالعه مشهود است، گزینههای جستجو در گوگل و اکسالید با 100% فراوانی بسیار خوب و در لایکاس با 33% فراوانی بسیار ضعیف است.
جدول 3. عملکرد و کارایی در بازیابی تصاویر در موتورهای جستجوی مورد مطالعه برحسب درصد فراوانی
موتورهای جستجو
|
بسیار ضعیف
|
ضعیف
|
متوسط
|
خوب
|
بسیار خوب
|
یاهو
|
12.5
|
0
|
12.5
|
25
|
50
|
پیک سرچ
|
12.5
|
50
|
37.5
|
0
|
0
|
گوگل
|
0
|
0
|
12.5
|
25
|
62.5
|
لایکاس
|
0
|
12.5
|
50
|
25
|
12.5
|
اکسالید
|
0
|
50
|
25
|
12.5
|
12.5
|
چنان که در جدول 3 و درصد فراوانی عملکرد وکارایی در هر یک از موتورهای جستجو مورد مطالعۀ مشاهده میشود، عملکرد و کارایی در گوگل با 62.5% فراوانی بسیار خوب، ولی در یاهو و پیک سرچ با 12.5% فراوانی بسیار ضعیف است.
جدول 4. نحوۀ نمایش دربازیابی تصاویر در موتورهای جستجوی مورد مطالعه برحسب درصد فراوانی
موتورهای جستجو
|
بسیار ضعیف
|
ضعیف
|
متوسط
|
خوب
|
بسیار خوب
|
یاهو
|
50
|
0
|
0
|
0
|
50
|
پیک سرچ
|
50
|
0
|
0
|
33
|
17
|
گوگل
|
33
|
0
|
0
|
0
|
67
|
لایکاس
|
17
|
16
|
0
|
17
|
50
|
اکسالید
|
50
|
0
|
0
|
0
|
50
|
جدول 4 و درصد فراوانی نحوۀ نمایش دربازیابی تصاویر در موتورهای جستجوی مورد مطالعه پژوهش نشان میدهد که نحوۀ نمایش در گوگل با 67% فراوانی بسیارخوبو در یاهو و پیک سرچ و اکسالید با 50% فراوانی بسیار ضعیف و خوب است.
جدول 5. پشتیبانی در بازیابی تصاویر در موتورهای جستجوی مورد مطالعه برحسب درصد فراوانی
موتورهای جستجو
|
بسیار ضعیف
|
ضعیف
|
متوسط
|
خوب
|
بسیار خوب
|
یاهو
|
50 |
50 |
0 |
0 |
0 |
پیک سرچ
|
50 |
50 |
0 |
0 |
0 |
گوگل
|
0 |
50 |
0 |
50 |
0 |
لایکاس
|
50 |
50 |
0 |
0 |
0 |
اکسالید
|
50 |
50 |
0 |
0 |
0 |
براساس داده های جدول 5، پشتیبانی در بازیابی تصاویر در گوگل با 50% فراوانی خوبو در بقیه موتورها با 50% فراوانی، بسیار ضعیف و ضعیف است.
جدول 6.حق مؤلف در بازیابی تصاویر در موتورهای جستجوی مورد مطالعه برحسب درصد فراوانی
موتورهای جستجو
|
بسیار ضعیف
|
ضعیف
|
متوسط
|
خوب
|
بسیار خوب
|
یاهو
|
100
|
0
|
0
|
0
|
0
|
پیک سرچ
|
100
|
0
|
0
|
0
|
0
|
گوگل
|
0
|
0
|
0
|
0
|
100
|
لایکاس
|
0
|
0
|
0
|
0
|
100
|
اکسالید
|
100
|
0
|
0
|
0
|
0
|
از نتایج جدول 6 و درصد فراوانی حق مؤلف در هر یک از موتورهای جستجوی مورد مطالعۀ پژوهش مشهود است که رعایت حق مؤلف در گوگل و لایکاس با 100% فراوانی بسیارخوب و در یاهو و پیک سرچ و اکسالید با 100% فراوانی، بسیار ضعیف است. در ادامه، در نمودار1 تفاوت بین موتورهای جستجو در قابلیتهای بازیابی تصاویر و این که هر یک از موتورهای جستجو دارای چه وضعیتی هستند، ارائه شده است.
سؤال دوم: بازیابی تصاویر در موتورهای جستجوی مورد مطالعة این پژوهش بر اساس نمایهسازی مبتنی بر متن چگونه است؟
برای پاسخ به پرسش، مؤلفههای مربوط به نمایهسازی مبتنی بر متن تجزیهوتحلیل میشود.
جدول 7. اطلاعات متنیدر بازیابی تصاویر در موتورهای جستجوی مورد مطالعه برحسب درصد فراوانی
موتورهای جستجو
|
بسیار ضعیف
|
ضعیف
|
متوسط
|
خوب
|
بسیار خوب
|
یاهو
|
14
|
29
|
0
|
43
|
14
|
پیک سرچ
|
14
|
29
|
14
|
14
|
29
|
گوگل
|
0
|
14
|
14
|
14
|
57
|
لایکاس
|
43
|
14
|
14
|
29
|
0
|
اکسالید
|
43
|
0
|
0
|
0
|
57
|
چنان که از جدول 7 و درصد فراوانی نمایهسازی مبتنی بر متن در هر یک از موتورهای جستجوی مورد مطالعۀ پژوهش مشهود است، اطلاعات متنی تصاویر در گوگل و اکسالید با 57% فراوانی بسیارخوب ولی در لایکاس با 43% فراوانی، بسیار ضعیف است. همچنین، مقایسۀ معیارهای بازیابی تصاویر بر اساس نمایهسازی مبتنی بر متن در موتورهای جستجوی مورد مطالعه، در نمودار 2 نیز قابل مشاهده است.
سؤال سوم: بازیابی تصاویر در موتورهای جستجوی مورد مطالعة این پژوهش بر اساس نمایهسازی مبتنی بر محتوا، چگونه است؟
در این قسمت مؤلفههای مربوط به موضوع و مفهوم، رنگ، شکل و بافتِ تصاویر در موتورهای جستجو تجزیهوتحلیل میشود.
جدول 8. موضوع و مفهوم دربازیابی تصاویر در موتورهای جستجوی مورد مطالعه برحسب درصد فراوانی
موتورهای جستجو
|
بسیار ضعیف
|
ضعیف
|
متوسط
|
خوب
|
بسیار خوب
|
یاهو
|
0
|
0
|
0
|
0
|
100
|
پیک سرچ
|
0
|
33
|
67
|
0
|
0
|
گوگل
|
0
|
0
|
0
|
0
|
100
|
لایکاس
|
0
|
0
|
0
|
33
|
67
|
اکسالید
|
0
|
0
|
33
|
33
|
33
|
چنان که در جدول 8 مشاهده میشود، وضعیت موضوع و مفهوم در گوگل و یاهو با 100% فراوانی بسیارخوب، ولی در پیک سرچ با 33% ضعیف است.
جدول9.رنگ در بازیابی تصاویر در موتورهای جستجوی مورد مطالعه برحسب درصد فراوانی
موتورهای جستجو
|
بسیارضعیف
|
ضعیف
|
متوسط
|
خوب
|
بسیار خوب
|
یاهو
|
0 |
33 |
0 |
67 |
0 |
پیک سرچ
|
33 |
0 |
33 |
0 |
33 |
گوگل
|
0 |
0 |
33 |
33 |
33 |
لایکاس
|
0 |
0 |
100 |
0 |
0 |
اکسالید
|
33 |
0 |
33 |
0 |
33 |
دادههای جدول 9 نشان می دهد وضعیت رعایت رنگ در گوگل با 33% در حد متوسط و یاهو با 67% خوب است. همچنین، در اکسالید و پیک سرچ با 33% فراوانی در حد متوسط است.
جدول 10. شکل در بازیابی تصاویر در موتورهای جستجوی مورد مطالعه برحسب درصد فراوانی
موتورهای جستجو
|
بسیار ضعیف
|
ضعیف
|
متوسط
|
خوب
|
بسیار خوب
|
یاهو
|
33
|
33
|
33
|
0
|
0
|
پیک سرچ
|
67
|
33
|
0
|
0
|
0
|
گوگل
|
33
|
0
|
33
|
33
|
0
|
لایکاس
|
33
|
0
|
33
|
33
|
0
|
اکسالید
|
67
|
0
|
33
|
0
|
0
|
طبق جدول10، رعایت معیارهای شکل در گوگل و لایکاس در مقایسه با بقیه خوب و در پیک سرچ واکسالید بسیار ضعیف است.
جدول 11. بافت در بازیابی تصاویر در موتورهای جستجوی مورد مطالعه برحسب درصد فراوانی
موتورهای جستجو
|
بسیار ضعیف
|
ضعیف
|
متوسط
|
خوب
|
بسیار خوب
|
یاهو
|
0
|
0
|
50
|
50
|
0
|
پیک سرچ
|
50
|
0
|
50
|
0
|
0
|
گوگل
|
0
|
0
|
50
|
0
|
50
|
لایکاس
|
0
|
0
|
100
|
0
|
0
|
اکسالید
|
50
|
0
|
50
|
0
|
0
|
چنان که ازجدول 11 مشهود است، رعایت معیارهای بافت در گوگل با 50% فراوانی به سمت بسیارخوب تمایل دارد، و در پیک سرچ و اکسالید با 50% به سمت بسیار ضعیف و متوسط است.
در نتیجه، طبق تجزیه و تحلیل مؤلفههای بازیابی تصاویر بر اساس نمایهسازی مبتنی بر محتوا (11مؤلفه) در هر یک از موتورهای جستجوی مورد مطالعۀ پژوهش به صورت جداگانه، دریافت گردید که موتورجستجوی گوگل با 45% به سمت بسیار خوب و یاهو با 52% به سمت خوب و لایکاس با 55% به سمت متوسط است. پیکسرچ و اکسالید با 72% به سمت بسیار ضعیف میباشند. نیز، در نمودار3 وضعیت بازیابی تصاویر در موتورهای جستجوی مورد مطالعۀ این پژوهش بر اساس نمایهسازی مبتنی بر محتوا، بر اساس محاسبۀ میانگین نمایان است.
سؤال چهارم: کارآمدترین موتور جستجو در بازیابی تصاویر بر اساس حوزههای مورد مطالعه در این پژوهش کدام است؟
به منظور پاسخ به پرسش چهارم، کل مؤلفههای بازیابی(40مؤلفه) برای هر یک از موتورهای جستجو مورد مطالعۀ پژوهش با استفاده آزمون کروسکال والیس به صورت جداگانه تجزیه و تحلیل شد. نتایج در جدول 13 ارائه شده است.
جدول13. رتبۀ میانگین موتورهای جستجوی در بازیابی تصاویر بر اساس حوزههای مورد مطالعه
موتورهای جستجو
|
تعداد سؤالات
|
رتبه میانگین
|
یاهو
|
40 |
105.16 |
پیک سرچ
|
40 |
76.24 |
گوگل
|
40 |
136.62 |
لایکاس
|
40 |
92.88 |
اکسالید
|
40 |
91.60 |
جدول14. تست آمارۀ آمون برای کارآمدترین موتور جستجو در بازیابی تصاویر بر اساس حوزههای مورد مطالعه
تست آماره آمون |
|
کای اسکور
|
25.885
|
درجه آزادی |
4 |
سطح معنادار
|
0.00 |
براساس جدول 13 نتیجهگیری میشود که موتور جستجوی گوگل بیشترین رتبۀ میانگین را یه خود اختصاص داده است و پس از گوگل به ترتیب یاهو ، لایکاس، اکسالید و پیک سرچ قرار دارند. همچنین، با توجه به سطح معناداری به دست آمده در جدول 14 (0.00)، چون آلفای مفروض از 0.05 کوچکتر است، پس با اطمینان 0.95 درصد نتیجهگیری میشود که کارآمدترین موتور جستجو، گوگل است.
پاسخ به فرضیههای پژوهش
فرضیه اول: در بازیابی تصاویر موتورهای جستجوی مورد مطالعۀ این پژوهش بر اساس نمایهسازی مبتنی بر متن، تفاوت معناداری وجود دارد.
H0: در بازیابی تصاویر موتورهای جستجوی مورد مطالعۀ این پژوهش بر اساس نمایهسازی مبتنی بر متن تفاوت معناداری وجود ندارد.
H1: در بازیابی تصاویر موتورهای جستجوی مورد مطالعۀ این پژوهش بر اساس نمایهسازی مبتنی بر متن تفاوت معناداری وجود دارد.
جدول13. بررسی اختلاف بین بازیابی موتورهای جستجو بر اساس نمایهسازی مبتنی بر متن با استفاده از آزمون تی(T) گروههای مستقل
متغیر
|
میانگین
|
واریانس
|
آماره تی
|
درجه آزادی
|
سطح معنادار
|
موتورهای جستجو
|
68.80
|
15.67
|
6.35
|
8
|
0.000
|
نمایهسازی مبتنی بر متن
|
22.40
|
4.61
|
چنان که در جدول 13 ملاحظه میشود، چون سطح معناداری به دست آمده0.00از آلفای مفروض 0.05 کوچکتر است، پس فرض صفر با اطمینان 0.95 رد و فرض یک تأیید میشود؛ یعنی در بازیابی تصاویر بین موتورهای جستجوی مورد مطالعۀ این پژوهش بر اساس نمایهسازی مبتنی بر متن، تفاوت معناداری وجود دارد.
فرضیۀ دوم: در بازیابی تصاویر موتورهای جستجوی مورد مطالعۀ این پژوهش بر اساس نمایهسازی مبتنی بر محتوا، تفاوت معناداری وجود دارد.
H0: در بازیابی تصاویر موتورهای جستجوی مورد مطالعۀ این پژوهش بر اساس نمایهسازی مبتنی بر محتوا تفاوت معناداری وجود ندارد.
H1: در بازیابی تصاویر موتورهای جستجوی مورد مطالعۀ این پژوهش بر اساس نمایهسازی مبتنی بر محتوا تفاوت معناداری وجود دارد.
جدول 14. بررسی اختلاف بین بازیابی موتورهای جستجو بر اساس نمایهسازی مبتنی بر محتوا با استفاده از آزمون تی(T) گروههای مستقل
متغیر
|
میانگین |
واریانس |
آماره تی |
درجه آزادی |
سطح معنادار |
موتورهای جستجو |
68.80 |
15.67 |
4.50 |
8 |
0.002 |
نمایهسازی مبتنی بر محتوا |
34.40 |
6.80 |
چنان که در جدول 14 ملاحظه میشود، چون سطح معناداری به دست آمده0.002از آلفای مفروض 0.05 کوچکتر است، پس فرض صفر با اطمینان 0.95 رد و فرض یک تأیید میشود؛یعنی در بازیابی تصاویر بین موتورهای جستجوی مورد مطالعه در این پژوهش بر اساس نمایهسازی مبتنی بر محتوا تفاوت معناداری وجود دارد.
با توجه به اهمیت بازیابی اطلاعات در دنیای وب و ظهور حوزههای جدید بازیابی اطلاعات از جمله تصاویر، در پژوهش حاضر وضعیت موتورهای جستجوی مورد مطالعه در بازیابی تصاویر بر اساس نمایهسازی مبتنی بر متن و محتوا ارزیابی شد. بر اساس یافتههای پژوهش، مؤلفههای بازیابی تصاویر در موتورهای جستجو را میتوان به شرح زیر، مورد بحث و بررسی قرار داد. در بررسی و ارزیابی مؤلفههای فرعی ملاحظه شد که توجه کمی به ذکر تاریخ روزآمدسازی شده است. اما در مقابل با توجه به این نکته که اولویت موتورهای جستجو در بازیابی اطلاعات، برخوردار بودن از امکانات و منوهای جستجوی مناسب است و نیز بر اساس این که جستجوی تصاویر و اطلاعات متنی هر دو از یک درگاه انجام میگیرد، نتایج حاصل وضعیت گزینههای جستجو را در موتورهای جستجو بسیارخوب نشان داده است که با یافتههای پژوهش «اسفندیاری مقدم و بهاری موفق» (1388) نیز همسو است. همچنین در مؤلفههای ربط تصاویر بازیابی شده با جستجوی کاربر، و اعمالِ پیوند در موتورهای جستجو وضعیت ضعیفی مشاهده شد. این نکته نیز قابل توجه است که اگر پشتیبانی اطلاعات در موتورهای جستجوی تصاویر بیشتر مورد توجه قرار گیرد، در حوزۀ علوم به خصوص علومی مانند پزشکی، معماری، هنر و تاریخ بسیار کاربرد دارد، زیرا در این حوزهها بازیابی تصویر مناسب میتواند نقش بسزایی در کمک به کاربران داشته باشد. همچنین، نتایج نشان داد رعایت حق مؤلف تصاویر در موتورهای جستجوی تخصصی مورد مطالعه، برخلاف موتورهای عمومی وضعیت مناسبی ندارد که این مسئله جای تأمل بسیاری دارد و نیازمند پژوهشهای بیشتری است. اما در کل، نتایج نشان داد از بین جامعۀ آماری مورد مطالعه، گوگل با کسب رتبۀ میانگین 136.62و یاهو با105.16و لایکاس با 92.88 و اکسالید با 91.60 در نهایت پیک سرچ با 76.24 در رتبه اول تا پنجم قرار دارند. همچنین، در بررسی مؤلفههای بازیابی تصاویر بر اساس نمایهسازی مبتنی بر متن، نتایج به دست آمده نشان داد در موتورهای جستجوی مورد مطالعه سعی شده است تمامی اطلاعات بصری و متنی تصاویر نمایهسازی شود. بنابراین، یافتههای پژوهش حاضر با پژوهش «چویی و راسموسن»(2003)، پژوهش «فرخزاد» (1390) و«اینکپن و همکاران»[25](2008) همسوست، که نشان از وضعیت بسیار خوب بازیابی تصاویر بر اساس نمایهسازی مبتنی بر متن است. ضمن این که نتایج نشان داد موتور جستجوی گوگل و اکسالید با 57% به سمت بسیار خوب، یاهو با 43% به سمت خوب و پیک سرچ با 58% به سمت متوسط و لایکاس با 43% به سمت بسیار ضعیف است. همچنین، نتایج یافتههای پژوهش در مؤلفههای بازیابی تصاویر بر اساس نمایهسازی مبتنی بر محتوا نشان داد که وضعیت موتور جستجوی گوگل با45% به سمت بسیار خوب و یاهو با 52% به سمت خوب و لایکاس با 55% به سمت متوسط است. نیز در پیک سرچ و اکسالید با 72% به سمت بسیار ضعیف است. ضمن این که در این زمینه در مؤلفۀ موضوع و مفهوم، نتایج پژوهش حاضر با یافتههای پژوهش «لاکدشتی» (1388) همسوست. همچنین، با توجه به اهمیت رنگ در تصاویر به عنوان یک مقولۀ کاملاً بصری، متأسفانه بازیابی تصاویر بر اساس رنگ تصاویر در موتورهای جستجو وضعیت متوسطی دارد و ضروری است موتورهای جستجو بیشتر از قبل به این مؤلفه از محتوای تصاویر توجه کنند. البته، امکان ترسیم خود شکل در موتورهای جستجو برای بازیابی تصاویر به جای کلیدواژه ضروری است، زیرا برخی از اشکال زاویهدار و پیچیده (مانند شکل گلبرگ گلها) از طریق کلیدواژه قابل جستجو نیستند. همچنین، امکان ترسیم شکل برای کاربرانی مانند معماری، گیاهشناسی بسیار کاربردی و سودمند است، هر چند در این زمینه نیز نتایج به سمت متوسط و بسیار ضعیف تمایل دارد. ذکر این نکته حایز اهمیت است که بیشتر پژوهشهای صورت گرفته در نمایهسازی محتوایی تصاویر، توسط متخصصان رایانه و الکترونیک صورت گرفته که این مسئله نشانگر اهمیت بالای این حوزه است. ضمن این که نتایج برخی از این پژوهشها مانند «منصوری» (1387)، «فتحیان» (1390) و «اوزندی»[26] (2010) با نتایج پژوهش حاضر همسوست.
در کل، نتایج تحلیلهای آماری دادههای پژوهش بیانگر این است که در بازیابی تصاویر موتورهای جستجوی مورد مطالعۀ این پژوهش بر اساس نمایهسازی مبتنی بر متن و محتوا تفاوت معناداری وجود دارد. همچنین، موتور جستجوی گوگل در تمام معیارهای مورد پژوهش بیشترین امتیاز را کسب کرد و کارآمدترین موتور جستجو در این پژوهش شناخته شد که این مسئله با یافتههای پژوهش «کیدامبی» (2010) همسوست. نیز یاهو، لایکاس، پیکسرچ و اکسالید بر اساس معیارهای این پژوهش و درصد فراوانی کسب شده، به ترتیب رتبههای دوم تا پنجم را کسب کردهاند. این نکته نیز قابل توجه است که بر اساس نتایج حاصل از پژوهش حاضر، موتورهای جستجوی عمومی در این زمینه نسبت به موتورهای جستجوی تخصصی مورد مطالعه عملکرد بهتری داشتند.در خاتمه، پیشنهاد میشود برای توجه بیشتر به نمایهسازی و بازیابی تصاویر در موتورهای جستجو، طراحان امکاناتی از جمله: ترکیب همزمان چند رنگ، افزودن کد مخصوصی برای حقّ مؤلف تصاویر، اعمال همۀ مؤلفههای این پژوهش به صورت منو و زیر منوی در موتورهای جستجوی تصاویر در نظر گرفته شود. همچنین، برای پژوهشهای آتی نیز پیشنهاد میشود کاربرد یادگیری کاربران برای رفع شکاف معنایی تصاویر، کاربرد تصاویر در مدیریت دانش و دانش معنایی، مؤلفههای رابط کاربر در نظامهای بازیابی تصاویر بررسی شود.