ارزیابی موتورهای جستجو در بازیابی تصاویر بر اساس نمایه سازی مبتنی بر متن و محتوا

نوروزی, یعقوب; سوری, فرشته

ارزیابی موتورهای جستجو در بازیابی تصاویر بر اساس نمایه سازی مبتنی بر متن و محتوا

نوع مقاله : مقاله پژوهشی

نویسندگان

یعقوب نوروزی ¹

فرشته سوری ²

¹ عضو هیئت علمی گروه علم اطلاعات و دانش شناسی دانشگاه قم

² گروه علوم کتابداری و اطلاع رسانی، دانشکده علوم انسانی، دانشگاه آزاد اسلامی واحد همدان، همدان، ایران

چکیده

هدف: هدف پژوهش حاضر، شناسایی توانمندیها و تفاوتهای موتورهای جستجوی مورد مطالعه در بازیابی تصاویر بر اساس نمایه‌سازی مبتنی بر متن و محتواست.
روش:پژوهش حاضر از نوع کاربردی است. روش مورد استفاده در این پژوهش از نوع تحقیقات ارزیابانه است. پنج موتور جستجو شامل گوگل، یاهو، پیک‌سرچ، لایکاس و اکسالید که قابل دسترس و سازگار با هدفهای پژوهش بودند، به عنوان جامعة پژوهش انتخاب شدند. جمع‌آوری اطلاعات به شیوۀ مشاهده و با استفاده از سیاهۀ محقق‌ساخته صورت گرفت. سیاهۀ مورد استفاده شامل40 مؤلفه بود که سه بخش اصلی (معیارهای ارزیابی موتورهای جستجوی تصاویر، بازیابی تصاویر بر اساس نمایه‌سازی مبتنی بر متن و محتوا) و یازده زیربخش را شامل می‌شود.
یافته‌ها: بر اساس نتایج حاصل، مشخص شد موتور جستجوی گوگل نسبت به دیگر موتورها وضعیت مطلوب‌تری را در بازیابی تصاویر دارد و به عنوان کارآمدترین موتور جستجو در بازیابی تصاویر در این پژوهش شناخته شد. در جایگاه‌های بعدی نیز به ترتیب یاهو، لایکاس، اکسالید و پیک سرچ بر اساس درصد فراوانی کسب شده در معیارهای این پژوهش، رتبه‌بندی شدند. همچنین، با توجه به آزمون فرضیه‌های پژوهش در بازیابی تصاویر بین موتورهای جستجوی مورد مطالعه بر اساس نمایه‌سازی مبتنی بر متن و محتوا، تفاوت معناداری وجود دارد.
بحث و نتیجه‌گیری: براساس نتایج پژوهش مشخص شد که موتورهای جستجوی عمومی نسبت به موتورهای جستجوی تخصصی، عملکرد بهتری در بازیابی تصاویر دارند. بنابراین، جستجوگران تصاویر در وب می‌توانند در انتخاب موتور جستجوی متناسب با نیاز خود بهتر تصمیم‌گیری کنند. همچنین، نتایج حاصل می‌تواند به متولیان موتورهای جستجوی مورد مطالعه و طراحان داخلی برای طراحی بهتر کمک کند. ضمن این که سیاهه تهیه شده در این پژوهش می‌تواند در حوزه‌های مشابه نیز مورد استفاده قرار گیرد.
کلید‌واژه‌ها: تصویریابی الکترونیکی، موتورهای جستجوی عمومی ، نمایه‌سازی تصاویر، نمایه‌سازی متنی، نمایه‌سازی محتوا.

کلیدواژه‌ها

تصویریابی الکترونیکی

موتورهای جستجوی عمومی

نمایه‌سازی تصاویر

نمایه‌سازی متنی

نمایه‌سازی محتوا

انسان امروزی در همه جا و در هر شرایطی در محاصرۀ تصاویر قرار دارد و آن را در تمام جنبههای زندگی خود به کار میگیرد (اسمیت[3]، 2001). چنان که «هوو»[4] (2004) نیز بیان می‌کند، تصاویر ابزار قدرتمندی برای انتقال اطلاعات به شمار می‌روند و در ترکیب با متون می‌توانند اطلاعاتی را که با کلمات قابل توصیف نیستند، به نحو بهتری منتقل کنند. ماهیت چند بُعدی تصاویر باعث می‌شود هر کاربری با توجه به نیاز خود، نگاه ویژه‌ای به یک تصویر داشته باشد، و حتی با هدفی جدا از هدف خالق تصویر، آن را به کارگیرد. این مسئله به‌خصوص زمانی که تصاویر رمزی و نمادین هستند، بسیار جدی‌تر است (کرمی، 1385). «حسن و ژانگ»[5] (2001) نیز معتقدند در حقیقت، مفاهیم موجود در هر تصویر با توجه به جنبههای فرهنگی، آموزشی، پژوهشی، علمی و...متفاوت است. وجود یک تصویر در ترکیب با متن می‌تواند به درک و انتقال مفاهیم موجود در آن کمک کند، حال آن که همان تصویر در متنی دیگر مفهوم دیگری را تداعی می‌کند. از سوی دیگر، با توجه به ارزش ذاتی تصاویر، باید اذعان داشت که نحوۀ سازماندهی تصاویر تا حدود زیادی میزان بهره‌گیری و نتایج حاصل از آن را مشخص می‌کند. واژگان نمایه‌سازی تصاویر نه تنها باید مواردی مانند عنوان و خالق و ناشر آنها را پوشش دهد، بلکه مفاهیم مورد نظر خالق از خلق آن اثر را نیز باید مدنظر قرار دهد. به عبارت دیگر، وقتی در یک پایگاه اطلاعاتی، یک مقالۀ کوتاه باحدود 20واژه نمایه‌سازی می‌شود، تصاویر آن را نیز باید دست کم با همان عمق تجزیه‌وتحلیل کرد(رابرتز[6]، 2001). بنابراین، روشن است که نمایه‌سازی تصاویر، فعالیتی آسان و ساده نیست. فراهم کردن نقاط دسترسی متعدد برای کاربرانی که قصد دارند تصاویر را بازیابی کنند، مستلزم هزینۀ فراوان و فعالیتی مداوم است (عباس‌پور، 1384). به لحاظ روش، نمایهسازی تصاویر دو بُعد اصلی متن و محتوا را دربر می‌گیرد که در هنگام نمایهسازی باید به آنها توجه نمود. در نمایه‌سازی مبتنی بر متن، اطلاعات مربوط به متن خود تصویر بر اساس موقعیتهایشان رده‌بندی می‌شوند که گروه‌هایی مانند: نام فایل تصویر، عنوان تصویر، موضوع تصویر، برچسب اچ.تی.ام. ال.[7]، سیاه و سفید در برابر رنگی، اندازۀ تصویر، نوع فایل، اندازه فایل و تاریخ فایل را در بر می‌گیرد (باکستر، 1995). چنان که در نمایهسازی مبتنی بر محتوا ویژگیهای اصلی و اولیۀ تصویر مانند رنگ، شکل، بافت؛ ویژگیهای منطقی نظیر موجودیت اشیای نمایش داده شده در تصویر؛ و ویژگیهای خاص تصویر مانند مفهوم و معنای تصویر را در بر می‌گیرد (چو، 2001).

از سوی دیگر، با ظهور محیطهای اطلاعاتی جدید، شیوه‌های ذخیره و بازیابی تصاویر از جمله نمایهسازی آنها با تغییرات عمده‌ای مواجه شده است. از جمله، ابزارهای قدرتمندی که در این عرصه شروع به فعالیت کرده‌اند، موتورهای جستجو هستند که پس از درک اهمیت تصاویر به عنوان منابع اطلاعاتی ارزشمند، امکان نمایه‌سازی و بازیابی آن را نیز فراهم آوردند و به کاربران این فرصت را دادند تا تصاویر مورد نظر خود را بازیابی و جایابی کنند(حسن و ژانگ،2001). بنابراین، موتورهای جستجو در حال حاضر نه تنها وسیله‌ای براى دسترسی به اطلاعات متنی هستند، بلکه سازماندهی و بازیابی تصاویر را نیز جزء اهداف خود برای جلب بیشتر رضایت کاربران قرار دادهاند. اما باید این مسئله را مدنظر قرار داد که توانمندی موتورهای جستجو، به ویژه جامعۀ مورد مطالعه پژوهش حاضر، در این زمینه چگونه است و این موتورها تا چه حد توانسته‌اند شیوه‌های مربوط به نمایه‌سازی تصاویر را رعایت کنند. بنابراین، چنان که «کوشا» (1381) بیان می‌دارد، آشنایی با امکانات، قابلیتها و تواناییهاى موتورهای جستجوی اینترنتی اهمیت خاصی دارد. پژوهش حاضر نیز با توجه به اهمیت و ضرورت ارزیابی، موتورهای جستجوی گوگل[8]، یاهو[9]، لایکاس[10]، پیک سرچ[11] و اکسالید[12]را در بازیابی تصاویر بر اساس نمایه‌سازی مبتنی بر متن و محتوا در دستور کار خود قرارداد. البته، در این راستا تاکنون، مطالعات و ارزیابی‌هایی نیز انجام شده است که به طور مستقیم و غیر مستقیم این مسئله را مدنظر قرار داده و بر نقش مهم و ارزندۀ موتورهای جستجو در بازیابی تصاویر و شناخت برخی امکانات آنها برای جستجوگران و دیگر کاربران، تأکید کردهاند. در این رابطه میتوان به برخی از این پژوهشها از جمله، مهرآبادی (1385)، منصوری (1387)، اسفندیاریمقدم و بهاریموفق (1388)، لاکدشتی (1388)، پورسیستانی (1389)، فتحیان (1390)، فرخزاد (1390)، چویی و راسموسن[13](2003)، دایامنت[14] (2007)، گوپین ویرمی و زونلی[15] (2007)،تیسی[16] (2008)، اینکپن[17] و همکاران (2008)، واسیلیوا[18](2009)، اوزندی[19] (2010) و کیدامبی[20] (2010) اشاره کرد. نیز، در زمینۀ پژوهش در نمایهسازی تصاویر و ارزیابی موتورهای جستجو تاکنون پژوهشهای مختلفی از زوایای متعدد صورت گرفته است. در ادامه، به برخی از این پژوهشها که به لحاظ روش و برخورداری ازمعیارهای خاص شباهت بیشتری با موضوع پژوهش حاضر دارند، اشاره‌ می‌شود.

در ایران «مهرآبادی» (1385) در پژوهش خود به مقایسه موتورهای کاوش عمومی وب از لحاظ نحوۀ نمایهسازی اطلاعات پرداخت. موتورهای کاوش مورد بررسی در این پژوهش عبارت بودند از: گوگل، آلتاویستا[21] و آلدوب[22]. بر اساس نتایج حاصل، آلدوب در تمام معیارها بیشترین امتیاز را کسب کرد. «منصوری» (1387) در پژوهش خود تلاش کرد تا ساختاری برای پیادهسازی یک سیستم بازیابی تصاویر ارائه دهد. در این سیستم از ویژگیهای رنگ و بافت برای بازیابی تصاویر استفاده و در نهایت مدلی بر این مبنا ارائه شد. «اسفندیاری مقدم و بهاری موفق» (1388) در پژوهشی با هدف ارائه سیاهۀ وارسی برای بررسی امکانات جستجو، 19فراموتور را بررسی و ارزیابی کردند. نتایج به دست آمده از این پژوهش نشان داد تمامی 19 فراموتور بررسی با وجود استفاده از برخی امکانات جستجو، برخی قابلیت جستجوی کلمات فرامتنی در سایت‌ها و نمایش حجم صفحات جستجو شده، در هیچ فراموتوری مشاهده نشد. «لاکدشتی» (1388) در رسالۀ خود با استفاده از روش پیمایشی، مدلی را برای طراحی و پیاده‌سازی روش جدیدی برای بازیابی تصویر، بر اساس محتوا و معانی نهفته در تصویر ارائه کرد. همچنین «پورسیستانی» (1389)پژوهشی را با هدف این که در بازیابی تصاویر باید ابتدا ویژگیهای دیداری آنها استخراج و سپس تصاویر نمایه‌سازی شوند، انجام داد است. در نهایت، یک روش جدید برای استخراج ویژگیهای رنگ و بافت از تصاویر فشرده شده در قلمروJPEG ارائه داده است. «فتحیان» (1390) نیز پژوهشی را با هدف استفاده از دو ویژگی رنگ و بافت تصاویر با هدف توصیف شباهت تصاویر انجام و ساختاری را برای پیاده‌سازی یک سیستم بازیابی تصاویر بر اساس محتویات بصری با استفاده از یادگیری نظرهای کاربران ارائه داد. در نهایت، «فرخ‌زاد» (1390) در پژوهش خود، میزان دقت ابرموتور Yippy، در بازیابی تصاویر همراه با متن با استفاده از روش خوشه‌بندی نتایج جستجو را بررسی نمود. از بین خوشه‌های ارائه شده به کاربر، خوشه‌ای با عنوان تصویر وجود دارد که تصاویر همراه با متن را گردآوری می‌کند. تعیین ضریب دقت این ابرموتور با استفاده از فرمول دقت و ارزیابی ربط، انجام گرفت.

در خارج از ایران، «چویی و راسموسن»(2003) پرسشهای فرمولبندی شده توسط اعضای هیئت علمی و دانش‌آموختگانی که اطلاعات تصویری دربارة تاریخ آمریکا را در مجموعه حافظه کتابخانه کنگره آمریکا جستجو می‌کردند، بررسی نمودند. نتایج نشان داد در بیشتر موارد برچسبهای تصاویر با محتوای آنها همخوانی دارد. «دایامنت» (2007) در پژوهش خود، نرم‌افزاری پیوسته برای پردازش اطلاعات دیداری معرفی کرد که با شناسایی و قابلیت حل دشواریهای پردازش ادارکی و شناختی تصاویر، ویژگیهای اساسی آن را توصیف می‌کرد. در پژوهش دیگری که توسط «گوپین، یرمی و زونلی» (2007) انجام گرفت، فناوریهای نوینی معرفی شد که به کاربر اجازه می‌دهد در پایگاه‌های اطلاعاتی تصویرهای بزرگ به مرور و هدایت جست‌وجو بپردازد و تصاویری را با تکیه بر روشهای مرور و سپس هدایت سریع و قابل کنترل، بازیابی کند. همچنین «اینکپن و همکاران» (2008) در پژوهش خود با بررسی روش خوشه‌بندی خاصی برای بازیابی تصاویرکه در قالب خوشه‌بندی سلسله مراتبی ظاهر می‌شود، ابعاد این مسئله را بررسی کردند. نتایج نشان داد روشهای متعدد خوشه‌بندی تصاویر به بازیابی بهتر و دقیق‌تر تصاویر مورد نظر منجر می‌شود. ازسوی دیگر، «واسیلیوا» (2009) در پژوهش خود به نظام بازیابی تصاویر بر مبنای محتوا اشاره می‌کند که به حل بخشی از مشکلات این حوزه نظر دارد و نتیجة پژوهش خود را تحلیل ویژگیهایسطحپایینتصاویروساختار خصوصیاتبرداری، درکنارنمایه‌سازی چندبُعدی، طراحیمناسبرابطکاربرو مصورسازیداده که می‌تواندبهبازیابیمؤثرتصاویرمنجرشود، بیان نمود. «اوزندی» (2010) با هدف ارائه روشی در بازیابی تصاویر، پژوهشی انجام داد. وی چارچوب تغییر ناپذیری هندسی را ارائه کرد که از مقاطع مخروطی از مرزهای جسم در تصاویر تولید می‌شود و به دلیل خاصیت تغییرناپذیری آن مورد استفاده قرارگرفته است. وی آن را برای تشخیص و بازیابی تصاویر پیشنهاد داد و در نهایت این روش بازیابی را به نام امضای ثابت تصاویر نامگذاری کرد. «کیدامبی» (2010) در پژوهشی با هدف تعامل انسان و رایانه در نمایه‌سازی تصاویر در موتورهای جستجو، به بررسی سه موتور جستجوی گوگل، یاهو، ام.اس.ان.[23]پرداخت. طبق نتیجه، موتورجستجوی گوگل عملکرد بهتری در بازیابی تصاویر به دست آورد.

از بررسی اجمالی پژوهشهای فوق مشخص می‌شود که بازیابی تصاویر از نظر متخصصان فنی (رایانه و الکترونیک) و ارزیابی موتورهای جستجو از نظر متخصصان علوم‌انسانی (علم اطلاعات) مورد توجه بوده است، هر چند اغلب پژوهشهای نمایه‌سازی تصاویر از دیدگاه متخصصان رایانه و الکترونیک انجام شده است. نیز ارزیابی موتورهای جستجو بیشتر در زمینۀ بازیابی اطلاعات متنی است، ولی با ترکیب این دو مقولۀ فنی و نظری با هم، یعنی، در زمینه بازیابی تصاویر بر اساس نمایه‌سازی آنها در موتورهای جستجو، مجالی برای پژوهشهای بیشتر وجود دارد. بنابراین، پژوهش حاضر با هدف شناسایی توانمندیهای موتورهای جستجوی مورد مطالعه در بازیابی تصاویر بر اساس نمایه‌سازی مبتنی بر متن و محتوا اجرا و سعی شد تا به پرسشهای زیر پاسخ داده شود:

1. قابلیتهای بازیابی تصاویر در موتورهای جستجوی مورد مطالعة این پژوهش چه تفاوتهایی با یکدیگر دارد؟

2. بازیابی تصاویر در موتورهای جستجوی مورد مطالعة این پژوهش بر اساس نمایه‌سازی مبتنی بر متن، چگونه است؟

3. بازیابی تصاویر در موتورهای جستجوی مورد مطالعة این پژوهش بر اساس نمایه‌سازی مبتنی بر محتوا چگونه است؟

4. کارآمدترین موتور جستجو در بازیابی تصاویر بر اساس حوزه‌های مورد مطالعه در این پژوهش کدام است؟

فرضیه‌های پژوهش

1. در بازیابی تصاویرِ موتورهای جستجوی مورد مطالعة در این پژوهش بر اساس نمایه‌سازی مبتنی بر متن، تفاوت معناداری وجود دارد.

2. در بازیابی تصاویرِ موتورهای جستجوی مورد مطالعة در این پژوهش بر اساس نمایه‌سازی مبتنی بر محتوا، تفاوت معناداری وجود دارد.

روش‌شناسی و جامعۀ‌آماری پژوهش

پژوهش حاضر از نوع کاربردی و روش مورد استفاده در آن از نوع تحقیقات ارزیابانه است. بررسی بازیابی تصاویر در موتورهای جستجو به صورت مشاهده مستقیم انجام شد. جامعۀ آماری پژوهش را موتورهای جستجوی گوگل، یاهو، لایکاس، پیک سرچ و اکسالید تشکیل می‌دهد، که دو موتور جستجوی عمومی گوگل و یاهو به دلیل جامعیت، و سه موتور جستجوی تخصصی بازیابی چندرسانه‌ای و تصاویر انتخاب شدند. ابزار گردآوری اطلاعات مورد استفاده در این پژوهش، سیاهۀ محقق ساخته است که بر اساس بررسیهای متون و منابع طراحی شد. همچنین، در تهیۀ بخش اول این سیاهه یعنی معیارهای ارزیابی موتورهای جستجو، از معیارهای تیسی[24] (2008) استفاده شد. سیاهۀ مورد استفاده در مجموع شامل40 مؤلفه بود که شامل سه بخش اصلی است: معیارهای ارزیابی موتورهای جستجوی تصاویر، بازیابی تصاویر بر اساس نمایه‌سازی مبتنی بر متن و بازیابی تصاویر بر اساس نمایه‌سازی مبتنی بر محتوا نیز در ارزیابی، فقط10 صفحۀ اول تصاویر بازیابی شده در هر موتور جستجو بررسی شد. با استفاده از نظرهای متخصصان علم ‌اطلاعات و دانش‌شناسی، از اعتبار (روایی) سیاهۀ وارسی اطمینان حاصل و نظرهای سودمند آنها در سیاهۀ نهایی اعمال گردید. در واقع، چک لیست متشکل از معیارهاست، بنابراین قابل اعتماد است. همچنین برای اندازه‌گیری پایایی (اعتماد) مقیاس، پس از گردآوری و آماده‌سازی اولیۀ داده‌های استخراج شده از سیاهه ارزیابی، برای تجزیه و تحلیل آماری از نرم‌افزار آماری SPSS₁₆استفاده شد. از جدولهای فراوانی و درصد فراوانی تجمعی برای توصیف سؤالهای سیاهه ارزیابی، و برای آزمون فرضیه‌های تحقیق نیز از آزمون T گروه‌های مستقل استفاده شد.

یافته‌های پژوهش

سؤال اول: قابلیتهای بازیابی تصاویر در موتورهای جستجوی مورد مطالعة این پژوهش چه تفاوتهایی با یکدیگر دارد؟

برای پاسخ به این پرسش، سؤالهای مربوط به معیارهای ارزیابی موتورهای جستجوی تصاویر (دامنۀ پوشش، گزینه‌های جستجو، عملکرد و کارآیی، نحوۀ نمایش، پشتیبانی و حقّ مؤلف) در سیاهۀ ارزیابی بررسی شد که به تفکیک در ادامه می‌آید.

دامنۀ پوشش

جدول 1.دامنۀ پوشش در بازیابی تصاویر در موتورهای جستجوی مورد مطالعه برحسب درصد فراوانی

موتورهای جستجو	بسیار ضعیف	ضعیف	متوسط	خوب	بسیار خوب
یاهو	50	0	50	0	0
پیک سرچ	50	0	0	50	0
گوگل	0	0	0	0	100
لایکاس	100	0	0	0	0
اکسالید	100	0	0	0	0

چنان که از جدول 1 و درصد فراوانی دامنۀ پوشش در هر یک از موتورهای جستجو مورد مطالعۀ پژوهش مشهود، دامنه پوشش در گوگل با 100% فراوانی بسیار خوب و در لایکاس و اکسالید با 100% فراوانی بسیار ضعیف است.

گزینه‌های جستجو

جدول 2.گزینه‌های جستجو در بازیابی تصاویر در موتورهای جستجوی مورد مطالعه برحسب درصد فراوانی

موتورهای جستجو	بسیار ضعیف	ضعیف	متوسط	خوب	بسیار خوب
یاهو	0	0	33	0	67
پیک سرچ	0	33	33	33	0
گوگل	0	0	0	0	100
لایکاس	33	33	33	0	0
اکسالید	0	0	0	0	100

چنان که در جدول 2 و وضعیت گزینه‌های جستجو در هر یک از موتورهای جستجوی مورد مطالعه مشهود است، گزینه‌های جستجو در گوگل و اکسالید با 100% فراوانی بسیار خوب و در لایکاس با 33% فراوانی بسیار ضعیف است.

عملکرد و کارآیی

جدول 3. عملکرد و کارایی در بازیابی تصاویر در موتورهای جستجوی مورد مطالعه برحسب درصد فراوانی

موتورهای جستجو	بسیار ضعیف	ضعیف	متوسط	خوب	بسیار خوب
یاهو	12.5	0	12.5	25	50
پیک سرچ	12.5	50	37.5	0	0
گوگل	0	0	12.5	25	62.5
لایکاس	0	12.5	50	25	12.5
اکسالید	0	50	25	12.5	12.5

چنان که در جدول 3 و درصد فراوانی عملکرد وکارایی در هر یک از موتورهای جستجو مورد مطالعۀ مشاهده می‌شود، عملکرد و کارایی در گوگل با 62.5% فراوانی بسیار خوب، ولی در یاهو و پیک سرچ با 12.5% فراوانی بسیار ضعیف است.

نحوۀ نمایش

جدول 4. نحوۀ نمایش دربازیابی تصاویر در موتورهای جستجوی مورد مطالعه برحسب درصد فراوانی

موتورهای جستجو	بسیار ضعیف	ضعیف	متوسط	خوب	بسیار خوب
یاهو	50	0	0	0	50
پیک سرچ	50	0	0	33	17
گوگل	33	0	0	0	67
لایکاس	17	16	0	17	50
اکسالید	50	0	0	0	50

جدول 4 و درصد فراوانی نحوۀ نمایش دربازیابی تصاویر در موتورهای جستجوی مورد مطالعه پژوهش نشان می‌دهد که نحوۀ نمایش در گوگل با 67% فراوانی بسیارخوبو در یاهو و پیک سرچ و اکسالید با 50% فراوانی بسیار ضعیف و خوب است.

پشتیبانی

جدول 5. پشتیبانی در بازیابی تصاویر در موتورهای جستجوی مورد مطالعه برحسب درصد فراوانی

موتورهای جستجو	بسیار ضعیف	ضعیف	متوسط	خوب	بسیار خوب
یاهو	50	50	0	0	0
پیک سرچ	50	50	0	0	0
گوگل	0	50	0	50	0
لایکاس	50	50	0	0	0
اکسالید	50	50	0	0	0

براساس داده های جدول 5، پشتیبانی در بازیابی تصاویر در گوگل با 50% فراوانی خوبو در بقیه موتورها با 50% فراوانی، بسیار ضعیف و ضعیف است.

حق مؤلف

جدول 6.حق مؤلف در بازیابی تصاویر در موتورهای جستجوی مورد مطالعه برحسب درصد فراوانی

موتورهای جستجو	بسیار ضعیف	ضعیف	متوسط	خوب	بسیار خوب
یاهو	100	0	0	0	0
پیک سرچ	100	0	0	0	0
گوگل	0	0	0	0	100
لایکاس	0	0	0	0	100
اکسالید	100	0	0	0	0

از نتایج جدول 6 و درصد فراوانی حق مؤلف در هر یک از موتورهای جستجوی مورد مطالعۀ پژوهش مشهود است که رعایت حق مؤلف در گوگل و لایکاس با 100% فراوانی بسیارخوب و در یاهو و پیک سرچ و اکسالید با 100% فراوانی، بسیار ضعیف است. در ادامه، در نمودار1 تفاوت بین موتورهای جستجو در قابلیتهای بازیابی تصاویر و این که هر یک از موتورهای جستجو دارای چه وضعیتی هستند، ارائه شده است.

سؤال دوم: بازیابی تصاویر در موتورهای جستجوی مورد مطالعة این پژوهش بر اساس نمایه‌سازی مبتنی بر متن چگونه است؟

برای پاسخ به پرسش، مؤلفه‌های مربوط به نمایه‌سازی مبتنی بر متن تجزیه‌وتحلیل می‌شود.

جدول 7. اطلاعات متنیدر بازیابی تصاویر در موتورهای جستجوی مورد مطالعه برحسب درصد فراوانی

موتورهای جستجو	بسیار ضعیف	ضعیف	متوسط	خوب	بسیار خوب
یاهو	14	29	0	43	14
پیک سرچ	14	29	14	14	29
گوگل	0	14	14	14	57
لایکاس	43	14	14	29	0
اکسالید	43	0	0	0	57

چنان که از جدول 7 و درصد فراوانی نمایه‌سازی مبتنی بر متن در هر یک از موتورهای جستجوی مورد مطالعۀ پژوهش مشهود است، اطلاعات متنی تصاویر در گوگل و اکسالید با 57% فراوانی بسیارخوب ولی در لایکاس با 43% فراوانی، بسیار ضعیف است. همچنین، مقایسۀ معیارهای بازیابی تصاویر بر اساس نمایه‌سازی مبتنی بر متن در موتورهای جستجوی مورد مطالعه، در نمودار 2 نیز قابل مشاهده است.

سؤال سوم: بازیابی تصاویر در موتورهای جستجوی مورد مطالعة این پژوهش بر اساس نمایهسازی مبتنی بر محتوا، چگونه است؟

در این قسمت مؤلفه‌های مربوط به موضوع و مفهوم، رنگ، شکل و بافتِ تصاویر در موتورهای جستجو تجزیه‌وتحلیل میشود.

موضوع و مفهوم

جدول 8. موضوع و مفهوم دربازیابی تصاویر در موتورهای جستجوی مورد مطالعه برحسب درصد فراوانی

موتورهای جستجو	بسیار ضعیف	ضعیف	متوسط	خوب	بسیار خوب
یاهو	0	0	0	0	100
پیک سرچ	0	33	67	0	0
گوگل	0	0	0	0	100
لایکاس	0	0	0	33	67
اکسالید	0	0	33	33	33

چنان که در جدول 8 مشاهده می‌شود، وضعیت موضوع و مفهوم در گوگل و یاهو با 100% فراوانی بسیارخوب، ولی در پیک سرچ با 33% ضعیف است.

رنگ

جدول9.رنگ در بازیابی تصاویر در موتورهای جستجوی مورد مطالعه برحسب درصد فراوانی

موتورهای جستجو	بسیارضعیف	ضعیف	متوسط	خوب	بسیار خوب
یاهو	0	33	0	67	0
پیک سرچ	33	0	33	0	33
گوگل	0	0	33	33	33
لایکاس	0	0	100	0	0
اکسالید	33	0	33	0	33

داده‌های جدول 9 نشان می دهد وضعیت رعایت رنگ در گوگل با 33% در حد متوسط و یاهو با 67% خوب است. همچنین، در اکسالید و پیک سرچ با 33% فراوانی در حد متوسط است.

شکل

جدول 10. شکل در بازیابی تصاویر در موتورهای جستجوی مورد مطالعه برحسب درصد فراوانی

موتورهای جستجو	بسیار ضعیف	ضعیف	متوسط	خوب	بسیار خوب
یاهو	33	33	33	0	0
پیک سرچ	67	33	0	0	0
گوگل	33	0	33	33	0
لایکاس	33	0	33	33	0
اکسالید	67	0	33	0	0

طبق جدول10، رعایت معیارهای شکل در گوگل و لایکاس در مقایسه با بقیه خوب و در پیک سرچ واکسالید بسیار ضعیف است.

بافت

جدول 11. بافت در بازیابی تصاویر در موتورهای جستجوی مورد مطالعه برحسب درصد فراوانی

موتورهای جستجو	بسیار ضعیف	ضعیف	متوسط	خوب	بسیار خوب
یاهو	0	0	50	50	0
پیک سرچ	50	0	50	0	0
گوگل	0	0	50	0	50
لایکاس	0	0	100	0	0
اکسالید	50	0	50	0	0

چنان که ازجدول 11 مشهود است، رعایت معیارهای بافت در گوگل با 50% فراوانی به سمت بسیارخوب تمایل دارد، و در پیک سرچ و اکسالید با 50% به سمت بسیار ضعیف و متوسط است.

در نتیجه، طبق تجزیه و تحلیل مؤلفههای بازیابی تصاویر بر اساس نمایه‌سازی مبتنی بر محتوا (11مؤلفه) در هر یک از موتورهای جستجوی مورد مطالعۀ پژوهش به صورت جداگانه، دریافت گردید که موتورجستجوی گوگل با 45% به سمت بسیار خوب و یاهو با 52% به سمت خوب و لایکاس با 55% به سمت متوسط است. پیک‌سرچ و اکسالید با 72% به سمت بسیار ضعیف میباشند. نیز، در نمودار3 وضعیت بازیابی تصاویر در موتورهای جستجوی مورد مطالعۀ این پژوهش بر اساس نمایه‌سازی مبتنی بر محتوا، بر اساس محاسبۀ میانگین نمایان است.

سؤال چهارم: کارآمدترین موتور جستجو در بازیابی تصاویر بر اساس حوزه‌های مورد مطالعه در این پژوهش کدام است؟

به منظور پاسخ به پرسش چهارم، کل مؤلفه‌های بازیابی(40مؤلفه) برای هر یک از موتورهای جستجو مورد مطالعۀ پژوهش با استفاده آزمون کروسکال والیس به صورت جداگانه تجزیه و تحلیل شد. نتایج در جدول 13 ارائه شده است.

جدول13. رتبۀ میانگین موتورهای جستجوی در بازیابی تصاویر بر اساس حوزه‌های مورد مطالعه

موتورهای جستجو	تعداد سؤالات	رتبه میانگین
یاهو	40	105.16
پیک سرچ	40	76.24
گوگل	40	136.62
لایکاس	40	92.88
اکسالید	40	91.60

جدول14. تست آمارۀ آمون برای کارآمدترین موتور جستجو در بازیابی تصاویر بر اساس حوزه‌های مورد مطالعه

تست آماره آمون
کای اسکور	25.885
درجه آزادی	4
سطح معنادار	0.00

براساس جدول 13 نتیجه‌گیری می‌شود که موتور جستجوی گوگل بیشترین رتبۀ میانگین را یه خود اختصاص داده است و پس از گوگل به ترتیب یاهو ، لایکاس، اکسالید و پیک سرچ قرار دارند. همچنین، با توجه به سطح معناداری به دست آمده در جدول 14 (0.00)، چون آلفای مفروض از 0.05 کوچکتر است، پس با اطمینان 0.95 درصد نتیجه‌گیری می‌شود که کارآمدترین موتور جستجو، گوگل است.

پاسخ به فرضیههای پژوهش

فرضیه اول: در بازیابی تصاویر موتورهای جستجوی مورد مطالعۀ این پژوهش بر اساس نمایه‌سازی مبتنی بر متن، تفاوت معناداری وجود دارد.

H₀: در بازیابی تصاویر موتورهای جستجوی مورد مطالعۀ این پژوهش بر اساس نمایه‌سازی مبتنی بر متن تفاوت معناداری وجود ندارد.

H₁: در بازیابی تصاویر موتورهای جستجوی مورد مطالعۀ این پژوهش بر اساس نمایه‌سازی مبتنی بر متن تفاوت معناداری وجود دارد.

جدول13. بررسی اختلاف بین بازیابی موتورهای جستجو بر اساس نمایه‌سازی مبتنی بر متن با استفاده از آزمون تی(T) گروههای مستقل

متغیر	میانگین	واریانس	آماره تی	درجه آزادی	سطح معنادار
موتورهای جستجو	68.80	15.67	6.35	8	0.000
نمایهسازی مبتنی بر متن	22.40	4.61	6.35	8	0.000

چنان که در جدول 13 ملاحظه میشود، چون سطح معناداری به دست آمده0.00از آلفای مفروض 0.05 کوچکتر است، پس فرض صفر با اطمینان 0.95 رد و فرض یک تأیید می‌شود؛ یعنی در بازیابی تصاویر بین موتورهای جستجوی مورد مطالعۀ این پژوهش بر اساس نمایه‌سازی مبتنی بر متن، تفاوت معناداری وجود دارد.

فرضیۀ دوم: در بازیابی تصاویر موتورهای جستجوی مورد مطالعۀ این پژوهش بر اساس نمایهسازی مبتنی بر محتوا، تفاوت معناداری وجود دارد.

H₀: در بازیابی تصاویر موتورهای جستجوی مورد مطالعۀ این پژوهش بر اساس نمایهسازی مبتنی بر محتوا تفاوت معناداری وجود ندارد.

H₁: در بازیابی تصاویر موتورهای جستجوی مورد مطالعۀ این پژوهش بر اساس نمایهسازی مبتنی بر محتوا تفاوت معناداری وجود دارد.

جدول 14. بررسی اختلاف بین بازیابی موتورهای جستجو بر اساس نمایهسازی مبتنی بر محتوا با استفاده از آزمون تی(T) گروههای مستقل

متغیر	میانگین	واریانس	آماره تی	درجه آزادی	سطح معنادار
موتورهای جستجو	68.80	15.67	4.50	8	0.002
نمایهسازی مبتنی بر محتوا	34.40	6.80	4.50	8	0.002

چنان که در جدول 14 ملاحظه می‌شود، چون سطح معناداری به دست آمده0.002از آلفای مفروض 0.05 کوچکتر است، پس فرض صفر با اطمینان 0.95 رد و فرض یک تأیید می‌شود؛یعنی در بازیابی تصاویر بین موتورهای جستجوی مورد مطالعه در این پژوهش بر اساس نمایه‌سازی مبتنی بر محتوا تفاوت معناداری وجود دارد.

بحث و نتیجه‌گیری

با توجه به اهمیت بازیابی اطلاعات در دنیای وب و ظهور حوزه‌های جدید بازیابی اطلاعات از جمله تصاویر، در پژوهش حاضر وضعیت موتورهای جستجوی مورد مطالعه در بازیابی تصاویر بر اساس نمایه‌سازی مبتنی بر متن و محتوا ارزیابی شد. بر اساس یافته‌های پژوهش، مؤلفه‌های بازیابی تصاویر در موتورهای جستجو را می‌توان به شرح زیر، مورد بحث و بررسی قرار داد. در بررسی و ارزیابی مؤلفه‌های فرعی ملاحظه شد که توجه کمی به ذکر تاریخ روزآمدسازی شده است. اما در مقابل با توجه به این نکته که اولویت موتورهای جستجو در بازیابی اطلاعات، برخوردار بودن از امکانات و منوهای جستجوی مناسب است و نیز بر اساس این که جستجوی تصاویر و اطلاعات متنی هر دو از یک درگاه انجام میگیرد، نتایج حاصل وضعیت گزینه‌های جستجو را در موتورهای جستجو بسیارخوب نشان داده است که با یافته‌های پژوهش «اسفندیاری مقدم و بهاری موفق» (1388) نیز همسو است. همچنین در مؤلفههای ربط تصاویر بازیابی شده با جستجوی کاربر، و اعمالِ پیوند در موتورهای جستجو وضعیت ضعیفی مشاهده شد. این نکته نیز قابل توجه است که اگر پشتیبانی اطلاعات در موتورهای جستجوی تصاویر بیشتر مورد توجه قرار گیرد، در حوزۀ علوم به خصوص علومی مانند پزشکی، معماری، هنر و تاریخ بسیار کاربرد دارد، زیرا در این حوزه‌ها بازیابی تصویر مناسب می‌تواند نقش بسزایی در کمک به کاربران داشته باشد. همچنین، نتایج نشان داد رعایت حق مؤلف تصاویر در موتورهای جستجوی تخصصی مورد مطالعه، برخلاف موتورهای عمومی وضعیت مناسبی ندارد که این مسئله جای تأمل بسیاری دارد و نیازمند پژوهشهای بیشتری است. اما در کل، نتایج نشان داد از بین جامعۀ آماری مورد مطالعه، گوگل با کسب رتبۀ میانگین 136.62و یاهو با105.16و لایکاس با 92.88 و اکسالید با 91.60 در نهایت پیک سرچ با 76.24 در رتبه اول تا پنجم قرار دارند. همچنین، در بررسی مؤلفه‌های بازیابی تصاویر بر اساس نمایه‌سازی مبتنی بر متن، نتایج به دست آمده نشان داد در موتورهای جستجوی مورد مطالعه سعی شده است تمامی اطلاعات بصری و متنی تصاویر نمایه‌سازی شود. بنابراین، یافته‌های پژوهش حاضر با پژوهش «چویی و راسموسن»(2003)، پژوهش «فرخ‌زاد» (1390) و«اینکپن و همکاران»[25](2008) همسوست، که نشان از وضعیت بسیار خوب بازیابی تصاویر بر اساس نمایه‌سازی مبتنی بر متن است. ضمن این که نتایج نشان داد موتور جستجوی گوگل و اکسالید با 57% به سمت بسیار خوب، یاهو با 43% به سمت خوب و پیک سرچ با 58% به سمت متوسط و لایکاس با 43% به سمت بسیار ضعیف است. همچنین، نتایج یافته‌های پژوهش در مؤلفه‌های بازیابی تصاویر بر اساس نمایه‌سازی مبتنی بر محتوا نشان داد که وضعیت موتور جستجوی گوگل با45% به سمت بسیار خوب و یاهو با 52% به سمت خوب و لایکاس با 55% به سمت متوسط است. نیز در پیک سرچ و اکسالید با 72% به سمت بسیار ضعیف است. ضمن این که در این زمینه در مؤلفۀ موضوع و مفهوم، نتایج پژوهش حاضر با یافته‌های پژوهش «لاکدشتی» (1388) همسوست. همچنین، با توجه به اهمیت رنگ در تصاویر به عنوان یک مقولۀ کاملاً بصری، متأسفانه بازیابی تصاویر بر اساس رنگ تصاویر در موتورهای جستجو وضعیت متوسطی دارد و ضروری است موتورهای جستجو بیشتر از قبل به این مؤلفه از محتوای تصاویر توجه کنند. البته، امکان ترسیم خود شکل در موتورهای جستجو برای بازیابی تصاویر به جای کلیدواژه ضروری است، زیرا برخی از اشکال زاویه‌‌دار و پیچیده (مانند شکل گلبرگ گلها) از طریق کلیدواژه قابل جستجو نیستند. همچنین، امکان ترسیم شکل برای کاربرانی مانند معماری، گیاه‌شناسی بسیار کاربردی و سودمند است، هر چند در این زمینه نیز نتایج به سمت متوسط و بسیار ضعیف تمایل دارد. ذکر این نکته حایز اهمیت است که بیشتر پژوهشهای صورت گرفته در نمایه‌سازی محتوایی تصاویر، توسط متخصصان رایانه و الکترونیک صورت گرفته که این مسئله نشانگر اهمیت بالای این حوزه است. ضمن این که نتایج برخی از این پژوهشها مانند «منصوری» (1387)، «فتحیان» (1390) و «اوزندی»[26] (2010) با نتایج پژوهش حاضر همسوست.

در کل، نتایج تحلیلهای آماری دادههای پژوهش بیانگر این است که در بازیابی تصاویر موتورهای جستجوی مورد مطالعۀ این پژوهش بر اساس نمایهسازی مبتنی بر متن و محتوا تفاوت معناداری وجود دارد. همچنین، موتور جستجوی گوگل در تمام معیارهای مورد پژوهش بیشترین امتیاز را کسب کرد و کارآمدترین موتور جستجو در این پژوهش شناخته شد که این مسئله با یافته‌های پژوهش «کیدامبی» (2010) همسوست. نیز یاهو، لایکاس، پیک‌سرچ و اکسالید بر اساس معیارهای این پژوهش و درصد فراوانی کسب شده، به ترتیب رتبه‌های دوم تا پنجم را کسب کرده‌اند. این نکته نیز قابل توجه است که بر اساس نتایج حاصل از پژوهش حاضر، موتورهای جستجوی عمومی در این زمینه نسبت به موتورهای جستجوی تخصصی مورد مطالعه عملکرد بهتری داشتند.در خاتمه، پیشنهاد می‌شود برای توجه بیشتر به نمایه‌سازی و بازیابی تصاویر در موتورهای جستجو، طراحان امکاناتی از جمله: ترکیب همزمان چند رنگ، افزودن کد مخصوصی برای حقّ مؤلف تصاویر، اعمال همۀ مؤلفه‌های این پژوهش به صورت منو و زیر منوی در موتورهای جستجوی تصاویر در نظر گرفته شود. همچنین، برای پژوهشهای آتی نیز پیشنهاد می‌شود کاربرد یادگیری کاربران برای رفع شکاف معنایی تصاویر، کاربرد تصاویر در مدیریت دانش و دانش معنایی، مؤلفه‌های رابط کاربر در نظامهای بازیابی تصاویر بررسی شود.

- اسفندیاری‌مقدم، علیرضا و زهره بهاری‌موفق (1388). امکانات جستجو در فراموتورهای جستجو دروب: رویکردی مبتنی برسیاهةوارسی، فصلنامه علوم و فناوری اطلاعات، دوره25، شماره 2، ص265-287.

- پورسیستانی، پردیس (1389). ارزیابی فاکتورهای مؤثر در نمایهسازی و بازیابی تصویر براساس محتوا درحوزه فشردهJPEG، دانشگاه پیامنور، پایاننامه کارشناسیارشد مهندسی کامپیوتر، دانشکده کامپیوترو فناوری اطلاعات.

- عباس‌پور،جواد (1384). نمایه‌سازی تصاویر: چالش و رویکردها، مجله کتابداری، سال نهم، دفترچهل و چهارم،ص 167-177.

- فتحیان، محسن (1390). بازیابی محتوایی تصاویر بر مبنای یادگیری ماشین از طریق تعامل با کاربر، دانشگاه کردستان، دانشکده فنی ومهندسی، پایان‌نامه کارشناسی ارشد مهندسی کامپیوتر.

- فرخ‌زاد، بی‌بی‌فاطمه (1390). بررسی میزان دقت در بازیابی تصاویر همراه با متن با شیوه خوشه‌بندی نتایج جستجوازموتورجستجویYippy، دانشگاه الزهراء، پایان‌نامه کارشناسی ارشد علوم‌انسانی، دانشکده روانشناسی وعلوم تربیتی.

- کرمی، افسانه (1385). نمایه‌سازی تصویر در پایگاه‌های اطلاعاتی، نما مجله الکترونیکی پژوهشگاه اطلاعات و مدارک علمی ایران، شماره سوم،دورهششم.

- کوشا،کیوان (1381). ابزارهاى کاوش دراینترنت: اصول، مهارتها و امکانات جستجودر وب. تهران،کتابدار.

- لاکدشتی، ابوالفضل (1388). نمایهسازی و بازیابی داده‌های تصویری مبتنی بر محتوا و معناشناسی بصری در پایگاه داده تصویر، دانشگاه آزاد اسلامی، واحد علوم وتحقیقات تهران، رساله دکتری رشته کامپیوتر.

- منصوری، زهرا (1387). بازیابی تصاویر رنگی با استفاده از دانش بافت و رنگ در ساختار درختی دودویی، پایاننامه کارشناسی ارشد گرایش هوش مصنوعی، دانشگاه صنعتی شریف: دانشکده مهندسی کامپیوتر.

- مهرآبادی، میترا (1385). مقایسه موتورهای کاوش عمومی و باز لحاظ نحوه نمایهسازی اطلاعات (با تأکید بر حوزه کتابداری و اطلاعرسانی)، دانشگاه تهران، دانشکده علوم تربیتی و روانشناسی، پایاننامه کارشناسی ارشد.

-Baxter, G. & Douglas, A. (1995). Image Indexing and Retrieval: SomeProblems and Proposed Solutions, New Library World, V96.

-Chu, H. (2001). Research in Image Indexing and Retrieval as Reflected in the Literature, American society for Information Science And Technology, Vol.52.(12), pp. 1011-11018.

-Choi, Y. and Rasmussen, E.M. (2003). Searching for images: the analysis of users` queries for image retrieval in American history, Journal of the AmericanSociety forInformation Science and Technology, Vol.54, No.6, pp.498-511.

-Diamant, E. (2007).Modeling human-like intelligent image processing: An information processing perspective and approach, Image Communication, Vol. 22, No. 6, pp. 583 - 590.

-Guopin, Q. & Jeremy, M.& Xunli, F. (2007). Visual guided navigation for image retrieval, Pattern Recognition, Vol. 40, No 6, pp. 1711 - 1721.

-Hassan, Ibrahim & Zhang, Jin (2001).Image search engine future analysis, Online Information Review, 25(2). pp. 103-114. [on-line].available at: http://www.emerald-library-com/ft. (accessed 20 April 2013)

-Hove, L-J. (2004). Improving image retrieval with a thesaurus for shapes, the VORTEX prototype. Master's thesis. Faculty of Social Sciences, Department Of information Science and Media Studies, Bergen University, Norway.

-Ink pen, Diana… [et al]. (2008). Clustering for photo retrieval at image CLEF 2008, [on-line]. Available:

دوره 17، شماره 1 - شماره پیاپی 65
بهار 1393
صفحه 183-205

XML

اصل مقاله 4.49 M

تعداد مشاهده مقاله 3,200
تعداد دریافت فایل اصل مقاله 1,145

کتابداری و اطلاع‌رسانی

ارزیابی موتورهای جستجو در بازیابی تصاویر بر اساس نمایه سازی مبتنی بر متن و محتوا

دوره 17، شماره 1 - شماره پیاپی 65بهار 1393صفحه 183-205

فایل ها

هم رسانی

ارجاع به این مقاله

آمار

دوره 17، شماره 1 - شماره پیاپی 65
بهار 1393
صفحه 183-205