نوع مقاله : مقاله پژوهشی
نویسندگان
1 دانشیار گروه علم اطلاعات و دانششناسی، دانشگاه آزاد اسلامی، واحد علوم و تحقیقات. تهران، ایران.nadjlahariri@gmail.com
2 گروه علم اطلاعات و دانششناسی، واحد مرودشت، دانشگاه آزاد اسلامی، مروشت، ایران.
چکیده
کلیدواژهها
با وجود شبکه جهانی وب، سیستمهای یکپارچه اطلاعاتی، سیستمهای یکپارچه بانک، تجارت الکترونیکی و ... لحظه به لحظه به حجم دادهها در پایگاه دادهها اضافه شده و باعث به وجود آمدن انبارهای عظیمی از دادهها شده است، به طوری که ضرورت کشف و استخراج سریع و دقیق دانش از این پایگاه، دادهها را بیش از پیش نمایان کرده است. شدت رقابتها در عرصههای علمی، اجتماعی، اقتصادی، سیاسی و نظامی نیز اهمیت سرعت یا زمان دسترسی به اطلاعات را دوچندان کرده است. بنابراین، نیاز به طراحی سیستمهایی که قادر به اکتشاف سریع اطلاعات مورد علاقه کاربران با تأکید بر حداقل مداخله انسانی باشند از یکسو و روی آوردن به روشهای تحلیل متناسب با حجم دادههای حجیم ازسوی دیگر، به خوبــــــی احســاس میشود. در حال حاضر، دادهکاوی مهمترین فناوری برای بهرهوری مؤثر، صحیح و سریع از دادههای حجیم است. دادهکاوی، روشی کارآمد و سریع برای کشف اطلاعات از دادههای ساخت یافتهای است که در جدولها نگهداری میشوند. دادهکاوی، الگوها را از تراکنشها[1] استخراج میکند، داده را گروهبندی و آن را دستهبندی میکند. به وسیلة دادهکاوی میتوانیم به وجود روابطی میان اقلام دادهای پی ببریم که پایگاه داده را پر کردهاند. عبارت دادهکاوی مترادف با یکی از عبارتهای استخراج دانش، برداشت اطلاعات، وارسی دادهها و حتی لایروبی کردن دادههاست که در حقیقت کشف دانش در پایگاه دادهها را توصیف میکند. اصطلاح دادهکاوی را آمارشناسان، تحلیلگران دادهها و انجمن سیستمهای اطلاعات مدیریت بهکار بردهاند؛ در حالی که پژوهشگران یادگیری ماشین و هوش مصنوعی از کشف دانش در پایگاه دادهها بیشتر استفاده میکنند (غضنفری 1387، 96).
فناوری بر پایه وب، به سبب فراهم کردن امکانات مفید از جمله در دسترس بودن منابع، سادگی گسترش و بهروز کردن و نگهداری آنها روی وب، بهعنوان یک فناوری مناسب معرفیشده است و در بسیاری از محیطهای آموزشیِ توسعهیافته تحت وب در سرتاسر دنیا در حال استفاده از آن هستند. اگرچه ابزارهای هوشمندی برای درک رفتارهای کاربران برخط به منظور افزایش فروش و سود توسعهیافته، کارهای اندکی بر روی کشف و دسترسی به الگوهای کاربران برخط برای درک رفتارهای آموزشی آنها صورت گرفته است. دادهکاوی به دلیل در دسترس بودن حجم انبوهی از دادهها، توجه بسیار زیادی را در جوامع علمی و صنعت اطلاعات به خود جلب کرده است و یکی از پیشرفتهای اخیر در راستای فناوریهای مدیریت دادهها، به شمار میرود. با افزایش محبوبیت شبکه جهانی وب، مقدار حجیمی از دادهها به وسیلة وبسرورها در قالب فایل ثبت وقایع وب جمعآوری میشوند. این فایلها که در آنها تمامی فعالیتهای رخداده در سیستم وب سرور ثبت میشود، میتوانند منابع بسیار غنی از اطلاعات برای درک و تشخیص رفتار کاربران وب قلمداد شوند. با تحلیل این فایلها میتوان به پیشبینی لینکهایی پرداخت که در افزایش کارایی وبسایت تأثیر مثبت دارند و برای طراحان وبسایت بسیار مفیدند. با استفاده از فایل ثبت وقایع جریان کاری، میتوان راهکارهایی را برای حل مشکلات موجود در بهبود فرایندها ارائه کرد. در همین راستا، تحقیق حاضر میتواند مدیران و طراحان نرمافزارها و سایتهای نشریات را در تصمیمگیریهای مهم توسعه و طراحی کارآمد وبسایت بهمنظور افزایش رضایت کاربران یاری دهد.
لاگفایلها حاوی اطلاعات دربارة فعالیتهای بازدیدکننده وب سایت است. لاگفایلها به وسیلة وبسرور، به طور خودکار ساخته میشوند. هر زمان بازدیدکننده درخواست هر گونه فایل (صفحه، عکس، و ...) را از اطلاعات موجود در سایت داشته باشد، درخواست وی به یک لاگفایل جاری اضافه خواهد شد. این اطلاعات میتواند یک نتیجه از تعامل کاربر با منابع وب در یک یا چند وبسایت را فراهم آورد و در تجزیه و تحلیل الگوهای رفتاری و پروفیل از کاربران در تعامل با یک وبسایت مؤثر واقع شوند. ( (Langhnoja1, Barot, Mehta,2012بنابراین، میتوان گفت تمرکز اصلی لاگ در شناسایی رفتار استفادهکننده است و کمک میکند تا بدانیم چه رفتاری بروز کرده است. در همین راستا، هدف از انجام این پژوهش، دست یافتن به رفتار کاربران با استفاده از فناوری دادهکاوی، دادههای جمعآوریشده در وبسرور نرمافزار سامانه نشریات دانشگاه آزاد اسلامی واحد مرودشت در طول ۹ ماه در قالب فایل ثبت وقایع در وبسایت طراح نرمافزار سامانة مدیریت نشریات سیناوب است.
سیناوب، سامانة یکپارچه مدیریت نشریات ادواری است که توسط شرکت شریف پردازشگر دانش و با همکاری گروهی از دانشگاهها طی دوره استقرار این شرکت در مرکز رشد فناوریهای پیشرفته دانشگاه صنعتی شریف طراحی و پیادهسازی شده است. این سامانه در محیطی پویا و فعال، تمامی فرایندهای مربوط به تدوین و انتشار نشریات علمی و دانشگاهی را در تعامل مستقیم با افراد مختلف صاحب نقش در نشریه (نویسنده، ارزیاب، ویراستار، دبیر تخصصی، و سردبیر) به انجام میرساند. هماکنون حدود 500 نشریه علمی وابسته به دانشگاههای مختلف و انجمنهای علمی، از این سامانه برای مدیریت انتشار الکترونیک نشریه استفاده میکنند. 10 فصلنامه علمی پژوهشی دانشگاه آزاد اسلامی واحد مرودشت از این سامانه برای دریافت و داوری مقالهها استفاده میکنند. (جدول 1)
بازدید صفحه، میزان دانلود ها ، بازدیدکنندگان ، طول مدت زمان نمایش ها ، ثبت زمان ( ساعت ،روز ،ماه) بازدیدکننده و دفعات مشاهده هر صفحه توسط بازدیدکننده ( افراد و موتورهای جستجو) وضعیت موفقیت انتقال مدارک معیارهایی هستند که در اکثر منابعی که به بررسی فایلهای تراکنش (لاگ فایل ) پرداخته اند ،مد نظر قرار گرفته است (ستوده ، 1382 ، نیکولاس و دیگران به نقل از رجبعلی بگلو 1387، کلارک ،جمالی و واتکینسون[1] 2014).در این پژوهش این معیار ها در قالب سوالات پژوهش مورد بررسی قرار گرفتند.
سؤال 1 پژوهش: بازدید از سامانه نشریات دانشگاه آزاد اسلامی واحد مرودشت چگونه است؟
سوال 2 پژوهش: برای دسترسی به سامانه نشریات از کدام سیستم عامل ها، مرورگرها و موتورهای جستجو استفاده شده است؟
سوال 3 پژوهش: درخواست های دانلود از سامانه نشریات دانشگاه آزاد اسلامی واحد مرودشت چگونه است؟
سؤال 4 پژوهش: فنون جستجو و کلیدواژه های مورد استفاده کاربران سامانه نشریات دانشگاه آزاد اسلامی واحد مرودشت کدام است؟
سؤال 5 پژوهش: وضعیت خطای سیستم در سامانه نشریات مورد مطالعه چگونه بوده است.
برای یافتن مطالبی درزمینه تحلیل لاگ این واژه در پایگاههای اطلاعاتی SIDو Irandoc موردبررسی قرار گرفت. نتایج جستجو نشان داد که در ایران تحلیل لاگ در حوزه علم اطلاعات و دانش شناسی در زمان انجام تحقیق در قالب ۳ مقاله مروری: ستوده (۱۳۸۲)، جمالی مهموئی (۱۳۸۳) و رجبعلی بگلو (۱۳۸۶) و 3 مقاله پژوهشی زوارقی(1384( و حریری و مهربان (۱۳۹۲) با استفاده از تحلیل گوگل[1] موردبررسی قرارگرفته است در این بخش به چند نمونه از مطالعاتی که بر روی این مقوله و حوزههای مرتبط انجامگرفته است، اشاره میشود.
زوارقی (1384) با تحلیل استفاده از وبگاه مرکز اطلاعات و مدارک علمی ایران نشان داد که روز سه شنبه پراستفاده ترین روز هفته بوده است .
حیاتی و دیگران (۱۳۸۵) با استفاده از تکنیک دادهکاوی و بهرهگیری از الگوریتم UTS رویدادههای جمعآوریشده در قالب فایل ثبت وقایع وبسایت کتابخانه دانشگاه استرالیا، به کشف الگوی مسیر حرکت کاربران در سایت پرداختهاند نتایج حاصل از این پژوهش، بینش وسیعی از رفتار کاربران و عملکرد آنها در وبسایت را در اختیار مدیران و طراحان آن کتابخانه قرار میدهد.
ستوده (۱۳۸۲) درباره نقاط قوت و ضعف تحلیلهای گزارش وب مینویسد تحلیل گزارش وب مبتنی برداده های عینی و دقیق است و بدین ترتیب اعتبار نتایج تحقیق را افزایش میدهد اما نمیتواند تلقیها و انگیزههای کاربران را مشخص سازد بنابراین پیشنهاد میکند ترکیبی از تحلیلهای گزارش وب و روشی مکمل برای ترسیم تصویری روشنتر و همهجانبهتر از نظام مورداستفاده قرار گیرد.
ارسطوپور (۱۳۸۶) در مقالهای با عنوان دستهبندی نتایج جستجو بر مبنای ویژگیهای مدارک و امکانسنجی استفاده از الگوریتمهای خوشهبندی مختلف در سطح وب بیان میکند. بازآرایی و به نظم درآوردن نتایج جستجو در بازیابی اطلاعات، بخصوص وقتی حجم منابع بازیابی شده بسیار زیاد است. به کاربران در تسهیل امر بازیابی اطلاعات کمک میکند. بازآرایی و سازماندهی مدارک همواره بر اساس ویژگیهای هر مدرک صورت میپذیرد. بنابراین، بازسازی نتایج جستجو نیز منوط به ویژگیهای مذکور است. ویژگیهای مدارک را میتوان به دو گروه ردیف اول و ردیف دوم دستهبندی کرد. در این مقاله، با اشاره به انواع ویژگیهای مطرح برای مدارک و اشاره به این نکته که خوشهبندی یکی از روشهای رایج در دستهبندی نتایج جستجوست تلاش شده تا فصل مشترک میان این ویژگیها و نیز روشهای مختلف خوشهبندی مشخص گردد. درنهایت، با توجه به اینکه خوشهبندی نتایج جستجو از فناوریهای نسبتاً رایج در سطوح وب بوده و طراحان موتورهای جستجو برای بهبود نتایج، پژوهشی تکمیلی بهمنظور امکانسنجی و بررسی وجود ملزومات (نمایهسازی ویژگیها) در جهت دستهبندی نتایج نشاندهنده آن است که باوجود توجه به ویژگیها و نمایهسازی آنها توسط موتورهای جستجوی مختلف و نیز ساده بودن الگوریتمهای خوشهبندی موردنیاز در جهت بازآرایی نتایج بر مبنای این ویژگیها (خوشهبندی مسطح)، حتی موتورهای جستجوی خوشه ساز نیز از این ویژگیها در بازآرایی نتایج خود استفاده نمیکنند.
رجبی (۱۳۸۸) در بررسی استفاده از نشریات الکترونیکی پایگاههای اطلاعاتی تحت وب در دانشگاه امام صادق (ع) نشان داد که در بین نشریات این پایگاهها نشریات مربوط به حوزهی مدیریت بالاترین میزان استفاده را دارا است. ازنظر تعداد مراجعه به پایگاهها، به ترتیب پروکوئست ۰، جی استور، امرالد و ابسکو قرار دارند. ازنظر تعداد مقاله دانلود شده، پایگاه جی استور در بالاترین رتبه قرار دارد. تکالیف کلاسی و درسی و نیز نگارش مقاله از مهمترین دلایل دانشجویان در استفاده از پایگاههای اطلاعاتی و در بین استادان، آموزش و تدریس و نگارش مقاله بالاترین دلیل استفاده ایشان است.
حریری و مهربان (۱۳۹۲) در بررسی راهبردهای جستجوی کاربران پایگاههای اطلاعاتی فناوری نانو:تحلیل گزارش تراکنش نشان دادند که کاربران از سه روش استفاده از موتورهای جستجو، سایتهای دیگر و استفاده از پایگاههای اطلاعاتی بهطور مستقیم برای بازیابی اطلاعات استفاده میکنند که در استفاده بهطور مستقیم نرخ پرش کمتری داشتهاند و صفحات بیشتری را مورد بازدید قرار دادهاند. متوسط طول پرسشهای بهکاربرده شده از ۳ واژه است و از راهبردهای جستجوی سادهتر برای / طریق موتورهای جستجو بازیابی اطلاعات استفاده کردهاند
پژوهش خسروی و جمالی مهمویی (1393) با هدف تحلیل رفتار کاربران، میزان و نحوة استفادة آنهاا ازپایگاه اطلاعاتی ایرانداک با استفاده از تحلیل لاگ،نشان داد که کاربران شهرهایی چون تهران، مشهد و تبریز یش ازسایر نقاط از پایگاه استفاده کرده اند. روزهای دوشنبه و یکشنبه ساعت بین ۱ الی۹ 1 اوج استفاده و پربسامدترین موضوع جستجو شده علوم اجتماعی است . همچنین نتایج این پژوهش نشان داد که برخی از کاربران با مفاهیمی نظیر اصلاح عبارت جستجو یا نحوه صحیح استفاده ازعملگرهای بولی آشنا نیستند و این نکات منجر به بازیابی ناکارآمد از پایگاه می شود .
پیشینۀپژوهش در خارج کشور
کرافورد (۱۹۸۷) دو هدف عمده تحلیل گزارش را انجام تحلیل آماری از عملکرد و کاربرد نظام و نیز تحلیل رفتار جستوجو و مشکلات کاربران عنوان میکند
مورس و کلینت ورث [1](۲۰۰۰) گزارشهای تعامل پایگاه داده اوید[2] را در ۱۹۴ مجله که هم بهصورت چاپی و هم بهصورت الکترونیکی در دسترس کاربران قرار داشتند در یک دوره زمانی ۶ ماهه بررسی کردند که درنهایت الگوی استفاده از این دو نوع منبع اطلاعاتی باهم مقایسه شد. مقایسه آنها تنها به بارگذاری مقالات محدود بود. یافتههای تحقیق نشان داد، کاربران، دسترسی به منابع الکترونیکی را بهویژه زمانی که میتوانستند مستقیماً از پایگاه داده به تمام متن مقالات بروند، به استفاده از منابع چاپی بسیار بیشتر ترجیح میدهند(نقل در رجبعلی بگلو، ۱۳۸۶).
کارلایل[3]) ۲۰۰۱( طی پژوهشی بر این نکته صحه میگذارد که در جستجو برای بستههای اطلاعاتی مشخص، هنگامیکه اثر ویرایشهای متعددی داشته و یا پدیدآور فرد پرکاری باشد، ویژگیهایی چون قالب فیزیکی، مخاطبان، توصیف محتوا، عناصر تصویری، کاربرد، زبان، ویژگیهای ظاهری و تازگی محتوا برای جستجو کنندگان، اهمیت زیادی دارد.
کی[4] و همکارانش) ۲۰۰۲ ( در پژوهش خود به بررسی رفتار دانشجویان علوم و فنآوری تایوانی در استفاده از نشریات الکترونیکی پایگاه اطلاعاتی ساینس دایرکت پرداختند. این پژوهش بهوسیلهی تحلیل گزارشهای تراکنشی پایگاه اس دی او اس در ما ه های ژانویه الی دسامبر سال ۲۰۰۰ انجام شد. این گزارشها بر اساس تحلیل نشانیهای آی پی ، تاریخ و زمان، نشانی اینترنتی و دادههای ارسالی و دریافتی کاربران از نشریات الکترونیکی این پایگاه بود. نتایج نشان داد، ساعت ۱۰ الی ۱۸ بیشترین میزان استفادهی کاربران از نشریات این پایگاه بود .بهجز شنبه و یکشنبه بقیهی روزهای هفته نزدیک به ۸۰۰۰۰۰ صفحه دیده میشد. مقالات مورداستفادهی کاربران به شکل پیدیاف، چهار برابر مقالات اچ تی ام ال بود بیشتر جستوجوی موردنظر کاربران، استفاده از عملگر "و" بود که پیشفرض جستوجوی ساده این پایگاه نیز است
نیکولاس، هانتینگتون و واتکینسون (۲۰۰۵) پژوهشی در مورد رفتار اطلاعیابی کاربران کتابخانههای مجلههای دیجیتالی انجام دادند. تمرکز آنها بر روی کاربران پایگاه اطلاعاتی Blackwell Synergy بود و معیارهای تعداد جلسات برگزارشده و اقلام مورد مشاهده و موردتقاضا را برای بررسی رفتار اطلاعیابی اعضای هیئتعلمی مجلههای دیجیتالی پایگاه مذکور به کار گرفتند. این پژوهشگران بیان میدارند چنانچه این نوع مطالعات با مطالعات کیفی رفتار اطلاعیابی کاربران تکمیل گردد، به نتایج بهتر و واقعیتری میتوان دستیافت.
نیکولاس، جمالی و هانتینگتون[5] (۲۰۰۶( در بررسی رفتار اطلاعیابی کاربران با بهکارگیری فنون دادهکاوی وب دریافتند که بسیاری از کاربران وب برای زمانهای طولانی صفحات وب را مطالعه نکرده و قبل از ترک منابع وبی، تنها به بررسی اجمالی اقلام و صفحات وبی محدودی مشغول بودهاند.
هانتینگتون، نیکولاس و جمالی (۲۰۰۷) بامطالعۀ تراکنشهای جستجوی وبلاگها بیان میدارند که ابزارهای اندازهگیری که از این منابع کشف میشود، وسایل سودمندی برای بررسی میزان کارایی و همچنین میزان رضایت و عدم رضایت از موتورهای جستجو هستند. آنها دو معیار اندازهگیری زمان سپریشده میان جلسات جستجو و تعداد جستجوهای انجامشده در هر جلسه را برای مطالعۀ رفتار اطلاعیابی کاربران موتورهای جستجو به کار گرفتند.
بلان برود و اسکاپن(2007( در توصیف جستجو بر مبنای ویژگیها در نظامهای مدیریت اطلاعات شخصی، بر این نکته تأکیددارند که ویژگی بارز نظامهایی ازایندست، قابلیت جستجو پذیر ساختن مدارک بر مبنای طیف وسیعی از ویژگیهای آنهاست. ویژگیهایی، از عنوان و محل نگهداری گرفته تا اندازه، قالب، رنگ و ... . بنابراین، میتوان به این نتیجه رسید که تاکنون ویژگیهای ردیف دوم بیش از هر نظامی، در نظامهای بازیابی اطلاعات شخصی موردتوجه بوده است. پس به نظر میرسد در حوزه بازیابی اطلاعات، مطالعه متون مرتبط با نظامهای مدیریت اطلاعات، بیشترین کمک را به شناسایی و ارزیابی ویژگیهای ردیف دوم برای جستجو و دستهبندی نتایج جستجو خواهد کرد. در این حوزه، بهواسطه پژوهشهای مختلف، بر این نکته صحه گذارده شده است که پارهای از ویژگیها بخصوص از دید کاربران، اهمیت خاصی دارند.
گلینی مقدم و تلوار (۲۰۰۸) به بررسی چگونگی استفاده از نشریات علمی الکترونیکی در مؤسسهی علمی ایندیانا پرداختند. پژوهش مزبور بهوسیلهی پرسشنامهی الکترونیکی در مدت پنج ماه از سال ۲۰۰۴ و در بین ۳۹۷ عضو از گروههای مختلف این مؤسسه انجام و گردآوری شد. نتایج پژوهش نشا ن دهندهی محبوبیت و رشد فزایندهی استفاده از نشریات الکترونیکی در بین کاربران این مؤسسه بود. عمده استفادهی کاربران این مؤسسه از نشریات الکترونیکی، رفع نیازهای پژوهشی و شکل اغلب مقالات نشریات مورداستفادهی آنان پیدیاف بود. از مهمترین دلایل کاربران در ترجیح نشریات الکترونیکی به چاپی، دسترسی آزاد از رایانههای میز کار خود در طول ساعات شبانهروز بود
لامبرت[6]) ۲۰۱۰(در بررسی لاگ موتور جستجوی MCI نشان داد که جستجوها معمولاً ساده و متشکل از دو کلمه هستند
شیری (۲۰۱۰) در طی پژوهشی با عنوان «راهبردهای فرمولبندی مجدد پرسشها در کتابخانه دیجیتالی میانرشتهای: مطالعه موردی علم و فناوری نانو» نشان داد که فرمولبندی مجدد پرسشها بیشتر در حوزههای میانرشتهای نانو شکلگرفته که عبارتاند از: استفاده از عبارتهای چندگانه، اصطلاحات ترکیبی، استفاده وسیع از کلماتی که با نانو شروعشدهاند، استفاده از اصطلاحاتی که با علامت خط فاصله (-) از هم جداشدهاند، استفاده از املاهای متفاوت و استفاده از مترادفات.( نقل در حریری و مهربان(1392).یافته های پژوهش کلارک ،جمالی و اتکینسون[7] (2014) که با استفاده از تحلیل لاگ و خود اظهاری جامعه مورد بررسی انجام شده بود نشان داد که لاگ یک شاخص خوب برای ارایه استفاده از اطلاعات و رفتارهای اطلاع یابی کاربران است و انتخاب گوگل و گوگل اسکولار توسط پژوهشگران دانشگاهی در رسیدن به اطلاعات مورد اعتماد نشان دهنده این واقعیت است که آنها در خواندن و استفاده از اطلاعات تحت تاثیر سهولت دسترسی قرار دارند .یافته های این پژوهش میزان استفاده را برای نشان دادن کیفیت مناسب ندانست
پیشینه پژوهش نشان می دهد که پژوهش ها ی تحلیل لاگ به عنوان یکی از شیوه های وب کاوی و مطالعه رفتار اطلا ع یابی کاربران که یکی از مهمترین بحث های علم اطلاعات و دانش شناسی است از نظر تنوع ،کیفیت و کمیت مطالعات همپای مطالعات خارجی در این زمینه توسعه نیافته است وهیچ یک از مطالعات موجود برای تحلیل رفتار اطلاع یابی کاربران سامانه نشریات علمی پژوهشی ایران از این روش بهره نگرفته است و مطالعه حاضر اولین پژوهش در این زمینه است
[1] Morse, Clint& worth
[2] Ovid
[3]karlyle
[4] Ke
[5]Jamali, Nicholas and Huntington
[6]Lambert
[7] Clark,Jamali, Watkinson
پژوهشهای بسیار محدودی در ایران به صورت مستقل به بررسی چگونگی و میزان استفاده از نشریات الکترونیکی پایگاههای اطلاعاتی در دانشگاهها پرداختهاند. ابزار گردآوری دادههای غالب پژوهشگران در این ارتباط، پرسشنامه و گاه مصاحبه است. در یک مورد هم از روش ترکیبی پرسشنامه و تحلیل آماری استفاده شده است. گزارشهای تراکنشی ابزاری سودمند برای ثبت و ضبط تعاملهای کاربران و نظامهای اطلاعاتی برای بازیابی اطلاعات و پاسخهای دریافتی آنان است. در این پژوهش، از روش تحلیل گزارشهای تراکنشی مربوط به استفاده از نشریات دانشگاه آزاد اسلامی واحد مرودشت که در قالب گزارش تراکنش (لاگفایل)[1] در سرورها ذخیره و مدیر سامانة نشریات سیناوب آن را در اختیار محقق قرار داد، استفاده شده است. جامعة پژوهش شامل صفحاتی است که بازدیدکنندگان وبسایت نشریات دانشگاه آزاد اسلامی مرودشت طی فروردین تا۳۰ آذر ۱۳۹۲ از آنها بازدید کردهاند. ۱۰ مجلة علمی ـ پژوهشی موجود در این وبسایت بررسی شده است. دادههای مورد نیاز از سرور سایت نشریات دانشگاه دریافت و با استفاده از نرمافزار web log expert تحلیل شد. پس از فیلتر، موارد نامرتبط با استفاده از نرمافزار اکسل دادهها تجزیهوتحلیل شده است.
در این قسمت معیارهای تحلیل لاگفایل در قالب سؤالهای پژوهش با استفاده از جدول و نمودار و آمار توصیفی بررسی شد.
سؤال 1 پژوهش: وضعیت بازدید از سامانة نشریات دانشگاه آزاد اسلامی واحد مرودشت چگونه است؟
جدول 1. توزیع فراوانی بازدید و دانلود از مجلههای مورد بررسی دانشگاه آزاد اسلامی واحد مرودشت
تعداد کل دانلودها |
تعداد کل بازدیدها |
تعداد مقالهها |
آدرس الکترونیکی مجلهها |
عنوان مجلهها |
6478 |
7078 |
۲۰ |
http://jnm.miau.ac.ir/ |
فصلنامه علمی - پژوهشی مواد نوین |
۶۰۳۲ |
۷۶۷۱ |
۲۸ |
http://jupm.miau.ac.ir/ |
فصلنامه علمی - پژوهشی پژوهش و برنامهریزی شهری |
۶۶۴۷ |
۹۵۲۲ |
۲۴ |
http://jedu.miau.ac.ir/ |
فصلنامه علمی - پژوهشی رهیافتی در مدیریت آموزشی |
۷۰۲ |
۹۶۷ |
۲۳ |
http://rpp.miau.ac.ir/ |
فصلنامه تحقیقات بیماریهای گیاهی |
۵۶۶۷ |
۵۱۸۷ |
۲۸ |
http://jzvj.miau.ac.ir/ |
فصلنامه علمی- پژوهشی زن و جامعه |
۳۲۰۹ |
۳۹۰۹ |
۲۴ |
http://jpmm.miau.ac.ir/ |
فصلنامه علمی - پژوهشی روشها و مدلهای روانشناختی |
۱۱۹۹ |
۱۵۵۲ |
۳۹ |
http://jpe.miau.ac.ir/ |
Physical Chemistry & Electrochemistry |
۵۴۳۰ |
۶۷۰۰ |
۲۰ |
http://jae.miau.ac.ir/ |
فصلنامه علمی -پژوهشی تحقیقات اقتصاد کشاورزی |
۲۵۲۴ |
۲۷۲۴ |
۲۸ |
http://wej.miau.ac.ir/ |
فصلنامه علمی - پژوهشی مهندسی منابع آب |
۴۹۰۱ |
۸۱۵۰ |
۷۳ |
http://jzpm.miau.ac.ir/ |
فصلنامه علمی – پژوهشی برنامهریزی منطقهای |
42789 |
53460 |
۳۰۷ |
جمع |
با توجه به جدول 1، بیشترین بازدید و دانلودها در بین مجلههای مورد بررسی مربوط به فصلنامه علمی ـ پژوهشی «رهیافتی نو در مدیریت آموزشی» است.
جدول 2. توزیع فراوانی بازدیدها و صفحههای بازدید شده در سامانة نشریات دانشگاه آزاد اسلامی واحد مرودشت
|
نمودار 1. توزیع فراوانی بازدید در شبانهروز
با توجه به نمودار 1 بیشترین بازدید از مجلهها از ساعت ۱۴ تا ۱۷ و کمترین بازدیدها از ساعت یک بامداد تا ۸ صبح بوده است
نمودار 2. توزیع فراوانی بازدید در روزهای هفته
با توجه به نمودار 2، بیشترین بازدید از مجلهها در روزهای دوشنبه و سهشنبه بوده است و روزهای پنجشنبه، جمعه و شنبه کمترین بازدید از صفحات مورد بررسی صورت گرفته است.
نمودار 3. پربازدیدترین صفحات نشریات
نمودار 3 بیانگر این است که پربازدیدترین صفحات نشریات مربوط به مرور مطالب نشریات است. تماس با مجلهها، صفحه نویسندگان و صفحه فرایند پذیرش مقالهها، در رتبههای بعدی بازدید قرار دارد.
نمودار4. توزیع فراوانی بازدیدکنندگان در ماههای مورد بررسی
چنان که دادههای نمودار 4 نشان میدهد، بیشترین تعداد بازدیدها در شهریور صورت گرفته است.
نمودار 5. بیشترین سایتهای ارجاع دهنده روزانه
چنان که در نمودار 5 مشاهده میشود، بیشترین ارجاعات روزانه مربوط به سایت اصلی دانشگاه است.
نمودار6. کشورهای بازدیدکننده
چنان که در نمودار 6 مشاهده میشود، در بین کشورهای بازدیدکننده از مقالهها و مجلههای دانشگاه آزاد اسلامی واحد مرودشت، بیشترین بازدیدکننده مربوط به کشور ایران است و ایالات متحده امریکا و چین در مرتبه دوم و سوم قرار دارند.
نمودار 7. بیشترین سایتهای مراجعهکننده
با توجه به نمودار 7، بیشترین مراجعه از سایتها مربوط به سایت http://journals.miau.ac.ir است.
نمودار 8. بیشترین آدرسهای اینترنتی مراجعه کننده
چنان که در نمودار 8 مشاهده میشود، بیشترین مراجعه کننده مربوط به آدرس اینترنتی مقالههای مجله و نمایة مقالههاست.
سؤال 2 پژوهش: از کدام سیستم عاملها، مرورگرها و موتورهای جستجو برای دسترسی به سامانة نشریات استفاده میشود؟
نمودار 9. سیستم عاملهای مورد استفاده
چنان که در نمودار 9 مشاهده میشود، سیستم عامل ویندوز ۷ بیشترین استفاده را داشته است.
نمودار 10. مرورگرهای مورد استفاده بازدیدکنندگان
با توجه به نمودار 10، مرورگر فایر فاکس بیشترین میزان استفاده را توسط بازدیدکنندگان داشته است.
نمودار 11. موتورهای جستجوی مورد استفادة بازدیدکنندگان
نمودار 11 نشاندهندة آن است که موتور جستجوی گوگل بیشترین کاربرد را توسط بازدیدکنندگان داشته است.
سؤال 3 پژوهش: وضعیت درخواستهای دانلود از سامانة نشریات دانشگاه آزاد اسلامی واحد مرودشت چگونه است؟
جدول 3. تعداد درخواستهای ذخیرهسازی و درخواستهای ناموفق
43909 |
درخواست ذخیرهسازی |
۱۱۲۰ |
درخواست ناموفق |
جدول3 نشان میدهد از بین 340275 درخواست ذخیرهسازی، تنها 1120 درخواست ناموفق بوده و بیشتر درخواستهای دانلود با موفقیت انجام شده است.
جدول 4. توزیع فراوانی انواع فایلهای درخواست شده
درخواستهای کامل نشده
|
بازدید
|
نوع فایل
|
ردیف
|
۵۹۴۸
|
۹۸۰۴۸۹
|
Pdf
|
۱
|
۰
|
۸۶۶۷
|
Html
|
۲
|
۰
|
۴۷۰۶
|
Gif
|
۳
|
۲
|
۳۷۸۹
|
Png
|
۴
|
۱۴
|
۳۴۹۶
|
Js
|
۵
|
۱
|
۲۹۴۳
|
Css
|
۶
|
۲۶
|
۱۶۶۵
|
Jpg
|
۷
|
۰
|
۱۰۷۳
|
Ajax
|
۸
|
۲
|
۵۹۲
|
Ico
|
۹
|
۰
|
۱۴۴
|
Txt
|
۱۰
|
۰
|
۱۱۵
|
Php
|
۱۱
|
۰
|
۸۱
|
Note
|
۱۲
|
۰
|
۶۷
|
No Extension
|
۱۳
|
۰
|
۴۴
|
Us
|
۱۴
|
۰
|
۳۸
|
Board
|
۱۵
|
۰
|
۱۵
|
Rss
|
۱۶
|
۰
|
۱۲
|
Ed
|
۱۷
|
۰
|
۸
|
Index
|
۱۸
|
۰
|
۶
|
Form
|
۱۹
|
۰
|
۱
|
Xml
|
۲۰
|
۰
|
۱
|
Jpeg
|
۲۱
|
۵۹۹۳
|
۱۰۰۷۹۵۲
|
Total
|
با توجه به جدول 4، بیشترین فایلهای درخواستی مربوط به پیدیاف با ۹۸۰۴۸۹ است که از این تعداد درخواست 5948 مورد کامل نشدهاند.
سؤال 4 پژوهش: فنون جستجو و کلیدواژههای مورد استفادة کاربران سامانه نشریات دانشگاه آزاد اسلامی واحد مرودشت کدام است؟
جدول5. توزیع درصد فنون جستجوی مورد استفادة کاربران
فنون جستجو
|
درصد
|
جستجوی ساده
|
69/42% |
جستجوی پیشرفته
|
81/22% |
عملگرهای منطقی
|
2/15% |
مترادفها
|
11/11%
|
عملگرهای کوتاهسازی(* #...
|
19/8%
|
جمع
|
100%
|
جدول 5 نشاندهندة این است که جستجوی ساده با ۶۹/۴۲ درصد، بیشترین میزان استفاده را توسط بازدیدکنندگان داشته است.
نمودار 12. بیشترین موضوعهای جستجو شده
در نمودار 12 نشان داده شده است که بیشترین جستجو با کلیدواژههای ساده و عنوانهای نشریات صورت گرفته است.
کلیدواژههای «مرودشت»، «برنامهریزی» و «مدیریت»، بیشترین فراوانی موضوعات مورد جستجو را در بین کاربران داشتهاند.
سؤال 5 پژوهش: وضعیت خطای سیستم در سامانه نشریات دانشگاه آزاد اسلامی واحد مرودشت چگونه است؟
نمودار13. توزیع میزان و انواع خطاهای سیستم در سامانه نشریات
چنان که در نمودار ۱3 مشاهده میشود، بیشترین خطای سیستم مربوط به صفحاتی است که در هنگام جستجو برای نظام اطلاعاتی قابل شناسایی نبوده است. این خطا معمولاً زمانی ظاهر میشود که صفحة مورد نظر وجود نداشته یا آدرس به اشتباه تایپ شده و یا ناکامل باشد.
بررسی میزان استفاده از سامانة مجلهها نشان داد 53460 بازدید از سامانة نشریات در دوره مورد بررسی صورت گرفته است. از این تعداد42789 مورد منجر به دانلود مقالهها شده است. بیشترین بازدیدها و دانلودها در بین مجلههای مورد بررسی، مربوط به فصلنامة علمی-پژوهشی «رهیافتی نو در مدیریت آموزشی» است. بیشترین بازدیدها توسط بازدیدکننده (افراد) و سپس بازدیدهای عنکبوتی، در روز صورت گرفته است.
شکل اغلب مقالههای تمام متن بازیابی شده در بین کاربران پیدیاف است. این یافته با پژوهشهای «کی» (۲۰۰۲)، «نیکولاس» (۲۰۰۵)، «گلینی مقدم» (۲۰۰۸) و «رجبی» (۱۳۸۸) همخوانی دارد. شباهت ظاهری شکل مقالههای پیدیاف با نمونة چاپی مقالههای نشریات همانند اندازة قلمهای متن، تورفتگی پارگرافها، قرار گرفتن شکلها و جدولها و نمودارها در جای خود و به همان اندازه، سهولت خواندن و انطباق صفحهبندی با نمونه چاپی را میتوان از دلایل تمایل کاربران به آن دانست. این یافته نشان میدهد کاربران هنوز به شکل و ظاهر چاپی مقالهها ـ با وجود الکترونیکی شدن آنها ـ تمایل دارند.
از 43909 مورد درخواست ذخیرهسازی ۱۱۲۰ مورد ناموفق بوده است.در مطالعه «هوارد» (2012) نیز مشخص شده است که تلاشهای150 میلیون نفر از کاربران جیاستور هر سال برای دسترسی به مقالهها با شکست مواجه میشود.
بیشتر کاربران (69/۴۲%) از جستجوی ساده استفاده میکنند. جستجوی پیشرفته، عملگرهای منطقی، مترادفها و عملگرهای کوتاهسازی کمتر مورد استفاده قرار گرفتهاند. از دلایل آن میتوان به نبود آشناییِ چگونگی جستجوی پیشرفته و قابلیتهای آن اشاره کرد. نتیجة پژوهش «کی» (۲۰۰۲)، «رجبی» (۱۳۸۸) و «خسروی و جمالی» (1393) نیز با یافتههای این پژوهش همخوانی دارد.
در بین کشورهای بازدیدکننده از مقالههای مجلههای دانشگاه آزاد اسلامی واحد مرودشت، بیشترین بازدیدکننده مربوط به کشور ایران است. بااینحال، اینپایگاههادرخارجازایران نیز کاربرانیدارند. با توجه به داشتن درجة علمی ـ پژوهشی مجلهها، تأیید و ثبت مجلهها در پایگاه استنادی جهان اسلام ISC)) و تنوع موضوعات زیرپوشش، در صورت سیاستگذاریهای مرتبط و اطلاعرسانی مناسب، این خدمات در کشورهای فارسیزبان منطقه قابل توسعه و اشاعه است. اگرچه مجله Physical Chemistry & Electrochemistr که به زبان انگلیسی منتشر میشود، این محدودیت زبانی را نیز ندارد.
پربازدیدترین صفحات نشریات، مربوط به مرور فهرست مطالب نشریات است. در یافتههای «نیکلاس،هانتینگتونواتکینسون» (۲۰۰۵) نیز به این مورد اشاره شده است. مشاهده شمارة جاری مجله و مرور مقالهها بر اساس نمایة موضوع، نویسندگان و کلیدواژهها از امکانات این صفحه است. بیشترین بازدید از مجلهها در روزهای دوشنبه و سه شنبه بوده است و روزهای پنجشنبه ،جمعه و شنبه کمترین بازدید از صفحات مورد بررسی صورت گرفته است. در مطالعة «خسروی و جمالی» (1392) نیز میزاناستفادهازپایگاهدرروزهایآخرهفتهکمتر میشود، به طوری که جمعههاکمترین تعداد جستجو وروزهای یکشنبه و دوشنبه که میان هفته است، بیشترین تعداد جستجو صورت میگیرد.
بیشترین میزان بازدید از مجلهها از ساعت۱۴ تا ۱۷ بوده است. «کی و همکاران» (۲۰۰۲) در بررسی رفتار دانشجویان علوم و فناوری تایوانی در استفاده از نشریات الکترونیکی پایگاه اطلاعاتی ساینس دایرکت، نشان دارند ساعت۱۰تا۱۸بیشترین میزان استفادة کاربران ازنشریات این پایگاه است. بیشترین مراجعات روزانه از طریق سایت اصلی دانشگاه صورت گرفته است. یافتههای «نیکولاسودیگران»(2006) نیز نشان داد کمترازیکچهارم کاربران خارج ازمحیط دانشگاه برای استفاده از نشریات به این کتابخانة دیجیتالی وصل شدند.
همچنین، یافتههای پژوهش نشان داد موتور جستجوی گوگل بیشترین کاربرد را توسط بازدیدکنندگان داشته است. نتایج تحقیق با یافتههای کلارک، جمالی و واتکینسون (2014) همسوست. مطالعات تحلیل لاگهای قبلی نیز نشان میدهند گوگل یک ابزار بسیار محبوب برای دسترسی به محتوای مجلههاست.
(Nicholas, Clark, Rowlands, & Jamali, 2009; Jamali & Asadi, 2010).
در واقع، نسبت بالایی از پژوهشگران برای دسترسی به مقالههای مجلهها به وبسایت یک مجله/ ناشر از طریق سایت طرف سوم[13]، وارد شدهاند (Nicholas, Rowlands, Huntington,Jamali, & Salazar, 2010). این واقعیت ممکن است به دلیل محبوبیت موتورهای جستجو در هدایت کاربران از چکیده مقاله به سمت محتوای مطالب در فضای مجازی باشد.
(Nicholas, Huntington,& Jamali, 2007),
بیشترین آمار دسترسی به مقالهها بیشتر از طریق مراجعة مستقیم به سامانه مجلههای دانشگاه بوده است. در مطالعة «مهربان و حریری» (1392) نیز کاربران دراستفاده از صفحات بهطورمستقیمنرخپرشکمتریداشتهو از صفحات بیشتریبازدیدکردهاند. استفاده از پایگاه اطلاعات نشریات کشور (magiran) و پایگاه علمی جهاد دانشگاهی (Sid) برای دسترسی به مقالهها از دیگر روشهای مورد توجه کاربران بوده است. بیشترین جستجو با کلیدواژههای ساده و یا دوکلمهای صورت گرفته است. یافتههای حاضر با یافتههای «لامبرت» (۲۰۱۰)، «حریری و مهربان» (1392) همخوانی دارد. مرورگر فایرفاکس و ویندوز ۷ بیشترین استفاده را توسط بازدیدکنندگان داشته است. به طور میانگین ۸۷۶۳ بازدید در طول روز از صفحات صورت گرفته و میانگین زمان بازدید از صفحات توسط بازدیدکننده 07/9 دقیقه است.
بیشترین خطای سیستم در بازیابی اطلاعات مورد نظر کاربران، پیدا نشدن صفحه مورد نظر یا 404 Not Foundبوده است که یکی از عمومیترین پیامهاست که به معنای تلاش برای دسترسی به صفحهای است که در حال حاضر وجود ندارد. حال، ممکن است صفحة مورد نظر حذف شده یا کاربر آدرس آن را اشتباه وارد کرده باشد. این پیغامهای خطا اغلب به وسیلة وبسرورها تولید و برای مرورگر کاربر ارسال میشوند. برای اطمینان بیشتر، کاربر باید آدرسی را که تایپ کرده، دوباره کنترل کند. اگر هنگام کلیک روی لینکی این پیام ظاهر شود، ممکن است لینک اشتباه بوده، یا این که صفحة مورد نظر قبلاً حذفشده باشد.
استفاده از عملگرهای جستجو، جستجوی فیلدی، جستجو بر اساس نمایه نویسنده، کلید واژهها و ... پیوندهای خروجی آر.اس.اس، نمایش مقالههای پربازدید و... از نقاط قوّت این سامانه بهشمار میرود. نبود راهنمای آموزشی برای استفاده کاربران، فعال نبودن منوی جستجوی موضوعی در بخش مرور و فعال نبودن بخش داوری برخط مقالهها برای تسریع روند بررسی مقالهها توسط داوران، از مواردی است که در این سامانه مورد توجه قرار نگرفته است .
بررسی رفتار جستجوی کاربران با استفاده از دادههای ثبت شده در سرور سامانة اطلاعاتی با دقت و صحت بسیار و در یک محیط طبیعی انجام میشود. از دیگر مزایای این روش نسبت به روشهای دیگر، بررسی رفتار اطلاعیابی کاربران مثل مصاحبه و پرسشنامه که صرفاً به محفوظات ذهنی کاربران متکی است، گردآوری اطلاعات مستقل از کاربران (بدون آگاهی کاربر و به صورت پنهان) است.
نتایج این مطالعه و دیگر مطالعات انجام شده در این زمینه نشان میدهد دادههای ذخیره شده در فایلهای لاگ به تنهایی نمیتواند به طور کامل جزئیات دقیق رفتار جستجو و آثار بهجای مانده از دسترسی کاربران به اطلاعات وبسایت (مانند مشخص نبودن طول زمان نشست، شناسایی کاربر خاص و ...) را مشخص کند. بنابراین، توجه به پیشپردازش دادههای لاگکشف زمینههای جستجو، تجزیه و تحلیل الگوی اطلاعیابی کاربران و استفاده از این اطلاعات و الگوها برای نیازهای خاص ضروری است. دستیابی به اطلاعات قابل اطمینانتر، استفاده از تحقیقات کیفی در زمینة رفتار اطلاعیابی کاربران، پیشنهاد این مطالعه و غالب مطالعات انجام شده با این روش است. البته این نکته را نباید از نظر دور داشت که ارجاع لاگ، جزئیات بیشتر و بسیار ویژه از موتورهای جستجو و سیاهههای جستجوی مربوط را ارائه میدهد و از آنجا که 22% از ترافیک (32 میلیون بازدید) در هر سال فقط از یک موتور جستجو (گوگل) سرچشمه میگیرد . Jamali& Watkinson, 2014)Clark,) میتواند بسیار در فرایند اطلاعیابی کاربران سودمند واقع شود.
در تحلیل نهاییِ یافتههای پژوهش میتوان گفت نتایج این پژوهش علاوه بر شناخت چگونگی رفتار کاربران در استفاده از سامانه، عملکرد آن را نیز بررسی میکند و نقاط قوّت و ضعف آن را در تعامل با کاربران آشکار میسازد. توجه به رفع نواقص احتمالی موجود و تقویت موارد قوّت، فرصت مناسبی برای برنامهریزیهای آینده در جهت ارتقای سامانه با در نظر گرفتن نیازها، اولویتهای کاربران و سودمندی هزینهها فراهم خواهد آورد. با چنین رویکردی، تصمیمگیریها مبتنی بر شناخت، و در نهایت به سود کاربران و مدیران حوزههای مرتبط خواهد بود.
پیشنهادهای پژوهش
- در نظر گرفتن یک بخش آموزشی برای استفادة کاربران ار قسمتهای مختلف سامانه، ضروری است.
- یک بخش راهنما برای جستجوهای ناموفق و بازیابیهای نامرتبط در سامانه در نظر گرفته شود.
- ارجاع تمامی نشانیها به یک نشانی اصلی، با هدف کاهش مشکلات و نتیجهگیری بهتر در موتورهای جستجو انجام شود.
- پیوندهای خروجی Xmlو Rssو Htmlدر پایین هر نسخه نشریه اضافه شود.
- در بخشی آمار بازدید مقالهها و نیز آمار پرینت و ارسال به دوستان ارائه شود.
- گزارش دفعات مشاهدة چکیده، مشاهده و دریافت اصل مقالههای به گزارش مقالههای اضافه شود.
- امکان دریافت کل فایلهای مقالههای یک شماره نشریه فراهم شود.
- شماره صفحات مقالهها، در صفحة مرور نسخههای نشریهها اضافه شود.