نوع مقاله : مقاله پژوهشی
نویسنده
عضو هیئت علمی مرکز منطقهای اطلاعرسانی علوم و فناوری
چکیده
کلیدواژهها
درآمد
بیش از 80 سال است محققان بویژه در حوزة آموزش، توجه خود را به بحث سطح دشواری و سادگی متون معطوف کردهاند. پذیرة اصلی که در ابتدای امر به شکلگیری و رشد این حوزه پژوهشی کمک کرده، باور محققان به این بوده است که میتوان درجه و سطح دشواری یک متن را از طریق فرمولهایی مشخص نمود و با استفاده از مؤلفههای استخراج شده از متن محاسبه و با بهرهگیری از نتایج آن، متون را سطحبندی کرد. نتایج حاصل از این بررسیها در نهایت به فهرستی درجهبندی شده از متون میانجامید که معلمان با کمک آن متن مناسب برای آموزش را انتخاب میکردند. در همین راستا، محققان مختلف در بازههای زمانی گوناگون، راهبردها و فرمولهای متفاوتی را ابداع و به آزمون گذاردهاند. با نگاهی به روند توسعة این حوزة مطالعاتی، میتوان شاهد تغییر مسیر توجه محققان از شاخصهای واژگانی و نحوی به سمت شاخصهای معنایی بود.
استفاده از شاخصهای سنجش خوانایی و به کار بستن آنها در امر بازیابی اطلاعات، از موضوعاتی است که در سطح بینالمللی کمتر به آن توجه شده است. تنها در دهه اخیر حرکتهای جدیدی در عرصه استفاده از این شاخصها مشاهده میشود؛ که از این میان میتوان به تلاش OCLC در استفاده از شاخص سنجه واژگانی[1] برای جستجوی کتابهای مناسب گروههای مختلف سنی کودکان و نوجوانان اشاره کرد [2](OCLC, 2010- Jul- 15). از دیگر سو، یکی از زمینههای دارای اهمیت در برقراری پیوند میان بازیابی اطلاعات و سنجش خوانایی، استفاده از سنجههای خوانایی مفهوم - پایه[3] است. این سنجهها برای استفاده در بازیابیهای مرتبط با حوزههای موضوعی خاص[4] مناسب میباشند. با نگاهی به متون این حوزه میتوان اینگونه برداشت کرد که تاکنون در خارج از ایران در حوزة علوم پزشکی پژوهشهایی صورت گرفته است. این درحالی است که در ایران پژوهشهای صورت گرفته در حوزه سنجش خوانایی، از بدو امر تاکنون بیشتر بر سنجههای کلاسیک تأکید داشته و به سنجههای مفهوم - پایه و در نتیجه بازیابی حوزه وابسته در متون فارسی، توجهی نشده است. این بدان معناست که نه تنها جای چنین پژوهشی در زبان فارسی خالی است، بلکه با توجه به اینکه تاکنون حوزه علوم پزشکی به منزلة حوزهای که هم عموم مردم و هم متخصصان در سطوح مختلف با منابع اطلاعاتی آن سر و کار دارند مورد توجه این پژوهشها در خارج از ایران بوده است، سایر حوزههای دارای ویژگی مشابه با متون علوم پزشکی (به عنوان مثال، علوم رایانه) در سطح بینالمللی کمتر مورد توجه واقع شده است. بنابراین، مسئله پژوهش حاضر، مشخص نبودن امکان پیادهسازی شاخصهای سنجش خوانایی سنتی (فلش - دیانی) و نیز شاخصهای سنجش خوانایی مفهوم - پایه در بازیابی متون تخصصی فارسی است. به عبارت بهتر، مشخص نیست بازآرایی (رتبهبندی مجدد) نتایج بازیابی یک پایگاه در پیوند با پرس و جوهای تخصصی برمبنای این شاخصها، با رتبهبندی کاربران غیر متخصص از نظر درجه دشواری متون تا چه حد همخوانی دارد. حال، با توجه به رسوخ رایانه و فناوری اطلاعات به تمام شئون روزمرة زندگی افراد، به جز متخصصان حوزه علوم رایانه، بسیاری از کاربران عادی نیز که فاقد تحصیلات دانشگاهی در این حوزه هستند، به جستجوی اطلاعات در این زمینه دست میزنند. به همین دلیل، حوزة علوم رایانه به عنوان بستر اصلی بررسی خوانایی مفهوم – پایه، مد نظر قرار گرفت. رویکرد این پژوهش نه تنها گامی مثبت در جهت پیشبرد پژوهشهای داخلی به منظور همسوسازی دانش در این زمینه با دانش جهانی است، بلکه دستاوردهای آن علاوه بر استفادهپذیری بومی، کارایی بینالمللی در سطح اینترنت - حداقل در پیوند با متون فارسی زبان - خواهد داشت.
مروری بر نوشتارها
در پیوند با سابقه کار در این حوزه، میتوان مطالعات انجام شده در آن را به سه دسته تقسیم کرد (Zhao & Kan 2010):
در ایران اگرچه دیانی (1379، 5) اولین حرکتها در زمینة خوانایی متون را به سال 1355 و انتشار کتاب بسامدی واژهها در نوشتههای مخصوص عامه مردم میداند، پیش از او «غروی» (1344) نوشتاری را در این زمینه منتشر ساخته است. با این حال، اولین پژوهش جدی در این زمینه را میتوان به سال 1363 توسط شورای کتاب کودک نسبت داد (شعاری نژاد 1374).
این درحالی است که یکی از اصلیترین پژوهشهای مرتبط با سنجش خوانایی نوشتههای فارسی، مربوط به کار دیانی (1369) است. وی بر اساس مطالعات خود، نه تنها به سنجش خوانایی نوشتههای فارسی برای سطوح سنی مختلف از کودک تا نوجوان پرداخت، بلکه دو شاخص پرکاربرد سنجش خوانایی (یعنی شاخصهای گانینگ و فلش) را برای استفاده در زبان فارسی مناسب سازی نمود. از دیگر پژوهشهای این حوزه در ایران میتوان به «یارمحمدی» (1371)، «طابوسیان و عسکریان» (1374)، «کچرشاوی» (1374) و «دیانی» (1379) اشاره کرد.
به هر روی، شاید بتوان دهة 1370 را دهة شکوفایی انجام پژوهش در زمینه سنجش خوانایی دانست. در دهة 1380 نیز پژوهشهای «مفتون و دقیق» (1380)، «فضل اللهی و ملکی توانا» (1389) و «بنی اقبال، بزرگی و رمضانی» (1390) از جمله موارد قابل ذکرند. به طور کلی با نگاهی به پژوهشهای انجام شده در این زمینه و بررسی سنجههای پیشنهادی، میتوان به این نتیجه رسید که در سطح جهان حوزه سنجش خوانایی با استناد به دشواری و سادگی واژگان به کار رفته در متن، آغاز و در ادامه با پیشرفتهای حاصل و استفاده از رویکردهای یادگیری هدایت شده، به پیشرفتهای قابل توجهی دست یافته است. با وجود پژوهشهای صورت گرفته، تا پیش از این در ایران با استفاده از شاخصهای مناسب سازی شده گانینگ و یا فلش، بیشتر بر خوانایی نحوی تمرکز داشته و به همین خاطر بیشتر به متون مناسب کودکان و نوجوانان (متون عمومی) پرداختهاند. بنابراین، جای پژوهشی که به صورت اخص از متون عمومی یا مناسب کودکان فاصله بگیرد و شاخصهای سنجش خوانایی را در حوزههای تخصصی و یا علمی مورد توجه قرار دهد، در زبان فارسی خالی است.
پرسشهای پژوهش
در این راستا، سه پرسش اساسی مطرح گردید:
روش پژوهش و جامعة آماری
پژوهش حاضر از نوع کاربردی بوده و در دو مرحله به روشهای تحلیل محتوا و نیز پیمایشی صورت گرفته است. از روش تحلیل محتوا در مرحلة سنجش خوانایی متون با استفاده از شاخصهای سنتی و مفهوم - پایه و از روش پیمایشی برای مقایسه نتایج رتبهبندی با نظر مخاطبان غیر متخصص، استفاده شده است.
جامعة آماری این پژوهش مقالههای فارسی نمایهسازی شده در پایگاه مقالات فارسی مرکز منطقهای اطلاعرسانی علوم و فناوری در حوزه علوم رایانه است. با توجه به اینکه هدف اصلی این پژوهش بازآرایی نتایج بازیابی شده از پایگاه بر اساس درجه دشواری بود، به منظور انتخاب مجموعه مدارک پایه، از روش جستجو استفاده شد. ابتدا با استفاده از Google Trends[14] پرکاربردترین واژگان حوزه رایانه توسط کاربران اینترنتی تعیین شد. در نهایت، با توجه به همپوشانی برخی جستجوها، 28 ترکیب کلی برای جستجو در پایگاه انتخاب شد. هدف اصلی از انتخاب این کلیدواژهها آن بود که اصطلاحهایی از حوزة رایانه و فناوری اطلاعات در پایگاه مقالات فارسی مبنای جستجو قرار گیرند که عملاً بیشتر توسط کاربران در جستجوها استفاده میشوند. پس از انجام جستجوها، با انتخاب نتایج صفحه اول بازیابی شده، و در نهایت با حذف موارد تکراری، 215 مقاله به منزلة بدنه متون برای بررسی انتخاب شد.
مشابه با پژوهشهای دیگر، در این پژوهش نیز سه نمونه 100 کلمهای از ابتدا، وسط و انتهای متون استخراج شد. ازجمله پژوهشگرانی که در تحقیقات خود به نمونهگیری پرداختهاند، میتوان به «دیّانی» (1379)، «کرافورد» (Crawford 1984) و یا «پارکر و هاسبروک» (Parker & Hasbrouck 2001) اشاره نمود.
همچنین با توجه به اینکه اصطلاحنامه INSPEC در پارهای از پایگاههای ایرانی برای نمایهسازی متون حوزه مهندسی و علوم رایانه استفاده شده است، در پژوهش حاضر نیز به منظور سنجش دامنة مدرک و عمق واژگان از یک سو و نیز محاسبه همگرایی مدرک از سوی دیگر، از این اصطلاحنامه استفاده شد. این اصطلاحنامه پیشتر در سال 1384 به فارسی برگردانده شده است. با وجود این، نظر به اینکه ویرایش آخر آن مربوط به سال 2011 بوده است، محقق به منظور استفاده از جدیدترین نسخة اصطلاحنامه، از ویرایش انگلیسی آن استفاده کرد.
در مرحلة دوم پژوهش از سی نفر از دانشجویان و دانشآموختگانی که در رشتههایی غیر از علوم رایانه و یا فناوری اطلاعات مطالعه داشتند، استفاده شد. از نظر حجم نمونه، با نگاهی به متون موجود میتوان به این نتیجه رسید که قاعده 30 نفر حجم نمونه به منزلة کمینه حجم نمونه برای یک نمونه نسبتاً بزرگ برای انجام پژوهشهای مختلف به صورت یک قرارداد عام[15]در آمده است. «دیّانی» (1382) نیز در کتاب خود به این نکته اشاره میکند که در بسیاری از تحقیقات تجربی و در بسیاری تحقیقات که متغیّر وابسته پایایی نسبتاً کمی دارد، استفاده از نمونههایی با 30 مورد توصیه میشود. این درحالی است که در پژوهشهای مشابه خارجی نیز از نمونههایی با حجم حتی کمتر از 30 نفر نیز استفاده شده است. به عنوان مثال، میتوان به پژوهش «آرمبروستر و اندرسون» (Armbruster & Anderson 1981) با 17نفر، و یا پژوهش «پیتلر و ننکوا» (Pitler & Nenkova 2008) با 30 نفر اشاره نمود.
در نهایت، پس از نمونهگیری، از پرسشنامهای دو قسمتی برای بررسی نظر مخاطبان در مورد رتبهبندی نتایج بازیابی برمبنای شاخصهای مورد مطالعه استفاده شد. قسمت اول به رتبهبندی متون اختصاص داشت که از کاربر میخواست متون را به ترتیب دشواری رتبهبندی کند. در قسمت دوم، طی یک پرسش باز از آنها خواسته میشد در مورد عوامل اثرگذار بر مفهوم و یا نامفهوم بودن متون توضیحاتی ارائه دهند. این پرسشنامه به صورت تصادفی در اختیار دانشجویان و دانشآموختگانی قرار میگرفت که در کتابخانة مرکزی دانشگاه شیراز رفت و آمد داشتند و رشته تحصیلی آنها متفاوت از علوم رایانه و یا فناوری اطلاعات بوده است.
شاخصهای مورد بررسی در پژوهش
در این پژوهش به منظور بررسی و سنجش خوانایی متون، شاخصهای زیر به صورت دستی محاسبه گردید:
شاخص فلش/ دیانی (دیانی، 1379)
دامنه مدرک (Yan, Song & li 2006)
همگرایی مدرک (Yan, Song & li 2006)
یافتههای پژوهش
پیش از پرداختن به پاسخ پرسشهای پژوهش، یادآوری نکاتی چند در پیوند با نحوة پاسخدهی به هر پرسش، توالی پرسشها و نیز نتیجة نهایی ضروری است. پرسش اول، به بحث تفاوت میان متون مختلف از نظر شاخصهای فلش - دیانی، دامنه مدرک و همگرایی مدرک میپردازد. پرسش دوم، بحث امکان سنجی رتبهبندی نتایج بر مبنای هر سه شاخه فلش - دیانی، دامنه مدرک و همگرایی مدرک، در آن واحد را هدف قرار میدهد. از رویکردی دیگر، پرسش سوم به بررسی اثر بخشی هریک از رتبهبندیها از نظر خوانندگان میپردازد. بدیهی است، چنانچه میان نتایج حاصل از رتبهبندی خوانندگان و نتایج حاصل از استفاده از هریک از شاخصهای سنجش خوانایی رابطه وجود داشته باشد، میتوان شاخصهای مذکور را از نظر سطحبندی نتایج جستجو، ارزشمند و مؤثر دانست.
پرسش اول: چه تفاوتی میان متون تخصصی مورد بررسی در حوزة رایانه از نظر شاخصهای فلش - دیانی، دامنة مدرک و همگرایی مدرک، وجود دارد؟
برای پاسخ به این پرسش، تمامی مقادیر مرتبط با هریک از متون، جداگانه محاسبه شد. سپس برای محاسبه یک مقدار کلی برای هر شاخص در هر مقاله، میانگین مقادیر محاسبه شده برای شاخصهای فلش - دیانی، دامنة مدرک و همگرایی مدرک در هر سه نمونه، محاسبه گردید. در نهایت، برای بررسی تفاوت میان گروههای مختلف از نظر هریک از این سه شاخص، از آزمون آنوای یک طرفه استفاده شد. شاخصهای محاسبه شده برای هر مقاله مورد آزمون قرار گرفت که نتایج حاصل از آن، در جدول 1 به نمایش در آمده است. همانگونه که در این جدول مشاهده میشود، مقدارP در سطح 05/0 برای هر سه شاخص معنادار است. این مسئله بدان معناست که میان متون هریک از حوزههای فرعی 28 گانه مرتبط با علم رایانه تفاوت معناداری وجود دارد. این تفاوت میتواند ناشی از درجة دشواری هر متن یا متنهای مرتبط با یک گروه نسبت به سایر متون باشد.
جدول 1. آماره آنوای یک طرفه برای سه شاخص فلش - دیانی، دامنه مدرک و همگرایی مدرک از نظر حوزههای فرعی موضوعی زیر مجموعه علوم رایانه
|
درجه آزادی |
میانگین توان دوم |
F |
Sig |
فلش – دیانی بین گروهها درون گروهها جمع |
27 187 214 |
972/289 541/136 |
124/2
|
002/0 |
دامنة مدرک بین گروهها درون گروهها جمع |
27 187 214 |
652/1355 906/364 |
715/3
|
000/0 |
همگرایی مدرک بین گروهها درون گروهها جمع |
27 187 214 |
088/631 728/388 |
623/1 |
033/0
|
برای تشخیص تفاوت میان هریک از گروهها، از آزمون تعقیبی توکی[16] استفاده شد. در پیوند با هریک از شاخصهای مورد بررسی، مدارک بازیابی شده برای حاصل از جستجو برای عبارتهای «ویروس جدید»، و «وب + وب سایت» به بروز این تفاوت شدهاند. در پیوند با شاخص فلش - دیانی، بانگاهی دقیقتر به متون این گروهها میتوان نتیجه گرفت که در تمام متنهای گروه «ویروس جدید» و بویژه در مواردی که شاخص محاسبه شده برای آنها نشاندهندة دشوارتر بودن متن است، از اصل کلمات به انگلیسی نیز استفاده شده است؛ حتی در زمانی که معادل فارسی کلمه نیز آورده شده است. از دیگر ویژگیهای متون این گروه، استفادة بسیار زیاد از آوانگاری کلمات است. آوا نگاری کلمات در نهایت به ایجاد واژگانی منجر میشود که با رسمالخط جدید ممکن است برای خواننده اندکی متفاوت و یا تاحدودی ناآشنا باشد. این درحالی است که در پیوند با شاخصهای دامنة مدرک و همگرایی مدرک، با نگاهی به متون بازیابی شده و بررسی دقیقتر آنها میتوان به این نتیجه رسید که در متون گروه «وب + وب سایت»، از اصطلاحات تخصصی کمتری استفاده شده و جایی که تعداد این اصطلاحات بیشتر است، عمق اصطلاحات کمتر بوده است. به عبارت دیگر واژگان تخصصی این بخش کمتر بوده و آنچه به عنوان واژههای تخصصی در متون دیده میشود، که یا به عنوان اصطلاح رأس به کار میروند و یا به اصطلاح رأس نزدیکتر بودهاند. به بیان بهتر، در متون این گروه نسبت به سایر گروهها اصطلاحات عمومیتری به کار رفته است.
بدیهی است، در یک ساختار درختی چنانچه دو اصطلاح رأس باشند و یا اینکه فاصلة کمی با یک اصطلاح رأس داشته باشند، از نظر درجه و یا فاصله به هم نزدیکند. لذا با نگاهی به متنهای بازیابی شده در این گروه، میتوان دلیل بالا بودن میزان شاخص همگرایی مدرک را به وضوح مشاهده کرد. به عبارت دیگر، در متونی که به توصیف وبسایتها میپردازند، عموماً از اصطلاحات جزئی و تخصصی کمتری استفاده شده و همین حداقل از نظر دامنة واژگانیِ تخصصیِ به کار رفته در متن، باعث انسجام محتوایی بیشتر متن میشود. بدیهی است، متنی که به حوزههای مختلف موضوعی در یک مجال کوتاه میپردازد، درجه انسجام خود را پایین آورده است. به این مورد در پژوهش «یان، سونگ و لی» (Yan, Song & Li 2006) نیز اشاره شده و یافتههای این پژوهش در جهت یافتههای آنهاست.
پرسش دوم: آیا امکان رتبهبندی مجدد نتایج جستجو در پایگاه مقالات فارسی مرکز منطقهای اطلاعرسانی علوم و فناوری بر مبنای هر سه شاخص فلش - دیانی، دامنة مدرک و همگرایی مدرک در آن واحد وجود دارد؟
پیشنهاد پژوهشگران مختلف برای استفاده از شاخصهای سنجش خوانایی مختلف به صورت همزمان، هنگامی که تمامی شاخصها بر یک پایه باشند، استفاده از جمع است. در این مرحله، با توجه به اینکه تاکنون دراین زمینه در زبان فارسی پژوهشی انجام نشده که اثبات کننده امکان انجام چنین کاری حداقل در متون فارسی باشد، به منظور سنجش امکانپذیری این کار، وجود رابطه میان شاخصهای محاسبه شده برای متون بررسی شد. بدیهی است، وجود رابطه میان شاخصهای محاسبه شده، نشاندهندة وجود همنوایی میان این شاخصهاست و امکان افزودن آنها به یکدیگر را فراهم میآورد. بدین منظور، از آزمون وجود رابطه معنادار میان دو متغیر استفاده شد تا شرایط وجود رابطه میان شاخصها به صورت دو به دو بررسی گردد. با نگاهی به جدول 2 میتوان نتیجه گرفت که میان دو شاخص دامنة مدرک و همگرایی مدرک که هر دو ناظر بر خوانایی محتوایی مدرک هستند، رابطه معنادار و منفی وجود دارد. این نکته بخصوص با توجه به پراکندگی دادهها بر قوّت این ادعا میافزاید، زیرا معمولاً پراکندگی دادهها ( با استناد به انحراف استاندارد دادهها) از به وجود آمدن رابطه قوی جلوگیری میکند.
جدول 2. بررسی وجود رابطه میان شاخصهای محاسبه شده برای مدارک
همگرایی مدرک |
دامنه مدرک |
فلش دیانی |
|
400/0 95/0 105/1 |
022/0 – 744/0 201/6 - |
ـــــــــــــــــــ |
فلش دیانی آماره پیرسون Sig. (دو راهه) کوواریانس |
499/0 – 000/0 190/226- |
ـــــــــــــــــــ |
022/0 – 744/0 201/6 - |
دامنه مدرک آماره پیرسون Sig. (دو راهه) کوواریانس |
ــــــــــــــــــ |
99/4 – 000/0 190/226 - |
400/0 95/0 105/1 |
همگرایی مدرک آماره پیرسون Sig. (دو راهه) کوواریانس |
این نکته بدان معناست که با افزایش درجه دامنه مدرک، از همگرایی مدرک کاسته میشود، زیرا هرچه تعداد واژگان تخصصی در متن بیشتر باشد، به واسطة عمیقتر شدن واژگان از یکسو و تعداد روابط محتوایی از سوی دیگر، احتمال کاهش میزان همگرایی مفهومی محاسبه شده بیشتر میشود. با وجود این همنوایی، استثناهایی نیز وجود دارد. در جایی که متن مورد نظر تنها یک واژة تخصصی داشته باشد، بدیهی است همگرایی متن به حداکثر خواهد رسید. در چنین شرایطی، دامنة مدرک نیز رقم قابل توجهی خواهد بود. گفتنی است، زمانی که دامنة مدرک حداکثر باشد (یعنی 100) زمانی است که مدرک هیچ واژه تخصصی را در خود ندارد. بدیهی است، در چنین شرایطی، همگرایی مدرک با توجه به نبود واژة تخصصی از نظر حوزه موضوعی مورد بررسی، صفر خواهد بود.
میان شاخص فلش - دیانی با دو شاخص دیگر، رابطة معناداری مشاهده نمیشود. به عبارت دیگر، نتایج این بررسی نشان میدهد در رتبهبندی نتایج جستجو بهتر است از شاخص فلش دیانی به صورت جداگانه و از شاخصهای دامنه مدرک و همگرایی مدرک در کنار یکدیگر و با هم استفاده شود. بنابراین، پیشنهاد مشخص با توجه به یافتههای این پژوهش آن است که از شاخص DSDC یا همان دامنة همگرایی مدرک با فرمول زیر به منظور رتبهبندی مجدد نتایج استفاده شود.
DSDC= همگرایی مدرک + دامنة مدرک
از دیگرسو، با توجه به اینکه رابطة میان این دو شاخص معنادار است، میتوان با استفاده از آمارة رگرسیون خطی، معادله خط این رابطه را استخراج کرد، تا در شرایطی که امکان محاسبه روابط میان اصطلاحات به کار رفته در متن وجود ندارد، بتوان سطح همگرایی مدرک را برآورد نمود[17]. نتایج ارائه شده در جدول 3 نشاندهندة آن است که میتوان با اطمینان 99% براساس مقدار مشخص دامنة مدرک، به محاسبه همگرایی مدرک پرداخت.
جدول 3. جدول همبستگی میان شاخصهای دامنة مدرک و همگرایی مدرک
|
t |
همبستگی استاندارد |
همبستگی غیر استاندارد |
مدل |
|
Beta |
خطای استاندارد |
B |
|||
000/0 000/0 |
77/47 405/8- |
499/0 - |
435/1 550/0 |
557/68 462/0 - |
(ثابت) دامنه مدرک |
بنابراین، میتوان معادلة خط رگرسیون دامنه مدرک و همگرایی مدرک را به صورت زیر تدوین نمود:
557/68 + X 462/0 = همگرایی مدرک
چنان که در جدول 3 نیز قابل مشاهده است، مقدار ثابتی که باید به معادله اضافه شود، 557/68 محاسبه گردیده است. این در حالی است که ضریب محاسبه شده برای دامنة مدرک (X مطرح در معادله) برابر همین جدول 462/0- محاسبه شده است. بنابراین، میتوان چنین برداشت کرد که با افزایش هریک واحد به میزان دامنة مدرک، 499/0 از میزان همگرایی مدرک کاسته میشود. از دیگر سو، با توجه به اینکه در برخی موارد ممکن است مقدار محاسبه شده برای دامنه، همگرایی و یا دامنه - همگرایی مدرک در چندین مدرک بازیابی شده یکسان باشد، میتوان از شاخص فلش - دیانی برای بازآرایی و رتبهبندی آن مدارک در مرحلة بعدی استفاده کرد.
پرسش سوم: آیا رتبهبندی مجدد نتایج بر مبنای این سه شاخص میتواند برای کاربران عادی (فاقد تخصص در حوزه رایانه) مفید باشد؟
به منظور پاسخ به این پرسش، دومین نمونه 100 کلمهای استخراج شده از هر مقاله به عنوان متن مرجع برای بررسی خوانایی[18] در اختیار 30 نفر از دانشجویان و دانش آموختگان دانشگاه شیراز که در کتابخانه مرکزی دانشگاه شیراز حضور داشتند، قرار گرفت. آنها پس از مطالعه این متون، اقدام به رتبهبندی آنها از نظر درجه سختی و سادگی کردند.
جدول 4. خلاصه آمارة گاما بر رتبههای شاخص فلش - دیانی، دامنة مدرک، همگرایی مدرک و دامنه - همگرایی مدرک[19]
Sig |
خطای استاندارد |
مقدار گاما |
|
741/0 |
157/0 |
052/0 - |
رتبه خوانندگان* رتبه فلش |
25/0 |
153/0 |
181/0 - |
رتبه خوانندگان* دامنه مدرک |
327/0 |
150/0 |
148/0 |
رتبه خوانندگان* همگرایی مدرک |
031/0 |
146/0 |
525/0 |
رتبه خوانندگان* دامنه - همگرایی مدرک |
در نهایت، نتایج حاصل از این بررسی با رتبة کلی محاسبه شده بر مبنای شاخصهای دامنة مدرک، همگرایی مدرک، دامنة- همگرایی مدرک و نیز شاخص فلش - دیانی به صورت دو به دو مقایسه گردید. این مقایسه از طریق تشکیل جدول توافقی و نیز با استفاده از آزمون گاما صورت گرفت (جدول 4). دادههای ارائه شده در جدول 4 بیانگر آن است که در تمام مواردی که در جدول توافقی میان رتبهبندی خوانندگان و سایر رتبهبندیها تشکیل شده، رابطه معناداری میان رتبهبندی خوانندگان و رتبهبندیهای حاصل از محاسبة تکتک شاخصها وجود ندارد. اما نتیجه جالب در سطر چهارم جدول مشاهده میشود. این بررسی نشان میدهد رتبهبندی انجام شده بر مبنای شاخص ترکیبی دامنه - همگرایی مدرک، رابطه معناداری با رتبهبندی خوانندگان دارد. با توجه به عدد 525/0 نیز میتوان به این نتیجه رسید که این رابطه مثبت است و با بالا رفتن رتبه شاخصدامنه - همگرایی مدرک (یعنی خواناتر شدن متن از نظر محتوایی)، متن به نظر خواننده سادهتر میآید.
با توجه به نتایج حاصل از بررسی میتوان اینگونه جمعبندی نمود که از میان سه شاخص مورد بررسی، هیچ یک به تنهایی نمیتواند به بهترین وجه منعکسکنندة نظرهای خوانندگان متون باشد. این درحالی است که شاخص فلش - دیانی یک شاخص سنجش خوانایی سنتی بوده و عملاً تمرکزی بر تخصصی بودن یا نبودن متون ندارد. بنابراین، نمیتواند به تنهایی منعکسکنندة درجه سختی یا سادگی یک متن تخصصی باشد. مخاطبان یک متن تخصصی (ساده یا دشوار) در نهایت به درجهای از توانایی مطالعه رسیدهاند که معمولاً شاخصهای سنجش خوانایی سنتی که تنها بر سطح اول تحلیل زبانی یعنی تحلیل واژگانی تمرکز دارند، نمیتوانند آینة تمامنمایی برای تعیین درجه دشواری و یا سادگی یک متن تخصصی برای آنها باشند. تاکنون مطالعهای در این زمینه در ایران صورت نگرفته است، اما مطالعات خارجی مانند مطالعات «فنگ» (Feng 2010)، «تامین» ( (Ta –min 2006، «سی و کالان» ((Si & Callan 2001 و «کالینز تامسون و کالان» (Collins-Thompson & Callan 2001) و بسیاری دیگر نتایج مشابهی را گزارش میکنند. شاید به همین دلیل «بنی اقبال، بزرگی و رمضانی» (1390) در پژوهش خود تفاوت معناداری میان چکیدههای ساختار یافته و نایافته برمبنای شاخص فلش - دیانی مشاهده نکردند. این بدان معناست که در زبان فارسی نیز نمیتوان تنها با اتکا به شاخصهای سنتی به رتبهبندی خوانایی متون تخصصی پرداخت. این در حالی است که نتایج به وضوح نشانگر آن است که شاخص ترکیبی دامنه – همگرایی مدرک که هم به تعداد و عمق واژگان تخصصی توجه دارد و هم به قدرت رابطه میان این واژگان و میزان انسجام و وابستگی آنها، شاخص بهتری در تشخیص درجه دشواری متون تخصصی است. این یافته با یافتههای «یان، سونگ و لی» (Yan , Song & Li 2006) هماهنگی دارد. بنابراین، میتوان پس از محاسبة درجه دشواری هر متن بر مبنای این شاخص ترکیبی، گزینة دیگری با عنوان مرتب سازی بر مبنای سطح دشواری مدرک را به صفحه رابط کاربری نتایج جستجو افزود.
خوانندگان در پاسخ به پرسش باز مطرح در زمینة عوامل اثرگذار بر دشواری یک متن تخصصی، به نکات جالب توجهی اشاره کردند. از جمله این موارد، بحث استفاده از واژگان تخصصی به صورتهای مختلف در متون تخصصی است. اکثر این واژگان تخصصی از زبانهای خارجی(بویژه انگلیسی) وارد زبان فارسی شده و به واسطة تحول سریع در رشته، فرصت معادلسازی مناسب برای آنها وجود نداشته است؛ ویا گاه به واسطه سرعت شیوع استفاده از یک فناوری در سطح جامعه و کاربرد وسیع واژه خارجی توسط کاربران، استفاده از واژه معادل سازی شده در یک متن از دید خوانندگان آن، به افزایش پیچیدگی آن متن منجر گشته است. یکی دیگر از مشکلات مورد توجه خوانندگان، استفاده از آوانگاری واژگان خارجی است. همین تبدیل از یک فرم نگارشی به فرم آوانگاری برای برخی از خوانندگان به دشوار شدن یک متن میانجامد.
با نگاهی به پاسخها، گرایش خوانندگان عادی متون تخصصی در حوزة علوم رایانه یا به استفاده از عین کلمات به انگلیسی با همان حروف انگلیسی و یا استفاده از برابر نهادهای فارسی بوده و استقبال از عین کلمه به صورت آوانگاری شده در بین خوانندگان بسیار کم بود. به عنوان نمونه، یکی از خوانندگان چنین استدلال میکند: «استفاده از واژگان انگلیسی با همان حروف بدون تغییر، باعث میشود هنگام کار عملی با کلمهها آشنا بوده و کاربر دچار سردرگمی نشود». خواننده دیگری در همین رابطه بیان میدارد: «هر علم، واژگان مختص به خود را دارد که بالطبع اولین زبانی که علم در آن قرار دارد، باید مرجع قرار گیرد».
از این یافتهها میتوان در دستهبندیهای ثانویه به منظور تشخیص درجه دشواری یک متن برای خوانندگان عادی براساس نوع واژگان به کار رفته در متن استفاده کرد. اما به نظر میرسد ارائه نظر قطعی در این زمینه، به بررسیهای بیشتر به منظور رسیدن به قواعدی مستدل وابسته است.
بحث و نتیجهگیری
با نگاهی به یافتههای این پژوهش در پیوند با پرسشهای اول و دوم، میتوان به این نتیجه رسید که امکان استفاده از شاخصهای پیشگفته در متون فارسی وجود دارد. در پیوند با شاخص فلش، دیانی (1379) سالها پیش امکان استفاده از این شاخص را در صورت مناسب سازی شده برای ویژگیهای زبان فارسی به اثبات رسانده بود. به همین دلیل، شاخص مناسبسازی شدة فلش - دیانی را میتوان بدون هیچ مشکلی در مورد نوشتارهای فارسی عمومی به کار برد. این در حالی است که بر اساس بررسیهای انجام شده، استفاده از دو شاخص «دامنه» و «همگرایی مدرک»، امکانپذیر است و با توجه به آنچه در پیوند با پرسش دوم مطرح گردید، قابلیت ادغام دو شاخص دامنه و همگرایی مدرک در قالب یک شاخص ترکیبی فراهم است.
در مرحلة دوم پژوهش، رتبهبندی خوانندگان عادی با رتبهبندی انجام شده برمبنای شاخصهای مورد نظر مقایسه گردید. نتایج این مقایسه حاکی از آن است که تنها میان رتبهبندی خوانندگان عادی با رتبهبندی حاصل از شاخص ترکیبی دامنه - همگرایی مدرک، رابطهای معنادار وجود دارد. از آنجا که شاخص دامنة مدرک بر تعداد و عمق واژگان تخصصی تمرکز دارد و شاخص همگرایی مدرک بر روابط مفهومی میان این واژگان و طول این روابط متمرکز است، چنین میتوان برداشت کرد که صرف تعداد و عمق واژگان تخصصی و یا صرف نزدیکی روابط میان اصطلاحات تخصصی، هیچ یک به تنهایی نمیتواند به عنوان شاخص اصلی رتبهبندی برای تعیین سطح مخاطبان یک مدرک، ملاک عمل قرار گیرند. این در حالی است که شاخص ترکیبی دامنه - همگرایی مدرک که ناظر به هر دو زمینة عمق واژگان و روابط میان آنهاست، به مراتب به رتبهبندی خوانندگان عادی نزدیکتر است. از سوی دیگر، مشابه با پژوهشهای انجام شده در خارج از ایران، نتایج این پژوهش نیز حاکی از آن است که نمیتوان تنها به شاخص سنتی فلش - دیانی برای رتبهبندی مدارک استناد کرد. البته، همانگونه که پیشتر نیز بیان شد، این یافته ناقض کارایی فرمول پیش گفته در سنجش خوانایی نوشتههای فارسی بدون در نظر گرفتن تخصص موضوعی نیست. نکتهای که باید بر آن تأکید کرد، آن است که وقتی بحث خوانایی متون تخصصی مطرح میگردد، مفهوم بودن متن برای خوانندة آن بیش از آنکه متوجه شاخصهای مبتنی بر ویژگیهای واژگانی و نحوی باشد، متوجه ویژگیهای محتوایی است.
بنابراین، با توجه به یافتههای این پژوهش میتوان گفت نه تنها امکان استفاده از شاخص ترکیبی دامنه - همگرایی مدرک برای بازآرایی نتایج براساس درجه دشواری وجود دارد، بلکه رتبهبندی نتایج بازیابی شده بر اساس این شاخص، با نظر خوانندگان بالقوه هماهنگی بیشتری دارد. این ویژگی بخصوص در مواردی که مدارک بازیابی شده از نظر ربط در مرتبة یکسانی است، کاربرد مییابد، زیرا کاربر در مواجهه با مدارکی که از نظر ربط مشابه هستند، میتواند مدارکی را انتخاب کند که از نظر سطح تخصصی، مناسب با توان علمی وی باشد. مسلماً چنین راهبردی کمک شایانی به متخصصان نیز خواهد کرد، زیرا آنها نیز در انتخاب خود میتوانند مدارکی را انتخاب و ذخیره کنند که در سطح تخصص آنها باشد. در چنین شرایطی، در زمان اختصاص یافته از سوی متخصصان نیز صرفه جویی خواهد شد.
[1]. Lexile Measure.
[2]. Your Summer Reading Program Helps Stop Summer Reading Loss [Email] Posted through oclc@oclc.org List-serve.
[3]. Concept-based Readability Measures.
[4]. Domai8n-Specific Information Retrieval.
[5]. Heuristic Readability Measures.
[6]. Flesch- Kincaid.
[7]. Gunning.
[8]. Dale-Chall.
[9]. Supervised Learning Approaches.
[10]. Domain-Specific Readability Measures.
[11] .Wordlist based Approaches.
[12] .Ontology based Approaches.
[13]. این پایگاه صرفاً به عنوان یک بستر برای انجام این بررسی انتخاب شده و امکان انجام چنین بررسی روی هر پایگاه دیگری وجود دارد.
[15]. .Rule of Thumb.
[16]. Tukey.
[17]. پیش از انجام قطعی این کار و استفاده از آزمون رگرسیون، میتوان از نمودار توزیع نرمال خطاها استفاده کرد تا بررسی شود که آیا خطاها توزیع نرمالی دارند یا خیر. در این پژوهش، با توجه به نزدیک بودن خط توزیع نرمال خطاها به توزیع واقعی خطاهای استاندارد (نمودار هیستوگرام) و همچنین ناچیز بودن مقدار میانگین میتوان به این نتیجه رسید که توزیع خطاها نرمال است. به منظور جلوگیری از طولانی شدن نوشتار، از آوردن این نمودار در متن مقاله خودداری شده است.
[18]. به منظور انتخاب از بین یکی از سه نمونه 100 کلمهای، برای ارائه به خوانندگان جهت رتبهبندی، با بررسی آماری دادهها، گروهی که پراکندگی در آنها بیشتر بود، به منزلة نمونه انتخاب گردید. هدف از این انتخاب آن بود که شانس وجود رابطه اتفاقی میان رتبهبندی حاصل از شاخصها و رتبهبندی خوانندگان به حداقل رسیده و وجود رابطه نشان از قطعیت بیشتر پاسخ باشد.
[19]. این جدول حاصل ادغام 4 جدول از خروجیهای نرم افزار SPSS است.