بررسی امکان رتبه‌بندی مجدد نتایج جستجو برمبنای درجه دشواری متن به صورت خودکار: مورد کاوی متون تخصصی حوزه علوم رایانه و فناوری اطلاعات

نوع مقاله : مقاله پژوهشی

نویسنده

عضو هیئت علمی مرکز منطقه‌ای اطلاع‌رسانی علوم و فناوری

چکیده

هدف: این پژوهش، امکان‌سنجی استفاده از شاخصهای خوانایی مفهوم پایه و سنتی در بازآرایی و رتبه‌بندی مجدد نتایج جستجو در حوزه علوم رایانه و فناوری اطلاعات است. پیشتر از شاخصهای سنجش‌خوانایی با هدف درجه‌بندی متون برای آموزش استفاده می‌شد، حال آنکه گرایش به استفاده از این شاخصها در بازیابی اطلاعات، رویکرد جدیدی است که به عنوان یک راهکار جایگزین برای تعیین خودکار سطح مخاطبان یک سند بازیابی شده، مورد استفاده قرار می‌گیرد.
روش‏شناسی: بدین منظور، ابتدا با استفاده از ابزار google trends عبارتهای جستجو با بیشترین فراوانی در سطح اینترنت در حوزه علوم رایانه شناسایی شده و بر این اساس 28 جستجو صورت گرفت. در این مرحله، مدارک بازیابی شده از نظر شاخصهای فلش - دیانی، دامنة مدرک و همگرایی مدرک بررسی و در مرحلة بعد نتایج حاصل از این بررسی با نظرهای خوانندگان غیرمتخصص مقایسه شد. بدین منظور، نمونه‌هایی از هریک از این متون برای رتبه‌بندی در اختیار 30 نفر (فاقد تحصیلات آکادمیک در حوزه علوم رایانه) قرار گرفت.
یافته‏ ها: در مرحلة اول، نتایج بررسیها نشان می‌دهد امکان استفاده از شاخص ترکیبی دامنه - همگرایی مدرک برای متون وجود دارد. یافته‌های مرحلة دوم بررسی، از عملکرد بهتر رتبه‌بندی برمبنای شاخصِ ترکیبیِ تشکیل شده حکایت داشت.
 
 

کلیدواژه‌ها


درآمد

بیش از 80 سال است محققان بویژه در حوزة آموزش، توجه خود را به بحث سطح دشواری و سادگی متون معطوف کرده‌اند. پذیرة اصلی که در ابتدای امر به شکل‌گیری و رشد این حوزه پژوهشی کمک کرده، باور محققان به این بوده است که می‌توان درجه و سطح دشواری یک متن را از طریق فرمولهایی مشخص نمود و با استفاده از مؤلفه‌های استخراج شده از متن محاسبه و با بهره‌گیری از نتایج آن، متون را سطح‌بندی کرد. نتایج حاصل از این بررسیها در نهایت به فهرستی درجه‌بندی شده از متون می‌انجامید که معلمان با کمک آن متن مناسب برای آموزش را انتخاب می‌کردند. در همین راستا، محققان مختلف در بازه‌های زمانی گوناگون، راهبردها و فرمولهای متفاوتی را ابداع و به آزمون گذارده‌اند. با نگاهی به روند توسعة این حوزة مطالعاتی، می‌توان شاهد تغییر مسیر توجه محققان از شاخصهای واژگانی و نحوی به سمت شاخصهای معنایی بود.

استفاده از شاخصهای سنجش خوانایی و به کار بستن آنها در امر بازیابی اطلاعات، از موضوعاتی است که در سطح بین‌المللی کمتر به آن توجه شده است. تنها در دهه اخیر حرکتهای جدیدی در عرصه استفاده از این شاخصها مشاهده می‌شود؛ که از این میان می‌توان به تلاش OCLC در استفاده از شاخص سنجه واژگانی[1] برای جستجوی کتابهای مناسب گروه‌های مختلف سنی کودکان و نوجوانان اشاره کرد [2](OCLC, 2010- Jul- 15). از دیگر سو، یکی از زمینه‌های دارای اهمیت در برقراری پیوند میان بازیابی اطلاعات و سنجش خوانایی، استفاده از سنجه‌های خوانایی مفهوم - پایه[3] است. این سنجه‌ها برای استفاده در بازیابی‌های مرتبط با حوزه‌های موضوعی خاص[4] مناسب می‌باشند. با نگاهی به متون این حوزه می‌توان این‌گونه برداشت کرد که تاکنون در خارج از ایران در حوزة علوم پزشکی پژوهشهایی صورت گرفته است. این درحالی است که در ایران پژوهشهای صورت گرفته در حوزه سنجش خوانایی، از بدو امر تاکنون بیشتر بر سنجه‌های کلاسیک تأکید داشته و به سنجه‌های مفهوم - پایه و در نتیجه بازیابی حوزه وابسته در متون فارسی، توجهی نشده است. این بدان معناست که نه تنها جای چنین پژوهشی در زبان فارسی خالی است، بلکه با توجه به اینکه تاکنون حوزه علوم پزشکی به منزلة حوزه‌ای که هم عموم مردم و هم متخصصان در سطوح مختلف با منابع اطلاعاتی آن سر و کار دارند مورد توجه این پژوهشها در خارج از ایران بوده است، سایر حوزه‌های دارای ویژگی مشابه با متون علوم پزشکی (به عنوان مثال، علوم رایانه) در سطح بین‌المللی کمتر مورد توجه واقع شده است. بنابراین، مسئله پژوهش حاضر، مشخص نبودن امکان پیاده‌سازی شاخصهای سنجش خوانایی سنتی (فلش - دیانی) و نیز شاخصهای سنجش خوانایی مفهوم - پایه در بازیابی متون تخصصی فارسی است. به عبارت بهتر، مشخص نیست بازآرایی (رتبه‌بندی مجدد) نتایج بازیابی یک پایگاه در پیوند با پرس و جوهای تخصصی برمبنای این شاخصها، با رتبه‌بندی کاربران غیر متخصص از نظر درجه دشواری متون تا چه حد همخوانی دارد. حال، با توجه به رسوخ رایانه و فناوری اطلاعات به تمام شئون روزمرة زندگی افراد، به جز متخصصان حوزه علوم رایانه، بسیاری از کاربران عادی نیز که فاقد تحصیلات دانشگاهی در این حوزه هستند، به جستجوی اطلاعات در این زمینه دست می‌زنند. به همین دلیل، حوزة علوم رایانه به عنوان بستر اصلی بررسی خوانایی مفهوم پایه، مد نظر قرار گرفت. رویکرد این پژوهش نه تنها گامی مثبت در جهت پیشبرد پژوهشهای داخلی به منظور همسوسازی دانش در این زمینه با دانش جهانی است، بلکه دستاورد‌های آن علاوه بر استفاده‌پذیری بومی، کارایی بین‌المللی در سطح اینترنت - حداقل در پیوند با متون فارسی زبان -  خواهد داشت.

مروری بر نوشتارها

در پیوند با سابقه کار در این حوزه، می‌توان مطالعات انجام شده در آن را به سه دسته تقسیم کرد (Zhao & Kan 2010):

  1. سنجش خوانایی اکتشافی[5]. پژوهشهای «فوگل و واشبورن» (Vogel & Washburne 1928) و «گری و لیری» (Gray & Leary 1935) از نمونه‌های پیشتاز در این زمینه به‌شمار می‌آیند. اما می‌توان به جرأت گفت، برجسته‌ترین و پرکاربردترین شاخصهای سنجش خوانایی این گروه توسط «فلش – کینکید»[6]، «گانینگ»[7] و «دیل چال»[8] تدوین شده‌اند (دیانی 1379).
  2. سنجش خوانایی بر پایة یادگیری هدایت شده[9]. گرایش به این قبیل پژوهشها متضمن دسته‌بندی متون بر مبنای میزان دشواری آنها و سپس اختصاص معیارهایی برای تعیین میزان این دشواری است. از جمله پژوهشهای انجام شده در این حوزه می‌توان به «کالینز - تامپسون و کالان» (Collins-Thompson & Callan 2004)؛ «شارم و استن دورف» (Schwarm & Ostendorf 2005) ؛ «هایلمن و همکاران» (Heilman, et.al. 2007)؛ «لروی و همکاران» (Leroy, etal. 2008) و یا «پیتلر و ننکوا» (Pitler & Nenkova 2008) اشاره کرد.
  3. سنجش خوانایی حوزه وابسته[10]. رویکردهای غالب در این گروه از پژوهشها را می‌توان به دو گروه رویکردهای مبتنی بر فهرست واژگان[11] و رویکردهای هستی شناسانه[12] طبقه‌بندی نمود. رویکرد اول به تعیین دشواری مفهومی متن در یک حوزه با توجه به واژگان موضوعی آن حوزه می‌پردازد. پژوهشهای «کیم و دیگران» (Kim, etal. 2007)؛ و یا «بورست و همکاران» (Borst, etal. 2008) در این گروه قرار می‌گیرند. در رویکرد دوم، با استفاده از اصطلاحنامه‌ها و یا هستی شناسیهای موجود، روابط و فاصلة مفهومی میان اصطلاحات بررسی شده و معمولا با استناد به دو شاخص دامنه مدرک و همگرایی مدرک، خوانایی مفهومی متون در حوزه‏های مختلف تعیین می‌شود. در این رویکرد، می‌توان به پژوهش «یان، سونگ و لی» (Yan, Song & Li 2006) و یا «کار ژائو و کان» (Zhao & Kan 2010) اشاره کرد.

در ایران اگرچه دیانی (1379، 5) اولین حرکتها در زمینة خوانایی متون را به سال 1355 و انتشار کتاب بسامدی واژه‌ها در نوشته‌های مخصوص عامه مردم می‌داند، پیش از او «غروی» (1344) نوشتاری را در این زمینه منتشر ساخته است. با این حال، اولین پژوهش جدی در این زمینه را می‌توان به سال 1363 توسط شورای کتاب کودک نسبت داد (شعاری نژاد 1374).

این درحالی است که یکی از اصلی‌ترین پژوهشهای مرتبط با سنجش خوانایی نوشته‌های فارسی، مربوط به کار دیانی (1369) است. وی بر اساس مطالعات خود، نه تنها به سنجش خوانایی نوشته‌های فارسی برای سطوح سنی مختلف از کودک تا نوجوان پرداخت، بلکه دو شاخص پرکاربرد سنجش خوانایی (یعنی شاخصهای گانینگ و فلش) را برای استفاده در زبان فارسی مناسب سازی نمود. از دیگر پژوهشهای این حوزه در ایران می‌توان به «یارمحمدی» (1371)، «طابوسیان و عسکریان» (1374)، «کچرشاوی» (1374) و «دیانی» (1379) اشاره کرد.

به هر روی، شاید بتوان دهة 1370 را دهة شکوفایی انجام پژوهش در زمینه سنجش خوانایی دانست. در دهة 1380 نیز پژوهشهای «مفتون و دقیق» (1380)، «فضل اللهی و ملکی توانا» (1389) و «بنی اقبال، بزرگی و رمضانی» (1390) از جمله موارد قابل ذکرند. به طور کلی با نگاهی به پژوهشهای انجام شده در این زمینه و بررسی سنجه‌های پیشنهادی، می‌توان به این نتیجه رسید که در سطح جهان حوزه سنجش خوانایی با استناد به دشواری و سادگی واژگان به کار رفته در متن، آغاز و در ادامه با پیشرفتهای حاصل و استفاده از رویکردهای یادگیری هدایت شده، به پیشرفتهای قابل توجهی دست یافته است. با وجود پژوهشهای صورت گرفته، تا پیش از این در ایران با استفاده از شاخصهای مناسب سازی شده گانینگ و یا فلش، بیشتر بر خوانایی نحوی تمرکز داشته و به همین خاطر بیشتر به متون مناسب کودکان و نوجوانان (متون عمومی) پرداخته‌اند. بنابراین، جای پژوهشی که به صورت اخص از متون عمومی یا مناسب کودکان فاصله بگیرد و شاخصهای سنجش خوانایی را در حوزه‌های تخصصی و یا علمی مورد توجه قرار دهد، در زبان فارسی خالی است.

پرسشهای پژوهش

در این راستا، سه پرسش اساسی مطرح گردید:

  1. چه تفاوتی میان متون تخصصی مورد بررسی در حوزه رایانه از نظر شاخصهای فلش - دیانی، دامنه مدرک و همگرایی مدرک وجود دارد؟
  2. آیا امکان رتبه‌بندی مجدد نتایج جستجو در پایگاه مقالات فارسی مرکز منطقه‌ای اطلاع‌رسانی علوم و فناوری[13] برمبنای هر سه شاخص فلش - دیانی، دامنة مدرک و همگرایی مدرک در آن واحد، وجود دارد؟
  3. آیا رتبه‌بندی دوبارة نتایج بر مبنای این سه شاخص می‌تواند برای کاربران عادی (فاقد تخصص در حوزة رایانه) مفید باشد؟

روش پژوهش و جامعة آماری

پژوهش حاضر از نوع کاربردی بوده و در دو مرحله به روشهای تحلیل محتوا و نیز پیمایشی صورت گرفته است. از روش تحلیل محتوا در مرحلة سنجش خوانایی متون با استفاده از شاخصهای سنتی و مفهوم - پایه و از روش پیمایشی برای مقایسه نتایج رتبه‌بندی با نظر مخاطبان غیر متخصص، استفاده شده است.

جامعة آماری این پژوهش مقاله‌های فارسی نمایه‌سازی شده در پایگاه مقالات فارسی مرکز منطقه‌ای اطلاع‌رسانی علوم و فناوری در حوزه علوم رایانه است. با توجه به اینکه هدف اصلی این پژوهش بازآرایی نتایج بازیابی شده از پایگاه بر اساس درجه دشواری بود، به منظور انتخاب مجموعه مدارک پایه، از روش جستجو استفاده شد. ابتدا با استفاده از Google Trends[14] پرکاربردترین واژگان حوزه رایانه توسط کاربران اینترنتی تعیین شد. در نهایت، با توجه به همپوشانی برخی جستجوها، 28 ترکیب کلی برای جستجو در پایگاه انتخاب شد. هدف اصلی از انتخاب این کلیدواژه‌ها آن بود که اصطلاحهایی از حوزة رایانه و فناوری اطلاعات در پایگاه مقالات فارسی مبنای جستجو قرار گیرند که عملاً بیشتر توسط کاربران در جستجوها استفاده می‌شوند. پس از انجام جستجوها، با انتخاب نتایج صفحه اول بازیابی شده، و در نهایت با حذف موارد تکراری، 215 مقاله به منزلة بدنه متون برای بررسی انتخاب شد.

مشابه با پژوهشهای دیگر، در این پژوهش نیز سه نمونه 100 کلمه‌ای از ابتدا، وسط و انتهای متون استخراج شد. ازجمله پژوهشگرانی که در تحقیقات خود به نمونه‌گیری پرداخته‌اند، می‌توان به «دیّانی» (1379)، «کرافورد» (Crawford 1984) و یا «پارکر و هاسبروک» (Parker & Hasbrouck 2001) اشاره نمود.

همچنین با توجه به اینکه اصطلاحنامه INSPEC در پاره‌ای از پایگاه‌های ایرانی برای نمایه‌سازی متون حوزه مهندسی و علوم رایانه استفاده شده است، در پژوهش حاضر نیز به منظور سنجش دامنة مدرک و عمق واژگان از یک سو و نیز محاسبه همگرایی مدرک از سوی دیگر، از این اصطلاحنامه استفاده شد. این اصطلاحنامه پیش‌تر در سال 1384 به فارسی برگردانده شده است. با وجود این، نظر به اینکه ویرایش آخر آن مربوط به سال 2011 بوده است، محقق به منظور استفاده از جدیدترین نسخة اصطلاحنامه، از ویرایش انگلیسی آن استفاده کرد.

در مرحلة دوم پژوهش از سی نفر از دانشجویان و دانش‌آموختگانی که در رشته‌هایی غیر از علوم رایانه و یا فناوری اطلاعات مطالعه داشتند، استفاده شد. از نظر حجم نمونه، با نگاهی به متون موجود می‌توان به این نتیجه رسید که قاعده 30 نفر حجم نمونه به منزلة کمینه حجم نمونه برای یک نمونه نسبتاً بزرگ برای انجام پژوهشهای مختلف به صورت یک قرارداد عام[15]در آمده است. «دیّانی» (1382) نیز در کتاب خود به این نکته اشاره می‌کند که در بسیاری از تحقیقات تجربی و در بسیاری تحقیقات که متغیّر وابسته پایایی نسبتاً کمی دارد، استفاده از نمونه‌هایی با 30 مورد توصیه می‌شود. این درحالی است که در پژوهشهای مشابه خارجی نیز از نمونه‌هایی با حجم حتی کمتر از 30 نفر نیز استفاده شده است. به عنوان مثال، می‌توان به پژوهش «آرمبروستر و اندرسون» (Armbruster & Anderson 1981) با 17نفر، و یا پژوهش «پیتلر و ننکوا» (Pitler & Nenkova 2008) با 30 نفر اشاره نمود.

در نهایت، پس از نمونه‌گیری، از پرسشنامه‌ای دو قسمتی برای بررسی نظر مخاطبان در مورد رتبه‌بندی نتایج بازیابی برمبنای شاخصهای مورد مطالعه استفاده شد. قسمت اول به رتبه‌بندی متون اختصاص داشت که از کاربر می‌خواست متون را به ترتیب دشواری رتبه‌بندی کند. در قسمت دوم، طی یک پرسش باز از آنها خواسته می‌شد در مورد عوامل اثرگذار بر مفهوم و یا نامفهوم بودن متون توضیحاتی ارائه دهند. این پرسشنامه به صورت تصادفی در اختیار دانشجویان و دانش‌آموختگانی قرار می‌گرفت که در کتابخانة مرکزی دانشگاه شیراز رفت و آمد داشتند و رشته تحصیلی آنها متفاوت از علوم رایانه و یا فناوری اطلاعات بوده است.

شاخصهای مورد بررسی در پژوهش

در این پژوهش به منظور بررسی و سنجش خوانایی متون، شاخصهای زیر به صورت دستی محاسبه گردید:

شاخص فلش/ دیانی (دیانی، 1379)

 

دامنه مدرک (Yan, Song & li 2006)

 

 

همگرایی مدرک (Yan, Song & li 2006)

 

یافته‌های پژوهش

پیش از پرداختن به پاسخ پرسشهای پژوهش، یادآوری نکاتی چند در پیوند با نحوة پاسخ‌دهی به هر پرسش، توالی پرسشها و نیز نتیجة نهایی ضروری است. پرسش اول، به بحث تفاوت میان متون مختلف از نظر شاخصهای فلش - دیانی، دامنه مدرک و همگرایی مدرک می‌پردازد. پرسش دوم، بحث امکان سنجی رتبه‌بندی نتایج بر مبنای هر سه شاخه فلش - دیانی، دامنه مدرک و همگرایی مدرک، در آن واحد را هدف قرار می‌دهد. از رویکردی دیگر، پرسش سوم به بررسی اثر بخشی هریک از رتبه‌بندیها از نظر خوانندگان می‌پردازد. بدیهی است، چنانچه میان نتایج حاصل از رتبه‌بندی خوانندگان و نتایج حاصل از استفاده از هریک از شاخصهای سنجش خوانایی رابطه وجود داشته باشد، می‌توان شاخصهای مذکور را از نظر سطح‌بندی نتایج جستجو، ارزشمند و مؤثر دانست.

پرسش اول: چه تفاوتی میان متون تخصصی مورد بررسی در حوزة رایانه از نظر شاخصهای فلش - دیانی، دامنة مدرک و همگرایی مدرک، وجود دارد؟

برای پاسخ به این پرسش، تمامی مقادیر مرتبط با هریک از متون، جداگانه محاسبه شد. سپس برای محاسبه یک مقدار کلی برای هر شاخص در هر مقاله، میانگین مقادیر محاسبه شده برای شاخصهای فلش - دیانی، دامنة مدرک و همگرایی مدرک در هر سه نمونه، محاسبه گردید. در نهایت، برای بررسی تفاوت میان گروه‌های مختلف از نظر هریک از این سه شاخص، از آزمون آنوای یک طرفه استفاده شد. شاخصهای محاسبه شده برای هر مقاله مورد آزمون قرار گرفت که نتایج حاصل از آن، در جدول 1 به نمایش در آمده است. همان‌گونه که در این جدول مشاهده می‌شود، مقدارP در سطح 05/0 برای هر سه شاخص معنادار است. این مسئله بدان معناست که میان متون هریک از حوزه‌های فرعی 28 گانه مرتبط با علم رایانه تفاوت معناداری وجود دارد. این تفاوت می‌تواند ناشی از درجة دشواری هر متن یا متنهای مرتبط با یک گروه نسبت به سایر متون باشد.

 

جدول 1. آماره آنوای یک طرفه برای سه شاخص فلش - دیانی، دامنه مدرک و همگرایی مدرک از نظر حوزه‌های فرعی موضوعی زیر مجموعه علوم رایانه

 

درجه آزادی

میانگین توان دوم

F

Sig

فلش دیانی

بین گروه‌ها

درون گروه‌ها

جمع

 

27

187

214

972/289

541/136

124/2

 

 

002/0

دامنة مدرک

بین گروه‌ها

درون گروه‌ها

جمع

 

27

187

214

652/1355

906/364

715/3

 

 

000/0

همگرایی مدرک

بین گروه‌ها

درون گروه‌ها

جمع

 

27

187

214

088/631

728/388

623/1

033/0

 

 

برای تشخیص تفاوت میان هریک از گروه‌ها، از آزمون تعقیبی توکی[16] استفاده شد. در پیوند با هریک از شاخصهای مورد بررسی، مدارک بازیابی شده برای حاصل از جستجو برای عبارتهای «ویروس جدید»، و «وب + وب سایت» به بروز این تفاوت شده‌اند. در پیوند با شاخص فلش - دیانی، بانگاهی دقیق‌تر به متون این گروه‌ها می‌توان نتیجه گرفت که در تمام متنهای گروه «ویروس جدید» و بویژه در مواردی که شاخص محاسبه شده برای آنها نشان‌دهندة دشوارتر بودن متن است، از اصل کلمات به انگلیسی نیز استفاده شده است؛ حتی در زمانی که معادل فارسی کلمه نیز آورده شده است. از دیگر ویژگیهای متون این گروه، استفادة بسیار زیاد از آوانگاری کلمات است. آوا نگاری کلمات در نهایت به ایجاد واژگانی منجر می‌شود که با رسم‌الخط جدید ممکن است برای خواننده اندکی متفاوت و یا تاحدودی ناآشنا باشد. این درحالی است که در پیوند با شاخصهای دامنة مدرک و همگرایی مدرک، با نگاهی به متون بازیابی شده و بررسی دقیق‌تر آنها می‌توان به این نتیجه رسید که در متون گروه «وب + وب سایت»، از اصطلاحات تخصصی کمتری استفاده شده و جایی که تعداد این اصطلاحات بیشتر است، عمق اصطلاحات کمتر بوده است. به عبارت دیگر واژگان تخصصی این بخش کمتر بوده و آنچه به عنوان واژه‌های تخصصی در متون دیده می‌شود، که یا به عنوان اصطلاح رأس به کار می‌روند و یا به اصطلاح رأس نزدیک‌تر بوده‌اند. به بیان بهتر، در متون این گروه نسبت به سایر گروه‌ها اصطلاحات عمومی‌تری به کار رفته است.

بدیهی است، در یک ساختار درختی چنانچه دو اصطلاح رأس باشند و یا اینکه فاصلة کمی با یک اصطلاح رأس داشته باشند، از نظر درجه و یا فاصله به هم نزدیکند. لذا با نگاهی به متنهای بازیابی شده در این گروه، می‌توان دلیل بالا بودن میزان شاخص همگرایی مدرک را به وضوح مشاهده کرد. به عبارت دیگر، در متونی که به توصیف وب‌سایتها می‌پردازند، عموماً از اصطلاحات جزئی و تخصصی کمتری استفاده شده و همین حداقل از نظر دامنة واژگانیِ تخصصیِ به کار رفته در متن، باعث انسجام محتوایی بیشتر متن می‌شود. بدیهی است، متنی که به حوزه‌های مختلف موضوعی در یک مجال کوتاه می‌پردازد، درجه انسجام خود را پایین آورده است. به این مورد در پژوهش «یان، سونگ و لی» (Yan, Song & Li 2006) نیز اشاره شده و یافته‌های این پژوهش در جهت یافته‌های آنهاست.

پرسش دوم: آیا امکان رتبه‌بندی مجدد نتایج جستجو در پایگاه مقالات فارسی مرکز منطقه‌ای اطلاع‌رسانی علوم و فناوری بر مبنای هر سه شاخص فلش - دیانی، دامنة مدرک و همگرایی مدرک در آن واحد وجود دارد؟

پیشنهاد پژوهشگران مختلف برای استفاده از شاخصهای سنجش خوانایی مختلف به صورت همزمان، هنگامی که تمامی شاخصها بر یک پایه باشند، استفاده از جمع است. در این مرحله، با توجه به اینکه تاکنون دراین زمینه در زبان فارسی پژوهشی انجام نشده که اثبات کننده امکان انجام چنین کاری حداقل در متون فارسی باشد، به منظور سنجش امکان‌پذیری این کار، وجود رابطه میان شاخصهای محاسبه شده برای متون بررسی شد. بدیهی است، وجود رابطه میان شاخصهای محاسبه شده، نشان‌دهندة وجود همنوایی میان این شاخصهاست و امکان افزودن آنها به یکدیگر را فراهم می‌آورد. بدین منظور، از آزمون وجود رابطه معنادار میان دو متغیر استفاده شد تا شرایط وجود رابطه میان شاخصها به صورت دو به دو بررسی گردد. با نگاهی به جدول 2 می‌توان نتیجه گرفت که میان دو شاخص دامنة مدرک و همگرایی مدرک که هر دو ناظر بر خوانایی محتوایی مدرک هستند، رابطه معنادار و منفی وجود دارد. این نکته بخصوص با توجه به پراکندگی داده‌ها بر قوّت این ادعا می‌افزاید، زیرا معمولاً پراکندگی داده‌ها ( با استناد به انحراف استاندارد داده‌ها) از به وجود آمدن رابطه قوی جلوگیری می‌کند.

 

جدول 2. بررسی وجود رابطه میان شاخصهای محاسبه شده برای مدارک

همگرایی مدرک

دامنه مدرک

فلش دیانی

 

 

400/0

95/0

105/1

 

022/0 –

744/0

201/6 -

 

ـــــــــــــــــــ

فلش دیانی

آماره پیرسون

Sig. (دو راهه)

کوواریانس

 

499/0 –

000/0

190/226-

 

 

ـــــــــــــــــــ

 

022/0 –

744/0

201/6 -

دامنه مدرک

آماره پیرسون

Sig. (دو راهه)

کوواریانس

 

ــــــــــــــــــ

 

99/4 –

000/0

190/226 -

 

400/0

95/0

105/1

همگرایی مدرک

آماره پیرسون

Sig. (دو راهه)

کوواریانس

 

این نکته بدان معناست که با افزایش درجه دامنه مدرک، از همگرایی مدرک کاسته می‌شود، زیرا هرچه تعداد واژگان تخصصی در متن بیشتر باشد، به واسطة عمیق‌تر شدن واژگان از یک‌سو و تعداد روابط محتوایی از سوی دیگر، احتمال کاهش میزان همگرایی مفهومی محاسبه شده بیشتر می‌شود. با وجود این همنوایی، استثناهایی نیز وجود دارد. در جایی که متن مورد نظر تنها یک واژة تخصصی داشته باشد، بدیهی است همگرایی متن به حداکثر خواهد رسید. در چنین شرایطی، دامنة مدرک نیز رقم قابل توجهی خواهد بود. گفتنی است، زمانی که دامنة مدرک حداکثر باشد (یعنی 100) زمانی است که مدرک هیچ واژه تخصصی را در خود ندارد. بدیهی است، در چنین شرایطی، همگرایی مدرک با توجه به نبود واژة تخصصی از نظر حوزه موضوعی مورد بررسی، صفر خواهد بود.

میان شاخص فلش - دیانی با دو شاخص دیگر، رابطة معناداری مشاهده نمی‌شود. به عبارت دیگر، نتایج این بررسی نشان می‌دهد در رتبه‌بندی نتایج جستجو بهتر است از شاخص فلش دیانی به صورت جداگانه و از شاخصهای دامنه مدرک و همگرایی مدرک در کنار یکدیگر و با هم استفاده شود. بنابراین، پیشنهاد مشخص با توجه به یافته‌های این پژوهش آن است که از شاخص DSDC یا همان دامنة همگرایی مدرک با فرمول زیر به منظور رتبه‌بندی مجدد نتایج استفاده شود.

DSDC= همگرایی مدرک + دامنة مدرک

از دیگرسو، با توجه به اینکه رابطة میان این دو شاخص معنادار است، می‌توان با استفاده از آمارة رگرسیون خطی، معادله خط این رابطه را استخراج کرد، تا در شرایطی که امکان محاسبه روابط میان اصطلاحات به کار رفته در متن وجود ندارد، بتوان سطح همگرایی مدرک را برآورد نمود[17]. نتایج ارائه شده در جدول 3 نشان‌دهندة آن است که می‌توان با اطمینان 99% براساس مقدار مشخص دامنة مدرک، به محاسبه همگرایی مدرک پرداخت.

 

جدول 3. جدول همبستگی میان شاخصهای دامنة مدرک و همگرایی مدرک

 

t

همبستگی استاندارد

همبستگی غیر استاندارد

مدل

Beta

خطای استاندارد

B

000/0

000/0

77/47

405/8-

 

499/0 -

435/1

550/0

557/68

462/0 -

(ثابت)

دامنه مدرک

بنابراین، می‌توان معادلة خط رگرسیون دامنه مدرک و همگرایی مدرک را به صورت زیر تدوین نمود:

557/68 + X 462/0 = همگرایی مدرک

چنان که در جدول 3 نیز قابل مشاهده است، مقدار ثابتی که باید به معادله اضافه شود، 557/68 محاسبه گردیده است. این در حالی است که ضریب محاسبه شده برای دامنة مدرک (X مطرح در معادله) برابر همین جدول 462/0- محاسبه شده است. بنابراین، می‌توان چنین برداشت کرد که با افزایش هریک واحد به میزان دامنة مدرک، 499/0 از میزان همگرایی مدرک کاسته می‌شود. از دیگر سو، با توجه به اینکه در برخی موارد ممکن است مقدار محاسبه شده برای دامنه، همگرایی و یا دامنه - همگرایی مدرک در چندین مدرک بازیابی شده یکسان باشد، می‌توان از شاخص فلش - دیانی برای بازآرایی و رتبه‌بندی آن مدارک در مرحلة بعدی استفاده کرد.

پرسش سوم: آیا رتبه‌بندی مجدد نتایج بر مبنای این سه شاخص می‌تواند برای کاربران عادی (فاقد تخصص در حوزه رایانه) مفید باشد؟

به منظور پاسخ به این پرسش، دومین نمونه 100 کلمه‌ای استخراج شده از هر مقاله به عنوان متن مرجع برای بررسی خوانایی[18] در اختیار 30 نفر از دانشجویان و دانش آموختگان دانشگاه شیراز که در کتابخانه مرکزی دانشگاه شیراز حضور داشتند، قرار گرفت. آنها پس از مطالعه این متون، اقدام به رتبه‌بندی آنها از نظر درجه سختی و سادگی کردند.

 

 

جدول 4. خلاصه آمارة گاما بر رتبه‌های شاخص فلش - دیانی، دامنة مدرک،  همگرایی مدرک و دامنه - همگرایی مدرک[19]

Sig

خطای استاندارد

مقدار گاما

 

741/0

157/0

052/0 -

رتبه خوانندگان* رتبه فلش

25/0

153/0

181/0 -

رتبه خوانندگان* دامنه مدرک

327/0

150/0

148/0

رتبه خوانندگان* همگرایی مدرک

031/0

146/0

525/0

رتبه خوانندگان* دامنه - همگرایی مدرک

 

در نهایت، نتایج حاصل از این بررسی با رتبة کلی محاسبه شده بر مبنای شاخصهای دامنة مدرک، همگرایی مدرک، دامنة- همگرایی مدرک و نیز شاخص فلش - دیانی به صورت دو به دو مقایسه گردید. این مقایسه از طریق تشکیل جدول توافقی و نیز با استفاده از آزمون گاما صورت گرفت (جدول 4). داده‌های ارائه شده در جدول 4 بیانگر آن است که در تمام مواردی که در جدول توافقی میان رتبه‌بندی خوانندگان و سایر رتبه‌بندیها تشکیل شده، رابطه معناداری میان رتبه‌بندی خوانندگان و رتبه‌بندیهای حاصل از محاسبة تک‌تک شاخصها وجود ندارد. اما نتیجه جالب در سطر چهارم جدول مشاهده می‌شود. این بررسی نشان می‌دهد رتبه‌بندی انجام شده بر مبنای شاخص ترکیبی دامنه - همگرایی مدرک، رابطه معناداری با رتبه‌بندی خوانندگان دارد. با توجه به عدد 525/0 نیز می‌توان به این نتیجه رسید که این رابطه مثبت است و با بالا رفتن رتبه شاخصدامنه - همگرایی مدرک (یعنی خواناتر شدن متن از نظر محتوایی)، متن به نظر خواننده ساده‌تر می‌آید.

با توجه به نتایج حاصل از بررسی می‌توان این‌گونه جمع‌بندی نمود که از میان سه شاخص مورد بررسی، هیچ یک به تنهایی نمی‌تواند به بهترین وجه منعکس‌کنندة نظرهای خوانندگان متون باشد. این درحالی است که شاخص فلش - دیانی یک شاخص سنجش خوانایی سنتی بوده و عملاً تمرکزی بر تخصصی بودن یا نبودن متون ندارد. بنابراین، نمی‌تواند به تنهایی منعکس‌کنندة درجه سختی یا سادگی یک متن تخصصی باشد. مخاطبان یک متن تخصصی (ساده یا دشوار) در نهایت به درجه‌ای از توانایی مطالعه رسیده‌اند که معمولاً شاخصهای سنجش خوانایی سنتی که تنها بر سطح اول تحلیل زبانی یعنی تحلیل واژگانی تمرکز دارند، نمی‌توانند آینة تمام‌نمایی برای تعیین درجه دشواری و یا سادگی یک متن تخصصی برای آنها باشند. تاکنون مطالعه‌ای در این زمینه در ایران صورت نگرفته است، اما مطالعات خارجی مانند مطالعات «فنگ» (Feng 2010)، «تامین» ( (Ta –min 2006، «سی و کالان» ((Si & Callan 2001 و «کالینز تامسون و کالان» (Collins-Thompson & Callan 2001) و بسیاری دیگر نتایج مشابهی را گزارش می‌کنند. شاید به همین دلیل «بنی اقبال، بزرگی و رمضانی» (1390) در پژوهش خود تفاوت معناداری میان چکیده‌های ساختار یافته و نایافته برمبنای شاخص فلش - دیانی مشاهده نکردند. این بدان معناست که در زبان فارسی نیز نمی‌توان تنها با اتکا به شاخصهای سنتی به رتبه‌بندی خوانایی متون تخصصی پرداخت. این در حالی است که نتایج به وضوح نشانگر آن است که شاخص ترکیبی دامنه – همگرایی مدرک که هم به تعداد و عمق واژگان تخصصی توجه دارد و هم به قدرت رابطه میان این واژگان و میزان انسجام و وابستگی آنها، شاخص بهتری در تشخیص درجه دشواری متون تخصصی است. این یافته با یافته‌های «یان، سونگ و لی» (Yan , Song & Li 2006) هماهنگی دارد. بنابراین، می‌توان پس از محاسبة درجه دشواری هر متن بر مبنای این شاخص ترکیبی، گزینة دیگری با عنوان مرتب سازی بر مبنای سطح دشواری مدرک را به صفحه رابط کاربری نتایج جستجو افزود.

خوانندگان در پاسخ به پرسش باز مطرح در زمینة عوامل اثرگذار بر دشواری یک متن تخصصی، به نکات جالب توجهی اشاره کردند. از جمله این موارد، بحث استفاده از واژگان تخصصی به صورتهای مختلف در متون تخصصی است. اکثر این واژگان تخصصی از زبانهای خارجی(بویژه انگلیسی) وارد زبان فارسی شده و به واسطة تحول سریع در رشته، فرصت معادل‌سازی مناسب برای آنها وجود نداشته است؛ ویا گاه به واسطه سرعت شیوع استفاده از یک فناوری در سطح جامعه و کاربرد وسیع واژه خارجی توسط کاربران، استفاده از واژه معادل سازی شده در یک متن از دید خوانندگان آن، به افزایش پیچیدگی آن متن منجر گشته است. یکی دیگر از مشکلات مورد توجه خوانندگان، استفاده از آوانگاری واژگان خارجی است. همین تبدیل از یک فرم نگارشی به فرم آوانگاری برای برخی از خوانندگان به دشوار شدن یک متن می‌انجامد.

با نگاهی به پاسخها، گرایش خوانندگان عادی متون تخصصی در حوزة علوم رایانه یا به استفاده از عین کلمات به انگلیسی با همان حروف انگلیسی و یا استفاده از برابر نهادهای فارسی بوده و استقبال از عین کلمه به صورت آوانگاری شده در بین خوانندگان بسیار کم بود. به عنوان نمونه، یکی از خوانندگان چنین استدلال می‌کند: «استفاده از واژگان انگلیسی با همان حروف بدون تغییر، باعث می‌شود هنگام کار عملی با کلمه‌ها آشنا بوده و کاربر دچار سردرگمی نشود». خواننده دیگری در همین رابطه بیان می‌دارد: «هر علم، واژگان مختص به خود را دارد که بالطبع اولین زبانی که علم در آن قرار دارد، باید مرجع قرار گیرد».

از این یافته‌ها می‌توان در دسته‌بندیهای ثانویه به منظور تشخیص درجه دشواری یک متن برای خوانندگان عادی براساس نوع واژگان به کار رفته در متن استفاده کرد. اما به نظر می‌رسد ارائه نظر قطعی در این زمینه، به بررسیهای بیشتر به منظور رسیدن به قواعدی مستدل وابسته است.

بحث و نتیجهگیری

با نگاهی به یافته‌های این پژوهش در پیوند با پرسشهای اول و دوم، می‌توان به این نتیجه رسید که امکان استفاده از شاخصهای پیش‌گفته در متون فارسی وجود دارد. در پیوند با شاخص فلش، دیانی (1379) سالها پیش امکان استفاده از این شاخص را در صورت مناسب سازی شده برای ویژگیهای زبان فارسی به اثبات رسانده بود. به همین دلیل، شاخص مناسب‌سازی شدة فلش - دیانی را می‌توان بدون هیچ مشکلی در مورد نوشتارهای فارسی عمومی به کار برد. این در حالی است که بر اساس بررسیهای انجام شده، استفاده از دو شاخص «دامنه» و «همگرایی مدرک»، امکان‌پذیر است و با توجه به آنچه در پیوند با پرسش دوم مطرح گردید، قابلیت ادغام دو شاخص دامنه و همگرایی مدرک در قالب یک شاخص ترکیبی فراهم است.

در مرحلة دوم پژوهش، رتبه‌بندی خوانندگان عادی با رتبه‌بندی انجام شده برمبنای شاخصهای مورد نظر مقایسه گردید. نتایج این مقایسه حاکی از آن است که تنها میان رتبه‌بندی خوانندگان عادی با رتبه‌بندی حاصل از شاخص ترکیبی دامنه - همگرایی مدرک، رابطه‌ای معنادار وجود دارد. از آنجا که شاخص دامنة مدرک بر تعداد و عمق واژگان تخصصی تمرکز دارد و شاخص همگرایی مدرک بر روابط مفهومی میان این واژگان و طول این روابط متمرکز است، چنین می‌توان برداشت کرد که صرف تعداد و عمق واژگان تخصصی و یا صرف نزدیکی روابط میان اصطلاحات تخصصی، هیچ یک به تنهایی نمی‌تواند به عنوان شاخص اصلی رتبه‌بندی برای تعیین سطح مخاطبان یک مدرک، ملاک عمل قرار گیرند. این در حالی است که شاخص ترکیبی دامنه - همگرایی مدرک که ناظر به هر دو زمینة عمق واژگان و روابط میان آنهاست، به مراتب به رتبه‌بندی خوانندگان عادی نزدیکتر است. از سوی دیگر، مشابه با پژوهشهای انجام شده در خارج از ایران، نتایج این پژوهش نیز حاکی از آن است که نمی‌توان تنها به شاخص سنتی فلش - دیانی برای رتبه‌بندی مدارک استناد کرد. البته، همان‌گونه که پیشتر نیز بیان شد، این یافته ناقض کارایی فرمول پیش گفته در سنجش خوانایی نوشته‌های فارسی بدون در نظر گرفتن تخصص موضوعی نیست. نکته‌ای که باید بر آن تأکید کرد، آن است که وقتی بحث خوانایی متون تخصصی مطرح می‌گردد، مفهوم بودن متن برای خوانندة آن بیش از آنکه متوجه شاخصهای مبتنی بر ویژگیهای واژگانی و نحوی باشد، متوجه ویژگیهای محتوایی است.

بنابراین، با توجه به یافته‌های این پژوهش می‌توان گفت نه تنها امکان استفاده از شاخص ترکیبی دامنه - همگرایی مدرک برای بازآرایی نتایج براساس درجه دشواری وجود دارد، بلکه رتبه‌بندی نتایج بازیابی شده بر اساس این شاخص، با نظر خوانندگان بالقوه هماهنگی بیشتری دارد. این ویژگی بخصوص در مواردی که مدارک بازیابی شده از نظر ربط در مرتبة یکسانی است، کاربرد می‌یابد، زیرا کاربر در مواجهه با مدارکی که از نظر ربط مشابه هستند، می‌تواند مدارکی را انتخاب کند که از نظر سطح تخصصی، مناسب با توان علمی وی باشد. مسلماً چنین راهبردی کمک شایانی به متخصصان نیز خواهد کرد، زیرا آنها نیز در انتخاب خود می‌توانند مدارکی را انتخاب و ذخیره کنند که در سطح تخصص آنها باشد. در چنین شرایطی، در زمان اختصاص یافته از سوی متخصصان نیز صرفه جویی خواهد شد.[1]. Lexile Measure.

[2]. Your Summer Reading Program Helps Stop Summer Reading Loss [Email] Posted through oclc@oclc.org List-serve.

[3]. Concept-based Readability Measures.

[4]. Domai8n-Specific Information Retrieval.

[5]. Heuristic Readability Measures.

[6]. Flesch- Kincaid.

[7]. Gunning.

[8]. Dale-Chall.

[9]. Supervised Learning Approaches.

[10]. Domain-Specific Readability Measures.

[11] .Wordlist based Approaches.

[12] .Ontology based Approaches.

[13].  این پایگاه صرفاً به عنوان یک بستر برای انجام این بررسی انتخاب شده و امکان انجام چنین بررسی روی هر پایگاه دیگری وجود دارد.

[15]. .Rule of Thumb.

[16]. Tukey.

[17].  پیش از انجام قطعی این کار و استفاده از آزمون رگرسیون، می‌توان از نمودار توزیع نرمال خطاها استفاده کرد تا بررسی شود که آیا خطاها توزیع نرمالی دارند یا خیر. در این پژوهش، با توجه به نزدیک بودن خط توزیع نرمال خطاها به توزیع واقعی خطاهای استاندارد (نمودار هیستوگرام) و همچنین ناچیز بودن مقدار میانگین می‌توان به این نتیجه رسید که توزیع خطاها نرمال است. به منظور جلوگیری از طولانی شدن نوشتار، از آوردن این نمودار در متن مقاله خودداری شده است.

[18].  به منظور انتخاب از بین یکی از سه نمونه 100 کلمه‌ای، برای ارائه به خوانندگان جهت رتبه‌بندی، با بررسی آماری داده‌ها، گروهی که پراکندگی در آنها بیشتر بود، به منزلة نمونه انتخاب گردید. هدف از این انتخاب آن بود که شانس وجود رابطه اتفاقی میان رتبه‌بندی حاصل از شاخصها و رتبه‌بندی خوانندگان به حداقل رسیده و وجود رابطه نشان از قطعیت بیشتر پاسخ باشد.

[19].  این جدول حاصل ادغام 4 جدول از خروجی‌های نرم افزار SPSS است.

-   بنی‌اقبال، ناهید؛ اشرف‏السادات بزرگی و ابوذر رمضانی (1390). بررسی چکیده‌های موجود درفصلنامه کتابداری کتابخانه و مرکز اسناد دانشگاه تهران براساس الگوی چکیده ساختاریافته. فصلنامه دانش‌شناسی (علوم کتابداری و اطلاع‌رسانی و فناوری اطلاعات)، جلد 3 (12): 1 – 15.
-      دیانی، محمدحسین (1369). معیاری برای سطح خوانایی نوشته‌های فارسی. مجله علوم اجتماعی و انسانی دانشگاه شیراز. شماره 2.
-      ــــــــــ (1379). سنجش خوانایی نوشته‌های فارسی. مشهد: کتابخانه رایانه‌ای.
-      ــــــــــ (1382). گلوگاه‌های پژوهش در علوم اجتماعی. مشهد: کتابخانه رایانه‌ای.
-      شعاری‌نژاد، علی‌اکبر  (1374). ادبیات کودکان. تهران: اطلاعات.
-   طابوسیان، جلیله و سودابه عسکریان (1374). ارزشیابی کتب ادبیات فارسی دوره راهنمایی تحصیلی از نظر سطح خوانایی متن بر اساس فرمول فلش. پایان‌نامه کارشناسی، دانشگاه پیام نور، اهواز.
-      غروی، مهدی (1344). نویسندگی برای نوسوادان. مجله آموزش و پرورش (تعلیم و تربیت). شماره 355: 38 – 49.
-   فضل‌اللهی، سیف‌الله و منصوره ملکی‏توانا (1389). روش‌شناسی تحلیل محتوا با تاکید بر تکنیک‌های خوانایی سنجی و تعیین ضریب درگیری متون. پژوهش، جلد 2(1): 71 – 94.
-      کچرشاوی، مجیده (1374). ارزشیابی کتابهای علوم اجتماعی دوره ابتدایی و راهنمایی بر اساس سطح خوانایی متن. پایان‌نامه کارشناسی، دانشگاه پیام نور، اهواز.
-      مفتون، پرویز و مهتا دقیق (1380). معیار تعیین میزان خوانایی ترجمه‌های فارسی متون انگلیسی. پژوهشنامه علوم انسانی، شماره 29: 61 – 79.
-   یارمحمدی، مجتبی (1371). تحقیقی پیرامون سطح خوانایی متون فارسی بر اساس فرمول پیشنهادی دکتر محمدحسین دیانی. تهران: گروه تحقیق و ارزیابی مدیریت آموزش مداوم.
-         Armbruster, B. & T. Anderson. (1981). Content Area Textbooks (Reading Education Report No. 23). Urbana, IL: Center for the Study of Reading.
-         Borst, A. et.al. (2008). Lexically Based Distinction of Readability Levels of Health Documents, Acta Informatica Medica 16(2): 72 - 75.
-         Collins-Thompson, K. & J. Callan. (2004). A language modeling approach to predicting reading difficulty. In Proceedings of the Human Language Technology Conference of the North American Chapter of the Association for Computational Linguistics (HLT-NAACL 2004).
-         Crawford, A. N. (1984). A Spanish Language Fry-Type Readability Procedure: Elementary Level (Vol. 7 No. 3). Los Angeles: California State University, Evaluation, Dissemination and Assessment Center.
-         Feng, L. (2010). Automatic Readability Assessment. NewYork: City University of New York.
-         Gray, W & B. Leary. (1935). What Makes a Book Readable? Chicago: Chicago Press.
-         Heilman, M. etal. (2007). Combining Lexical and Grammatical Features to Improve Readability Measures for First and Second Language Texts. In Human Language Technologies 2007: The Conference of the North American Chapter of the Association for Computational Linguistics.
-         Kim, H. etal. (2007). Beyond Surface Characteristics: A New Health Text- Specific Readability Measurement. In AMIA Annual Symposium Proceedings.
-         Leroy, G.; etal. (2008). A Balanced Approach to Health Information Evaluation: A Vocabulary-Based Naïve-Bayes Classifier and Readability Formulas. Journal of the American for Information Science and Technology, Vol 59(9): 1409 – 1419.
-         Parker, R. I., & J. E. Hasbrouck. (2001). Spanish readability formulas for elementary-level texts: A validation study. Reading and Writing Quarterly, 17, 307-322.
-         Pitler, E. & A. Nenkova. (2008). Revisiting Readability: A Unified Framework for Predicting text Quality. In EMNLP, P. 186 – 195.
-         Schwarm, S. & M. Ostendorf. (2005). Reading Level Assessment Using Support Vector Machines and Statistical Language Models. In ACL's 05. P. 523 – 530.
-         Si, L. & J. Callan. (2001). A Statistical Model For Scientific Readability. In Proceedings of the 10th International Conference on Information and Knowledge Management.
-         Ta-Min, R. (2006). Comprehension of Online Cancer Information: A Propositional Assessment of Readability, Inferences, and Coherence. Ontario: University of Waterloo.
-         Vogel, M. & C. Washburne. (1928). An Objective method of Determining Grade Placement of Children's Reading Material. The Elementary School Journal, No. 28: 373 – 381.
-         Yan, X. ; D. Song, & X. Li. (2006). Concept–based Document Readability in Domain Specific Information Retrieval. In CIKM ' 06, P. 540 – 549.
Zhao, J. & M. Kan. (2010). Domain Specific Iterative Readability Computation. In JCDL '010. P. 250 – 214