Document Type : Original Article
Authors
1 Ph.D. Candidate in Knowledge and Information Retrieval, Department of Knowledge and Information Science, Shiraz University, Shiraz, Iran
2 Professor, Department of Knowledge and Information Science, Shiraz University, Shiraz, Iran
3 Assistant Professor, Department of Computer Science and Engineering and Information Technology, Shiraz University, Shiraz, Iran
4 Associate Professor, Department of Knowledge and Information Science, Shiraz University, Shiraz, Iran
5 Associate Professor, Department of Foreign Languages and Linguistics, Shiraz University, Shiraz, Iran. Email
Abstract
Keywords
مقدمه
مقالات علمی عموماً دارای چکیده نویسنده میباشند که هدف، روش، یافتهها و نتیجهگیری نویسنده را به اختصار ارائه میدهد. در این چکیدهها، سهم نویسنده در پیشبرد دانش به صورت عام بیان میشود. به عبارت دیگر، چکیده نویسنده شامل آن دسته از اصالت اثر است که نویسنده آنها را مهم دانسته و در چکیده خود ذکر کرده است. این در حالی است که ممکن است موارد مورد نظر نویسنده، در میان جامعه علمی اهمیت کمتری داشته باشد. بنابراین، چکیده نویسنده در بر دارنده اطلاعاتی در مورد تأثیر مقاله در علم نیست. این اطلاعات تکمیلی را میتوان با رجوع به مقالات استنادکننده به آن مقاله، به دست آورد. مجموعه محتوای استنادها به یک مقاله را در واقع میتوان خلاصهای از آن مقاله دانست که توسط جامعه علمی تولید شده است. این نوع خلاصه، خلاصه استنادی[1] نام دارد (الکیس، شن، فیدر، ارکان، استیتز و رادو[2]، 2008؛ قزوینیان، رادو، محمد، دور، زاجیک، ویدبای و مون[3]،2013؛ کهن، سولدینی[4] و گوهریان، 2014). یک خلاصه استنادی میتواند تأثیر مقاله در جامعه علمی را آشکار سازد، همچنین میتواند دربردارنده مقایسههایی با یافتههای مشابه از مقالات دیگر باشد. به این ترتیب، یک خلاصه استنادی با فراهم آوردن اطلاعات اضافی نسبت به چکیده نویسنده، میتواند بینش عمیقتری راجع به تأثیر آن مقاله در جامعه علمی را فراهم آورد.
یکی از حوزههایی که بهرهگیری از محتوای جملات استنادی را مورد توجه قرار داده است، حوزه بازیابی اطلاعات علمی[5] است. این امر باعث شده است تا در ادبیات خلاصهسازی خودکار متون، نوعی از خلاصهسازی با نام خلاصهسازی استنادمدار[6] پدید آید. این نوع خلاصهسازی از مجموعهای از استنادها به یک مقاله مرجع، برای تولید خلاصه بهره میبرد (قزوینیان و رادو، 2008؛ قزوینیان و همکاران، 2013).
چگونگی انتخاب محتوای مفید جملات استناددهنده برای درج در خلاصه نهایی، از چالشهای مهم پژوهشهای خلاصهسازی خودکار[7] استنادمدار است. از آنجایی که رویکرد معنایی تحلیل بافتارهای استناد[8]، کارکردهای استناددهی[9] را آشکار میکند، میتوان از آن برای پالایش محتوای بافتارها و درج محتوای مهم در خلاصه استفاده کرد. با این وجود، اگر در تحلیل بافتارهای استنادی، از رویکردهایی که اطلاعات بیشتری در اختیار قرار میدهند و به عبارت دیگر، مطالعه زبان را در سطح بالاتر از جمله امکانپذیر میسازند؛ استفاده شود میتوان به پالایش عمیقتر آنها و درج بافتارهای مفیدتر در خلاصههای خودکار نهایی، امیدوارتر بود.
یکی از این رویکردها، تجزیه و تحلیل کلام است. فراگفتمان[10] یکی از مباحث مهم تجزیه و تحلیل کلام میباشد که در واقع حلقه ارتباط بین متن، نویسنده و خواننده است (هایلند و تسه[11]، 2004؛ هایلند، 2005 الف). فراگفتمان به نویسنده یا گوینده این امکان را میدهد که نظرات خود را بیان کند و همچنین با مخاطب به منزله عضوی از یک جامعه خاص ارتباط برقرار نماید (هایلند، 2005 الف). به عبارت دیگر، فراگفتمان بیان این ایده است که ارتباط زبانی فراتر از تبادل صرف اطلاعات و گزارههاست و در حقیقت شامل هویتها، نگرشها و فرضهای طرفین ارتباط است (هایلند، 2005 الف نقل در طارمی و دیگران، 1397). بنا بر آنچه گفته شد، به نظر میرسد که بهرهگیری از آن در پالایش انواع بافتارهای استنادی و استخراج و انتخاب بافتارهای حاوی نقد و نگرش نویسنده استناددهنده راهگشا باشد.
تحلیل فراگفتمان با بهرهگیری از نشانگرهای فراگفتمانی انجام میشود. نشانگرهای فراگفتمان، در واقع صورتهای زبانی هستند که از ابزارهای مهم بلاغی ایجاد و تضمین کننده تعامل در متون محسوب میشوند (طارمی و دیگران، 1397). الگوهای مختلفی برای تحلیل فراگفتمان ارائه شده است. یکی از جامعترین و مشهورترین این الگوها، الگوی هایلند (2005 ب) میباشد. وی، مطالعات گستردهای در ژانر علم انجام داده است و الگوی فراگفتمان خود را مبتنی بر تحلیل نوشتارهای دانشگاهی توسعه داده است (هایلند، 1998؛ هایلند و تسه، 2004؛ هایلند، 2004). پژوهشهای وی، بیانگر این مهم است که متن علمی پدیدهای خنثی، عینی و ایستا نیست بلکه ضمن هدایت دیدگاه خواننده، دنیای ذهنی شامل افکار، تصورات، نگرشها و بعضاً ویژگیهای فردی و اجتماعی نویسنده متن را بازتاب میدهد. لازم به ذکر است که تاکنون، از رویکرد تحلیل فراگفتمان برای خلاصهسازی استنادمدار استفاده نشده است.
با توجه به مطالب گفته شده در بالا، این پژوهش، با هدف تحلیل نظری کاربرد الگوی فراگفتمان هایلند در خلاصهسازی استنادمدار و پیشنهاد یک طرح حاشیهنویسی فراگفتمانمدار برای بافتارهای استنادی که از آن بتوان در خلاصهسازی استنادمدار مبتنی بر پیکره بهره گرفت، درصدد است به پرسشهای زیر پاسخ دهد:
- از منظر نظر، آیا فراگفتمانهای موجود در الگوی هایلند، برای حاشیهنویسی بافتارهای استنادی مورد استفاده در خلاصهسازهای خودکار استنادمدار مناسب میباشد؟
- از منظر نظر، یک طرح حاشیهنویسی فراگفتمانمدار بافتارهای استنادی چگونه است؟
پیشینه پژوهش
مطالعات تویفل و مونس در سال 2002 را میتوان اولین پژوهش خلاصهسازی خودکار ژانر علمی در ادبیات پردازش زبان طبیعی دانست (تویفل و مونس[12]، 2002) اما ریشههای خلاصهسازی خودکار متون علمی را میتوان در ادبیات علم اطلاعات و دانششناسی و مباحث چکیدهنویسی خودکار سالهای دهه پنجاه قرن بیستم جست (لون[13]، 1958؛ باکسندیل[14]، 1958). در واقع، تمایل به خلاصهسازی خودکار متون علمی از زمانی آغاز شد که کتابها و مقالات علمی به صورت دیجیتالی ذخیره شدند. با این وجود، جامعه پژوهشی خلاصهسازی خودکار، از خلاصهسازی مقالات علمی به خلاصهسازی مقالات خبری روی آورد و این روند تا دوباره فعال شدن خلاصهسازی خودکار ژانر علمی در اواخر دهه نود میلادی، همچنان ادامه داشت (یلوگلو، میلیوس و زینکر-هیوود[15]، 2011).
اغلب پژوهشهای خلاصهسازی خودکار در ژانر علمی از روشهای یادگیری ماشینی بهره میبرند. الگوریتمهای خلاصهساز ارائه شده توسط کوپیک، پدرسن و چن[16] (1995)، تویفل و مونس (2002) مبتنی بر یادگیری ماشینی نظارتی و برخی دیگر مانند الگوریتم قزوینیان و رادو (2008 و 2010)، الکیس و همکاران (2008) و ابوجبارا[17] و رادو (2011) بر رویکرد غیرنظارتی بنا نهاده شده اند. الگوریتمهای خلاصهسازی ارائه شده، عموماً تلفیقی از روشهای سطحی و معنایی میباشند. دو استراتژی معنایی مشهور در خلاصهسازهای نظارتی متون علمی عبارتند از: ناحیهبندی استدلالی[18] و مفاهیم هسته[19].
در ناحیهبندی استدلالی، فرض بر این است که گفتمان علمی دربردارنده اظهارنظرهای مختلف درباره سهم پژوهشگران از یک حوزه علمی است. این نوع گفتمان، حاصل یک بازی بلاغی است که سعی دارد جایگاه و سهم پژوهشگران در پیشبرد دانش را ارتقاء دهد. بر این اساس، متون علمی باید ادعاهای دانش را در تقابل با آثار پژوهشی قبلی به وضوح نشان دهند (فیسس، رونزانو و ساگیون[20]، 2015).
از این منظر، الگوی گفتمانی ادعاهای دانش[21] معروف به الگوی سیمون تویفل[22] یا همان ناحیهبندی استدلالی به وجود آمده است (تویفل، 1999؛ تویفل و مونس، 2002؛ تویفل، سیدهارتن و بچلور[23]، 2009). در رویکرد خلاصهسازی مبتنی بر ناحیهبندی استدلالی، وضعیت بلاغی هر جمله به منظور بازنمون بافت گفتمانی جملات استخراج شده تعیین میشود؛ به عبارت دیگر، در این استراتژی، فرآیند استخراج جمله با تحلیل گفتمان ترکیب شده است.
در استراتژی مفاهیم هسته، فرض بر این است که یک مقاله علمی، بازنمونی از یک بررسی علمی قابل خواندن توسط انسان است که با بررسی آن میتوان، به چگونگی مؤلفههای پژوهشی و محل قرارگیری آنها در متن پی برد. بر اساس این استراتژی، جملات مقاله علمی با توجه به مفاهیمی از هستانشناسی[24] بررسیهای علمی، حاشیهنویسی میشوند. این نوع هستانشناسی، مجموعه مفاهیم لازم برای توصیف یک بررسی علمی را در بر دارد.
استراتژی مفاهیم هسته، برای طبقهبندیهای محتوامدار یک بررسی علمی و استراتژی ناحیهبندی بلاغی، برای طبقهبندیهای مبتنی بر ادعاهای دانش با رویکرد استنادی مفید میباشد (فیسس، رونزانو و ساگیون، 2015؛ لیاکاتا[25]، تویفل، سیدهارتان و بچلور، 2010).
در هر دو استراتژی، بعد از تحلیل متن (تعیین ناحیه استدلالی و یا استخراج مفاهیم هسته)، میتوان برای طبقهبندی و انتخاب جملات مهم به منظور درج در خلاصه نهایی اقدام نمود. لازم به ذکر است که استراتژیهای موجود منجر به ظهور طرحهای حاشیهنویسی[26] مبتنی بر تحلیل معنایی در سطح کلمه، جمله و بعضاً در سطح گفتمان علمی شده اند[27] (تویفل، سیدهارتان و تیدهار[28]، 2006؛ یورگنس، کومار، هوور، مکفارلند و جورافسکی[29]، 2016؛ هرناندز- آلوارز و گومز[30]، 2016).
مرور پیشینه پژوهش نشان داد که تاکنون پژوهشی که از الگوهای فراگفتمانی موجود برای ارائه طرحهای حاشیهنویسی بافتارهای استنادی به هدف استفاده در سامانههای خلاصهساز استنادمدار بهره ببرد، انجام نشده است.
از سوی دیگر، بررسی نوشتارها نشان داد که الگوی فراگفتمانی هایلند، به طور وسیعی از طرف جامعه علمی، پذیرفته شده است (طارمی، تاکی و یوسفیان، 1397). لذا، در این پژوهش به کار گرفته شد. این الگو، پایه نظری این پژوهش را تشکیل میدهد که در ادامه تشریح شده است.
مبانی نظری پژوهش
هایلند، برای نخستین بار، تمام جنبههای مربوط به تعامل میان نویسنده متن و خود متن و همچنین نویسنده متن و خواننده متن را ذیل اصطلاح «فراگفتمان» تعریف و طبقهبندی کرده و ادعا میکند محقق در چارچوب مطالعه مبتنی بر فراگفتمان میتواند از دایره متن و گفتمان فراتر رفته و متن را به مثابه کنشی اجتماعی تحلیل کند (قلی مافیان و کارگر، 1393).
از نظر وی، نویسنده متن، آگاهانه یا ناآگاهانه از ابزارهای مختلف زبانی برای تعامل با خواننده استفاده میکند. هایلند، فراگفتمان تعاملی - هدایتی[31] و فراگفتمان تعاملی - مشارکتی [32] را بیان کرد. فراگفتمان تعاملی - هدایتی با سازماندهی اطلاعات گزارهای به نحوی عمل میکند که متن را منسجم و برای مخاطب متقاعدکننده جلوه دهد. این در حالی است که فراگفتمان تعاملی - مشارکتی، برای نشاندادن چشمانداز نویسنده نسبت به اطلاعات گزارهای و خواننده به کار میرود (هایلند، 2005 الف نقل در طارمی و دیگران، 1397).
هایلند (2005 ب) در الگوی خود، 10 نشانگر فراگفتمانی را ارائه مینماید که پنج نشانگر مربوط به فراگفتمان تعاملی- هدایتی و پنج نشانگر به فراگفتمان تعاملی- مشارکتی مرتبط هستند. نشانگرهای فراگفتمانی تعاملی - هدایتی عبارتند از: گذارها[33]، قالبنماها[34]، ارجاعات[35] درون متنی[36]، استنادها[37] و ابهامزداها[38]. نشانگرهای فراگفتمان تعاملی- مشارکتی عبارتند از: تردیدنما[39]، یقیننما[40]، نگرشنما[41]، خود اظهار[42] و دخیلساز[43]. جدول 1 توضیح هر یک از نشانگرها را به همراه مثال نشان میدهد.
جدول 1. طبقهبندی نشانههای فراگفتمانی هایلند (هایلند، 2005الف)
نشانه |
کاربرد |
مثال |
تعاملی - هدایتی |
راهنمایی خواننده در متن |
منابع[44] |
گذارها |
روابط بین جملهوارههای اصلی[45] را بیان میکنند. |
in addition; but; thus; and |
قالب نماها |
به مراحل، توالیها و «اعمال گفتمانی»[46] اشاره میکنند. |
finally; to conclude; my purpose is |
ارجاعات درون متنی |
به اطلاعات ارائه شده در قسمتهای دیگر متن اشاره میکنند. |
noted above; see Fig; in section 2 |
استنادها (شواهد) |
به اطلاعات ارائه شده در متون دیگر اشاره میکنند. |
according to X; Z states |
ابهام زداها |
معانی محتوای گزارهای را با دقت شرح میدهند[47]. |
namely; e.g.; such as; in other words |
تعاملی - مشارکتی |
به مشارکت طلبیدن خواننده در متن |
منابع |
تردیدنماها |
عبارتهای احتیاطی هستند که از هرگونه التزام خودداری میکنند و گفتگو را باز میکنند. |
might; perhaps; possible; about |
یقیننماها |
عبارتهای تأکیدی هستند که قطعیت و یقین نویسنده را نسبت به تحقق امری بازتاب میدهند و گفتگو را میبندند. |
in fact; definitely; it is clear that |
نگرشنماها |
دیدگاه و نگرش نویسنده را در خصوص یک پدیده بیان میکنند و نیز بیان کننده شگفتی، اجبار، موافقت؛ اهمیت و غیره است. |
unfortunately; I agree; surprisingly |
خود اظهارها |
نویسنده با استفاده از ضمایر شخصی و ملکی در گفتمان، به طور صریح به خودش ارجاع میدهد. |
I; we; my; me; our |
دخیلسازها |
برای ارتباط نویسنده با مخاطب و به عبارتی مشارکت جویی نویسنده از طریق جلب توجه آنها به موضوع مورد بحث یا شرکت دادن آنها در گفتمان از طریق ضمایر دوم شخص، پارهگفتهای امری، پرسش و غیره کاربرد دارد. |
consider; note; you can see that |
روش پژوهش
در این پژوهش، از روش کتابخانهای استفاده شده است. پژوهشگر با استفاده از جستجوی اینترنتی به متون مربوط به الگوی فراگفتمان هایلند، خلاصهسازی خودکار متون علمی، تحلیل بافتارهای استناد و طبقهبندی کارکردهای استناددهی دست یافت. سپس، با مطالعه منابع، به تحلیل کاربرد الگوی فراگفتمان هایلند در خلاصهسازی خودکار پرداخت و یک طرح حاشیهنویسی فراگفتمانمدار برای بافتارهای استنادی پیشنهاد داد. این طرح، در طی دو مرحله تحلیل ارائه گردید. ابتدا بر اساس طرحهای موجود، طرح اولیهای ایجاد شد. سپس، نسخه فراگفتمانمدار طرح بر اساس الگوی هایلند ارائه گردید. لازم به ذکر است که به منظور اعتباریابی، طرح حاشیهنویسی پیشنهاد شده در اختیار متخصصان شامل 3 نفر متخصص حوزه علم اطلاعات و 2 نفر متخصص حوزه زبانشناسی قرار گرفت.
یافتههای پژوهش
از منظر نظر، آیا فراگفتمانهای موجود در الگوی هایلند، برای حاشیهنویسی بافتارهای استنادی مورد استفاده در خلاصهسازهای خودکار استنادمدار مناسب هستند؟
فراگفتمان تعاملی- هدایتی هایلند (2005 ب)، به آگاهی نویسنده از مخاطب، روشهایی برای قرار دادن دانش، علاقهمندیها، عبارات بلاغی در متن و تواناییهای پردازش نویسنده مربوط است. هدف نویسنده در این بعد، شکل دادن به متن به صورتی است که نیازهای خوانندگان خاص برآورده گردد. علاوه بر این، نویسنده در این بعد تلاش میکند، استدلالات خود را طوری سازماندهی نماید تا خواننده بتواند آسانتر، متن را دنبال کند (هایلند، 2005 الف. نقل در طارمی و دیگران، 1397). بنابراین، به کارگیری منابع زبانی فراگفتاری در این بعد، بیشتر به منظور سازماندهی گفتمان است و حد و اندازهای که متن، بر اساس نیازهای خوانندگان موجود در ذهن نویسنده ساخته شده است را آشکار میکند. به عبارت دیگر، این نوع فراگفتمان، با به کارگیری مجموعهای از امکانات زبانی مانند گذارها، چارچوبسازها و غیره، به نویسنده یا گوینده این امکان را میدهد که اطلاعات گزارهای را مدیریت کند؛ بنابراین، به نظر نمیرسد که این نوع از فراگفتمان را بتوان برای تحلیل و پالایش بافتارهای استنادی به کار برد و لازم است از مؤلفههایی که میتوانند بینش عمیقتری از محتوای بافتارها را ارائه کنند، استفاده کرد.
فراگفتمان تعاملی - مشارکتی هایلند (2005 ب) به روشهایی مربوط است که نویسندگان از طریق اظهارنظر بر پیامشان سعی به برقراری تعامل دارند. در این بعد، هدف نویسنده بیان کردن آشکار دیدگاههایش و به مشارکت طلبیدن خوانندگان از طریق اجازه دادن به آنها برای پاسخدهی به متن است. فراگفتار تعاملی- مشارکتی، اساساً ارزشگذارانه و مشارکتطلبانه است و در تلاش است همکاری نویسنده و خواننده را نشان دهد و اعتراضات را پیشبینی نماید. این بعد آشکار میکند که تا چه حد، نویسنده تلاش کرده است تا متن را با به مشارکت طلبیدن خوانندگان، بسازد (هایلند، 2005 الف). به عبارت دیگر، فراگفتمان تعاملی- مشارکتی هایلند (2005 ب)، برای نشان دادن چشمانداز نویسنده نسبت به اطلاعات گزارهای و خواننده به کار میرود. در این نوع فراگفتمان، نویسنده یا گوینده از ابزارهای زبانی مانند یقیننماها، تردیدنماها و غیره به منظور ابراز نگرش خود و جلب مشارکت خواننده استفاده میکند. از آنجایی که نقش این ابزارهای زبانی در ژانر نقد مهمتر هستند (قلی مافیان و کارگر، 1393)، بهکارگیری فراگفتمان تعاملی - مشارکتی برای ایجاد پیکرههای حاشیهنویسی شده بافتارهای استنادی مناسبتر مینماید؛ زیرا به کمک این ابزارها میتوان به درک عمیقتر بافتارهای استنادی دربردارنده محتوای نقد و تحلیل ادعاهای دانش امیدوارتر بود.
از منظر نظر، یک طرح حاشیهنویسی فراگفتمانمدار بافتارهای استنادی چگونه است؟
مرور نوشتارها نشان داد که طرحهای حاشیهنویسی موجود متون علمی، عموماً از روشهای معنایی و گفتمانی بهره میبرند که عمدتاً مبتنی بر نظریه ساختار بلاغی[48] متن میباشند. از آنجایی که پژوهشگران درصدد به کارگیری رویکرد فراگفتمان در خلاصهسازی خودکار استنادمدار هستند، لازم است طرحی برای حاشیهنویسی فراگفتمانمدار بافتارهای استنادی ارائه نمایند. همان طور که در روششناسی گفته شد، این طرح طی دو مرحله تحلیل پیشنهاد شد. در ادامه، این دو مرحله تشریح شده اند.
مرحله 1: شکلگیری طرح حاشیهنویسی اولیه
بررسی متون منتشر شده نشان داد که سیاهههای متنوعی از دلایل و انگیزههای استناددهی وکارکردهای آن توسط پژوهشگران پیشنهاد شده است که اشتراکاتی نیز با یکدیگر دارند. یکی از جامعترین سیاهههای انگیزههای استناددهی توسط گارفیلد[49] (1965) ارائه شده است.
از طرف دیگر، مطالعه ادبیات تحلیل بافتار استناد نشان داد که حاشیهنویسی مجموعه دادهها، یکی از روشهای تحلیل بافتار استناد میباشد (تویفل، 1999؛ تویفل، 2010؛ اطهر[50]، 2014؛ هرناندز- آلوارز و گومز، 2016). بهرهگیری از این روش، منجر به ایجاد طرحهای حاشیهنویسی کارکردهای استناد شده است اما هیچ کدام از آنها فراگفتمانمدار نیستند. لازم به ذکر است که در طبقهبندی کارکردهای استنادی از دستهبندیها و طرحهای گوناگونی استفاده شده است و توافق جمعی بر روی یک طرح طبقهبندی واحد وجود ندارد؛ مثلاً، تویفل (1999) کارکردهای استنادی را در هفت دسته اطلاعات زمینهای، مالکیت[51]، هدف، متنی، تضاد، پایه و سایر قرار داد، حال آن که لیاکاتا، ساها[52]، دوبنیک[53]، بچلور و ربولز- شومان[54] (2012) طرح ردهبندی کارکرد استنادی خود را با 11 طبقه ارائه دادند که عبارتند از: فرضیه، انگیزه، رسالت، هدف، پیشینه، روش، آزمایش، مدل، مشاهده، یافته و نتیجه.
با توجه به نظر پژوهشگران و اساتید علمسنجی، مبتنی بر جامعتر بودن الگوی انگیزههای استناددهی گارفیلد (1965) نسبت به دیگر الگوهای موجود، سیاهه وی، مبنای طرح اولیه حاشیهنویسی قرار گرفت. لازم به ذکر است که آن دسته از دلایل استناددهی گارفیلد (1965) که به نظر میرسد با تحلیل محتوای گفتمانی بافتار استناد قابل شناسایی باشند، به عنوان پایهای برای ایجاد طرح حاشیهنویسی در نظر گرفته شدند؛ زیرا درک تعدادی از انگیزههای استناددهی ارائه شده در الگوی گارفیلد، بسیار ذهنی هستند و به تحلیل نویسنده و مصاحبه با وی نیاز دارند. انگیزههایی مانند «ادای احترام و قدرشناسی نسبت به متقدمان»، «فراهمآوردن راهنمایی از آثار دیگران» و «شناسایی انتشارات بنیادی درباره مفهومی خاص» از این نوع هستند. از آنجایی که هدف، ارائه طرحی برای حاشیهنویسی متن میباشد؛ انگیزههایی که به تحلیل نویسنده نیاز دارند، لحاظ نشدند. بدین منظور، با اساتید علمسنجی نیز مشورت شد و موارد انتخابی را تأیید کردند. نهایتاً، 9 مورد از انگیزههای استناددهی گارفیلد برای ایجاد طرح اولیه مورد توجه قرار گرفت. این 9 مورد عبارتند از:
معرفی روش و ابزارهای علمی مورد استفاده، فراهمآوری زمینه برای مطالعه بیشتر، تصحیح اثر خود، تصحیح آثار دیگران، نقد آثار دیگران، اثبات یک ادعا، آگاه کردن محققان از آثار نشریافته و یا در حال انتشار، رد اثر یا اندیشه منتسب به دیگران و رد ادعاهای حق تقدم در آثار دیگران.
از طرف دیگر، با توجه به این که طرحهای موجود طبقهبندی کارکردهای استناد و نوع آنها، اشتراکاتی با یکدیگر دارند، این اشتراکات در طرحریزی اولیه، در نظر گرفته شد. جدول 2، طرح اولیه حاشیهنویسی بافتارهای استنادی را نشان میدهد. این طرح شامل 15 طبقه است. طبقات، برآیندی از مرور طرحهای موجود و اعمال تحلیلهای نظری گفته شده در بالا میباشند. برای هر طبقه نیز نامی قراردادی تخصیص داده شد.
جدول 2. طرح حاشیهنویسی اولیه
توضیحات برچسب |
نامبرچسب |
اطلاعات زمینهای |
BKG |
مرور پیشینه (آگاه کردن محققان از آثار نشر یافته یا در حال انتشار، بیان نقاط قوت یا ضعف اثر مورد استناد/ ارزیابی اثر در بخش پیشینه پژوهش) |
LIT-REW |
بیان مسئله پژوهش و اهمیت آن (شکاف دانشی و اهمیت و ضرورت بررسی آن) |
PBM |
نویسنده به قصد ادامه و گسترش نتایج پژوهش قبلی خودش استناد داده است. |
CONTI |
نویسنده به قصد توسعه دادهها، روشها و رویکردهای دیگران استناد داده است. |
EXTEN |
بیان پژوهشهای آینده |
FUT |
تحلیل یافتهها |
RSL-ANL |
مقایسه نتایج پژوهشی - ارائه شواهد همسو |
CON-COMP-SUP |
مقایسه نتایج پژوهشی - غیرهمسو بودن نتایج: مغایرتها و تناقضها |
CON-COMP- DFF |
معرفی روش و ابزارهای علمی مورد استفاده، توجیه چرایی انتخاب جامعه آماری و دیگر مباحث روششناسی پژوهش |
MTH |
تصحیح اثر خود |
OWN-CRR |
تصحیح آثار دیگران |
OTHER-CRR |
اثبات یک ادعا |
PROV-CLM |
رد اثر یا اندیشه منتسب به دیگران |
OTHER-REJ |
رد ادعاهای حق تقدم در آثار دیگران |
PRIOR-REJ |
مرحله 2: شکلگیری طرح حاشیهنویسی فراگفتمانمدار
در مرحله بعد، به منظور ارائه نسخه فراگفتمانمدار طرح حاشیهنویسی بافتارهای استنادی، لازم بود با توجه به تعاریف مفهومی ارائه شده از دو نوع فراگفتمان ارائه شده در الگوی هایلند، مؤلفههای مناسب به طرح اضافه گردد و سپس، طبقات بر اساس آنها بازنگری شوند.
بدین ترتیب، مؤلفههای فراگفتمان تعاملی - مشارکتی هایلند (2005 ب) در طرح پیشنهادی حاشیهنویسی فراگفتمانمدار بافتارهای استنادی لحاظ شد. طرح پیشنهادی شامل 70 طبقه میباشد. نگاه کنید به جدول 3.
تحلیل فراگفتمان مبتنی بر نشانگرهای تردیدنما، یقیننما، نگرشنما و دخیلساز بینشی از احتیاطی، تأکیدی، نگرشی و مشارکتجویانه بودن گفتمان را آشکار میسازند (خانی و چنگیزی، 1392). لذا، این الفاظ در نامگذاری طبقات به کار گرفته شد.
از آنجایی که به نظر میرسد در بافتارهای استناد، حضور خود اظهارها نشانهای برای شناسایی خوداستنادیها باشد، در طرحریزی طبقات مورد توجه قرار گرفتند. لازم به ذکر است که طبقه «ادامه و گسترش نتایج پژوهش قبلی نویسنده» ذاتاً خوداستنادی است و در همان مرحله اول تحلیل، یعنی تحلیل محتوای گزارهای متن، آشکار میشود. این در حالی است که ماهیت فراگفتمانی آن را میتوان، با دیگر ابزارهای فراگفتمان تعاملی - مشارکتی مانند تردیدنماها و غیره معلوم نمود که در طرحریزی مود توجه قرارگرفت.
از سوی دیگر، بافتارهای استنادی که با انگیزههای استنادی «تصحیح اثر دیگران»، «رد اندیشه منتسب به دیگران» و «رد ادعاهای حق تقدم در آثار دیگران» ایجاد شده اند، شامل خوداستنادی نمیباشند؛ زیرا نویسنده به دیگران استناد داده است تا به آن وسیله، اثر دیگری را تصحیح کند یا اندیشه و ادعای او را رد نماید. لذا، خوداستنادی برای این گونه بافتارها لحاظ نشد.
جدول3. طرح حاشیهنویسی فراگفتمانمدار بافتارهای استنادی
توضیحات برچسب |
نامبرچسب |
|
اطلاعات زمینهای – احتیاطی |
BKG-HDG |
|
اطلاعات زمینهای – تأکیدی |
BKG-BOS |
|
اطلاعات زمینهای – نگرشی |
BKG-ATT |
|
اطلاعات زمینهای – خوداستنادی |
BKG-SLF |
|
اطلاعات زمینهای – مشارکتجویانه |
BKG-ENG |
|
مرور پیشینه- احتیاطی |
LIT-REW-HDG |
|
مرور پیشینه- تأکیدی |
LIT- REW –BOS |
|
مرور پیشینه- نگرشی |
LIT- REW –ATT |
|
مرور پیشینه- خوداستنادی |
LIT- REW –SLF |
|
مرور پیشینه – مشارکتجویانه |
LIT- REW –ENG |
|
بیان مسئله نگرشی |
PBM-ATT |
|
بیان مسئله تأکیدی |
PBM-BOS |
|
بیان مسئله با خوداستنادی |
PBM-SLF |
|
بیان مسئله احتیاطی |
PBM-HDG |
|
بیان مسئله مشارکتجویانه |
PBM-ENG |
|
ادامه و گسترش نتایج پژوهش قبلی نویسنده (خوداستنادی) – احتیاطی |
CONTI-HDG |
|
ادامه و گسترش نتایج پژوهش قبلی نویسنده (خوداستنادی) – تأکیدی |
CONTI-BOS |
|
ادامه و گسترش نتایج پژوهش قبلی نویسنده (خوداستنادی) – نگرشی |
CONTI-ATT |
|
ادامه و گسترش نتایج پژوهش قبلی نویسنده (خوداستنادی) - مشارکتجویانه |
CONTI-ENG |
|
توسعه دادهها، روشها و رویکردهای دیگر نویسندگان- احتیاطی |
EXTEN-HDG |
|
توسعه دادهها، روشها و رویکردهای دیگر نویسندگان- تأکیدی |
EXTEN-BOS |
|
توسعه دادهها، روشها و رویکردهای دیگر نویسندگان – نگرشی |
EXTEN-ATT |
|
توسعه دادهها، روشها و رویکردهای دیگر نویسندگان – مشارکتجویانه |
EXTEN-ENG |
|
بیان پژوهشهای آینده – تاکیدی |
FUT-BOS |
|
بیان پژوهشهای آینده- احتیاطی |
FUT-HDG |
|
بیان پژوهشهای آینده- خوداستنادی |
FUT-SLF |
|
بیان پژوهشهای آینده- نگرشی |
FUT-ATT |
|
بیان پژوهشهای آینده- مشارکتجویانه |
FUT-ENG |
|
تحلیل یافتهها – مشارکتجویانه |
RSL-ANL-ENG |
|
تحلیل یافتهها – نگرشی |
RSL-ANL-ATT |
|
تحلیل یافتهها – تأکیدی |
RSL-ANL-BOS |
|
تحلیل یافتهها – احتیاطی |
RSL-ANL-HDG |
|
تحلیل یافتهها – خوداستنادی |
RSL-ANL-SLF |
|
مقایسه نتایج پژوهشی- ارائه شواهد همسوی مشارکتجویانه |
CON-COMP-SUP-ENG |
|
مقایسه نتایج پژوهشی- ارائه شواهد همسوی تأکیدی |
CON-COMP-SUP-BOS |
|
مقایسه نتایج پژوهشی- ارائه شواهد همسوی احتیاطی |
CON-COMP-SUP-HDG |
|
مقایسه نتایج پژوهشی- ارائه شواهد همسو باخود استنادی |
CON-COMP-SUP-SLF |
|
مقایسه نتایج پژوهشی- ارائه شواهد همسوی نگرشی |
CON-COMP-SUP-ATT |
|
مقایسه نتایج پژوهشی- ارائه شواهد غیرهمسوی مشارکتجویانه |
CON-COMP- DFF –ENG |
|
مقایسه نتایج پژوهشی- ارائه شواهد غیرهمسوی تأکیدی |
CON-COMP- DFF –BOS |
|
مقایسه نتایج پژوهشی- ارائه شواهد غیرهمسوی احتیاطی |
CON-COMP- DFF –HDG |
|
مقایسه نتایج پژوهشی- ارائه شواهد غیرهمسوی نگرشی |
CON-COMP- DFF –ATT |
|
مقایسه نتایج پژوهشی- ارائه شواهد غیرهمسو با خود استنادی |
CON-COMP-DFF-SLF |
|
معرفی روش و ابزارهای علمی مورد استفاده - احتیاطی |
MTH-INT-HDG |
|
معرفی روش و ابزارهای علمی مورد استفاده - تأکیدی |
MTH-INT-BOS |
|
معرفی روش و ابزارهای علمی مورد استفاده - نگرشی |
MTH-INT-ATT |
|
معرفی روش و ابزارهای علمی مورد استفاده - مشارکتجویانه |
MTH-INT-ENG |
|
معرفی روش و ابزارهای علمی مورد استفاده - خود استنادی |
MTH-INT-SLF |
|
تصحیح اثر خود - مشارکتجویانه |
OWN-CRR-ENG |
|
تصحیح اثر خود - تأکیدی |
OWN-CRR-BOS |
|
تصحیح اثر خود- احتیاطی |
OWN-CRR-HDG |
|
تصحیح اثر خود- نگرشی |
OWN-CRR-ATT |
|
تصحیح اثر خود- خود استنادی |
OWN-CRR-SLF |
|
تصحیح آثار دیگران – مشارکتجویانه |
OTHER-CRR- ENG |
|
تصحیح آثار دیگران- تأکیدی |
OTHER-CRR-BOS |
|
تصحیح آثار دیگران- احتیاطی |
OTHER-CRR-HDG |
|
تصحیح آثار دیگران – نگرشی |
OTHER-CRR-ATT |
|
اثبات یک ادعا – مشارکتجویانه |
PROV-CLM-ENG |
|
اثبات یک ادعا – تأکیدی |
PROV-CLM-BOS |
|
اثبات یک ادعا – احتیاطی |
PROV-CLM-HDG |
|
|
اثبات یک ادعا – نگرشی |
PROV-CLM-ATT |
|
اثبات یک ادعا با خود استنادی |
PROV-CLM-SLF |
|
رد اثر یا اندیشه منتسب به دیگران- مشارکتجویانه |
OTHER-REJ-ENG |
|
رد اثر یا اندیشه منتسب به دیگران- احتیاطی |
OTHER-REJ-HDG |
|
رد اثر یا اندیشه منتسب به دیگران- تأکیدی |
OTHER-REJ-BOS |
|
رد اثر یا اندیشه منتسب به دیگران- نگرشی |
OTHER-REJ-ATT |
|
رد ادعاهای حق تقدم در آثار دیگران – مشارکتجویانه |
PRIOR-REJ-ENG |
|
رد ادعاهای حق تقدم در آثار دیگران – احتیاطی |
PRIOR-REJ-HDG |
|
رد ادعاهای حق تقدم در آثار دیگران – تأکیدی |
PRIOR-REJ-BOS |
|
رد ادعاهای حق تقدم در آثار دیگران- نگرشی |
PRIOR-REJ-ATT |
کاربرد طرح حاشیهنویسی پیشنهاد شده در خلاصهسازی خودکار استنادمدار
به طور کلی، خلاصههای خودکار به دو روش استخراجی[55] و چکیدهسازی[56] تولید میشود. خلاصههای چکیدهای، تفسیری از متن اصلی را ارائه میکنند و در تولید آنها مفاهیم جملات اصلی به شکل کوتاهتر بازنویسی میشوند (مانی[57]، 2001). خلاصههای استخراجی شامل مجموعهای از جملات سند ورودی هستند. این نوع خلاصهسازی یک روش ساده اما قوی برای خلاصهسازی متن است. لذا بسیاری از پژوهشهای این حوزه، از نوع استخراجی هستند. استخراج و انتخاب جملات مناسب برای خلاصه نهایی، بر اساس ویژگیهای متون صورت میپذیرند. این ویژگیها[58]، طیف وسیعی از ویژگیهای سطحی مانند فراوانی کلمات و محل قرار گرفتن جمله در متن تا ویژگیهای معنایی را شامل میشوند (ساگیون و پویبو[59]، 2013). این نوع از خلاصهسازی شامل 3 مرحله اصلی است که عبارتند از پیشپردازش متن، مدلسازی و تولید خلاصه. نگاه کنید به شکل 1.
شکل1. معماری کلی یک سامانه خلاصهساز استخراجی
وجود پیکره مناسب در مرحله مدلسازی بسیار اهمیت دارد. زیرا، بر اساس آن میتوان ویژگیهای مفید برای تولید خلاصههای با کیفیتتر را استخراج کرد.
با اتخاذ رویکرد استخراجی در خلاصهسازی خودکار استنادمدار، لازم است به ویژگیهای معنایی بافتارهای استنادی توجه شود. لذا، لازم است پیکرههای مورد نیاز را تولید کرد.
یکی از ویژگی مهم در خلاصهسازی خودکار استنادمدار، کارکردهای استناد است. پیکرههای موجود، کارکردهای استناددهی را بر اساس تحلیل معنایی بافتارها در سطح کلمه و جمله طبقه بندی کرده اند و در فرآیند خلاصهسازی خودکار تنها تلاش کرده اند با تعیین چهریزه گفتمانی بافتارهای استنادی مقالات استنادکننده خلاصهای از مقاله استنادشونده را تولید کنند. برخی از این چهریزهها عبارتند از: هدف، روش و نتیجه.
از آنجایی که در خلاصهسازی استنادمدار، تحلیل عمیقتر بافتارهای استنادی به منظور پالایش آنها و تولید خلاصههای مفیدتر ضروری مینماید، بهرهگیری از طرح پیشنهاد شده در این پژوهش میتواند برای ساخت پیکره مناسب راهگشا باشد. طرح پیشنهاد شده، منجر به استخراج ویژگیهای فراگفتمانی بافتارهای استنادی میگردد.
در پیکرههایی که مبتنی بر طرح پیشنهاد شده، تولید شوند؛ به هر بافتار استنادی یک برچسب فراگفتمانی اختصاص داده میشود که بر اساس آنها میتوان الگوریتمهای خلاصهسازی مبتنی بر رویکرد وزندهی برچسبها را ارائه داد. به این ترتیب، میتوان برای بهرهگیری از رویکرد غیردودویی وزندهی نیز سیاستگذاری نمود. برای مثال، میتوان قوانین وزندهی را در الگوریتم تعریف کرد. برای نمونه، به برچسبهایی که تحلیلهای نگرشی و تأکیدی نویسنده استناد کننده را آشکار میکنند، نسبت به برچسبهایی که به بافتارهایی با محتوای احتیاطی مربوط هستند، وزن بیشتری تخصیص داد. بدین ترتیب، خلاصهساز قادر خواهد بود آن دسته از جملاتی که برچسبهایی با وزن بالاتر دارند را شناسایی نماید و در خلاصه نهایی درج کند.
علاوه بر کاربرد این طرح در امر خلاصهسازی خودکار استنادمدار، میتوان از آن در پژوهشهایی که فقط بر خودکارسازی طبقهبندی کارکردهای استناد تمرکز دارند نیز بهره گرفت.
نتیجهگیری
تحلیل و پالایش بافتارهای استنادی از ملزومات خلاصهسازی خودکار استنادمدار است. زیرا، در این نوع از خلاصهسازی تلاش میشود خلاصهای از بافتارهای استنادی مقالات استنادکننده به همراه خلاصهای از مقاله استنادشونده به کاربر ارائه شود. بنابراین، اگر خلاصهساز بتواند بافتارهای استنادی مفید را از استنادهای سرسری تشخیص دهد، میتوان سهم نویسنده استنادشونده در علم را به صورت کیفی معلوم نمود و سپس برای درج آنها در خلاصه استنادمدار نهایی تصمیمگیری نمود.
از این روی، رویکردهای معنایی خلاصهسازی خودکار استنادمدار عموماً از پیکرههای حاشیهنویسی شده توسط متخصصان بهره میبرند. ساخت چنین پیکرههایی به صرف هزینه کافی نیاز دارد و زمانبر است. فرآیند کار نیز، به این صورت است که یک طرح حاشیهنویسی در اختیار حداقل دو متخصص در حوزه مورد نظر، قرار میگیرد که برچسبزنی جملات را بر اساس آن طرح انجام میدهند. پیکره نهایی بر اساس توافق مطلوب حاشیهنویسان تولید میگردد.
در این مقاله به تحلیل نظری کاربرد الگوی فراگفتمان هایلند در خلاصهسازی خودکار استنادمدار متون علمی پرداخته شد و طرح حاشیهنویسی فراگفتمانمدار بافتارهای استنادی، پیشنهاد گردید. بررسی و تحلیل نظری متون نشان داد که از فراگفتمان تعاملی - مشارکتی هایلند میتوان برای تحلیل بافتارهای استنادی بهره گرفت. لذا، طرح حاشیهنویسی بر اساس تردیدنما، یقیننما، نگرشنما، خود اظهار و دخیلسازها و با 70 طبقه پیشنهاد شد.
با توجه به این که طرح حاشیهنویسی پیشنهاد شده مبتنی بر نظریات موجود است، لازم است در به کارگیری آن، از حاشیهنویسان خواسته شود تا در حین برچسبزنی، هر برچسب دیگری غیر از موارد مطرح شده در طرح را که به ذهنشان میرسد با ذکر دلیل، یادداشت نمایند تا در صورت احراز توافق مطلوب به طرح اضافه گردد.
پژوهشگران درصدد هستند، از طرح پیشنهاد شده برای تحلیل و پالایش بافتارهای استنادی مقالات حوزه علم اطلاعات و دانششناسی استفاده کنند. همچنین، پیادهسازی یک سامانه خلاصهساز استنادمدار برای مقالات علم اطلاعات در دست اقدام است که از پیکره حاشیهنویسی شده فراگفتمانمدار بافتارهای استنادی، بهره خواهد برد.
[1]. Citation Summary
[2]. Elkiss, Shen, Fader, Erkan, States & Radev
[3]. Dorr, Zajic, Whidby & Moon
[4]. Soldaini
[5] .Literature Retrieval
[6]. Citation-based summarization
.[7] خلاصهسازی خودکار متن از مباحث مهم و پرچالش حوزه پردازش زبان طبیعی است و عبارت است از نمایش فشرده، دقیق و منسجم متن ورودی به طوری که متن خروجی، مفاهیم مهم متن ورودی را در برداشته باشد.
[8]. تحلیل استنادی محتوامحور، در دو سطح نحوی و معنایی انجام میشود. در سطح نحوی میتوان با ارزشگذاری به جایگاه استناد، بسامد متنی استناد و ویژگیهای ساختاری مقالات، استنادها را متمایز ساخت. سطح بالاتر، سطح معنایی است که میتوان استنادها را بر اساس سرشت آنها مانند نوع استناد (تطبیقی، استناد به روششناسی و غیره) تحلیل نمود (قدیمی و ستوده، 1395)
[9]. Citation Functions
[10]. Metadiscourse
[11]. Hyland & Tse
[12]. Teufel & Moens
[13]. Luhn
[14]. Baxendale
[15]. Yeloglu, Milios & Zincir-Heywood
[16]. Kupiec, Pedersen & Chen
[17]. Abu-Jbara
[18]. Argumentative Zoning (AZ)
[19]. Core Scientific Concepts (CoreSc)
[20]. Fisas, Ronzano & Saggion
[21]. Knowledge Claim Discourse Model (KCDM)
[22]. Simone Teufel’s model
[23]. Siddharthan & Batchelor
[24]. Ontology
[25]. Liakata
[26]. Annotation schemes
[27]. برای مطالعه طرحهای حاشیهنویسی متون علمی رجوع شود به:
تاجر، پگاه؛ جوکار، عبدالرسول؛ فخراحمد، سیدمصطفی؛ خرمایی، علیرضا ؛ ستوده، هاجر (1396). کاربرد تحلیل گفتمان در خلاصهسازی خودکار متون علمی. مجموعه مقالات نخستین همایش ملی رویکردهای نوین در مطالعات زبان و ادبیات، 26 بهمن، مؤسسه آموزش عالی زند، شیراز، ایران.
[28]. Tidhar
[29]. Jurgens, Kumar, Hoover, McFarland & Jurafsky
[30]. Hernández-Alvarez & Gómez
[31]. Interactive
[32]. Interactional
[33]. Transitions
[34]. Frame Markers
[35]. در زبانشناسی، به حالتی در جملهها که درک معنای یک عنصر متنی با مراجعه به عناصر دیگر متن امکانپذیر میشود ارجاع گویند. عمده ارجاعات را ضمایر شخصی، ملکی، اشارهای و صفات ملکی تشکیل میدهند.
[36]. Endophoric Markers
[37]. Evidentials
[38]. Code Glosses
[39]. Hedges
[40]. Boosters
[41]. Attitude Markers
[42]. Self-mentions
[43]. Engagement Markers
[44] .Resources
[45] .Main clauses
[46] .Discourse acts
[47] .Elaborate
[48]. Rhetorical Structure Theory (RST)
این نظریه، یکی از نظریههای مشهور سازماندهی گفتمان میباشد که بر اساس آن میتوان متن را به صورت ساختاری درختی یا درختی بلاغی بازنمون نمود که در آن محدودههای متنی[48] با به کارگیری مجموعهای از روابط گفتمانی از پیش تعیین شده به هم پیوند داده میشوند. با توجه به این که متن یک واحد زبانشناسی پیچیده است، ساختار گفتمانی و یا تئوریهای سازماندهی متن را میتوان شاخصی برای تفسیر متن در نظر گرفت.
[49]. Garfield
[50]. Athar
[51]. OWN
[52]. Saha
[53]. Dobnik
[54]. Rebholz-Schuhmann
[55]. Extractive
[56]. Abstractive
[57]. Mani
[58]. Features
[59]. Poibeau