واکاوی اثربخشی برچسب‌گذاری معنایی در رفع ابهام معنایی هم‌نویسه‌های تخصصی از نظر میزان دقت در بازیابی متون علمی

نوع مقاله : مقاله پژوهشی

نویسندگان

1 دانشجوی دکترای علم اطلاعات و دانش‌شناسی، دانشکده علوم تربیتی و روانشناسی، دانشگاه الزهرا، تهران، ایران

2 دانشیار گروه علم اطلاعات ودانش شناسی /دانشگاه الزهرا(س)

3 استادیار گروه زبان و ادبیات انگلیسی، دانشکده ادبیات، دانشگاه الزهرا،

10.30481/lis.2021.288058.1845

چکیده

هدف: تبیین کاربرد روش برچسب‌گذاری پیکره متنی در رفع ابهام معنایی از هم‌نویسه‌های تخصصی از نظر میزان دقت در بازیابی متون علمی حاوی این گونه هم‌نویسه‌ها
روش: این پژوهش از حیث هدف کاربردی است که به روش ‌تجربی انجام شد و در رفع ابهام معنایی، روشی بانظارت محسوب می‌شود. جامعه پژوهش را 442 مقاله علمی در قالب دو گروه گواه و آزمون تشکیل دادند. گروه گواه دارای 221 متن کامل مقاله بدون برچسب و گروه تجربی دارای همان 221 مقاله اما این بار برچسب‌گذاری شده، بود که در نظام بازیابی اطلاعات برای سنجش کارآیی برچسب‌ها در رفع ابهام معنایی از هم‌نویسه‌های تخصصی مورد آزمون قرار گرفتند.
یافته‌ها: سطح معنی‌داری آزمون رتبه‌های علامت‌دار ویلکاکسون (0001/0 = P، 909/5- = Z) نشان می‌دهد که میزان دقت نتایج بازیابی هم‌نویسه‌های تخصصی بعد از به کارگیری پیکره تخصصی برچسب‌گذاری‌شده در نظام بازیابی اطلاعات نسبت به قبل از آن تفاوت معنی داری دارد. بررسی رتبه‌های منفی و مثبت نشان می‌دهد میزان دقت نتایج بعد از بکارگیری پیکره تخصصی برچسب‌گذاری‌شده به میزان معنی‌داری افزایش یافته و به حد بیشینه آن یعنی 1 رسیده است.
نتیجه‌گیری: اگر طراحان سیستم‌های بازیابی بر بهینه‌سازی فرمول‌های بازیابی متمرکز شوند و نظام‌های بازیابی را برای جستجوی اسناد مرتبط توانمند سازند، پژوهشگران با هر ویژگی‌ فیزیولوژیکی، تجربی و دانشی قادرند به اسناد مرتبط با نیاز اطلاعاتی خود با صرف زمانی اندک دسترسی یابند. در این پژوهش، ارزش پیکره متنی به عنوان گنجینه غنی دانش‌محور، در ایجاد تمایز نقش معنایی هم‌نویسه‌های تخصصی، آشکار شد.

کلیدواژه‌ها


عنوان مقاله [English]

Investigating the Effectiveness of Semantic Tagging in Sense Disambiguation of Specialized Homographs from the perspective of Precision in Retrieving scientific texts

نویسندگان [English]

  • mina rezaei dinani 1
  • Masoumeh Karbala Aghaei Kamran 2
  • VahidReza Mirzaeian 3
1 Ph.D. Candidate in Knowledge and Information Science, Faculty of Educational Sciences and Psychology, Alzahra university, Tehran, Iran.
2 Associate Professor, Department of Knowledge and Information Science, Faculty of Educational Sciences and Psychology, Alzahra university,
3 Assistant Professor, Department of English Language & Literature, Faculty of Literature, Alzahra university,
چکیده [English]

Objective: The aim of this study was to explain the application of text corpus tagging method in sense disambiguation from specialized homographs and increasing the retrieval Precision of scientific texts containing such homographs.
Method: This research was conducted experimentally and it is a supervised method that is one of the three methods of word sense disambiguation. The research sample consisted of 442 scientific articles of two groups of experimental group and control group. The control group had 221 full-text articles without tags and the experimental group had the same 221 tagged articles, which were tested in the information retrieval system to measure the effectiveness of tagging in sense disambiguation from specialized homographs.
Findings: The research findings indicate that while retrieval in the control group due to sense ambiguity of specialized homographs is accompanied with false drop and reduced precision, tagging of specialized homographs in the full text of articles in the experimental group have direct effect in sense disambiguation from specialized homographs. It is possible to retrieve specialized homographs related to each tag, while in retrieval based on the control group, this is not possible. The level of significance of the Wilcoxon signed-rank test (P = 0.0001, Z = -5/909) shows that the accuracy of retrieval results of specialized homograph after using the tagged text corpus in the information retrieval system is significantly different. Examination of negative and positive rankings shows that the accuracy of the results after using the tagged text corpus has increased significantly and has reached its maximum level of 1.
Conclusion: The rate of precision in retrieving scientific texts in the research findings is evidence of acceptable tagging effectiveness in sense disambiguation of specialized homographs and its effective role in optimizing the information retrieval system. If retrieval system designers focus on optimizing retrieval formulas in search of specialized homograph and empower retrieval systems to search for related documents, researchers with any physiological, experimental, and knowledge characteristics will be able to access related documents. Access their information needs in a short time. In this study, the value of the text corpus as a rich treasure of knowledge-based for information retrieval system was revealed in distinguishing the semantic role of specialized homographs. Although the research was conducted on limited corpus, the researcher believes that because this limited text corpus was designed in a principled way and the texts were consciously selected, the results of the findings can be generalized to all scientific texts in various fields.

کلیدواژه‌ها [English]

  • specialized homograph
  • Information Retrieval
  • Information organization
  • tagging
  • text corpus