واکاوی اثربخشی برچسب‌گذاری معنایی در رفع ابهام معنایی هم‌نویسه‌های تخصصی از نظر میزان دقت در بازیابی متون علمی

نوع مقاله : مقاله پژوهشی

نویسندگان

1 دانشجوی دکترای علم اطلاعات و دانش‌شناسی، دانشکده علوم تربیتی و روان‌شناسی، دانشگاه الزهرا، تهران، ایران

2 دانشیار گروه علم اطلاعات و دانش‌شناسی، دانشکده علوم تربیتی و روان‌شناسی، دانشگاه الزهرا، تهران، ایران.

3 استادیار گروه زبان و ادبیات انگلیسی، دانشکده ادبیات، دانشگاه الزهرا، تهران، ایران.

چکیده

هدف: تبیین کاربرد روش برچسب‌گذاری پیکره متنی در رفع ابهام معنایی از هم‌نویسه‌های تخصصی از نظر میزان دقت در بازیابی متون علمی حاوی این گونه هم‌نویسه‌ها.
روش: این پژوهش از حیث هدف کاربردی است که به روش ‌تجربی انجام شد و در رفع ابهام معنایی، روشی با نظارت محسوب می‌شود. جامعه پژوهش را 442 مقاله علمی در قالب دو گروه گواه و آزمون تشکیل دادند. گروه گواه دارای 221 متن کامل مقاله بدون برچسب و گروه تجربی دارای همان 221 مقاله اما این بار برچسب‌گذاری شده، بود که در نظام بازیابی اطلاعات برای سنجش کارآیی برچسب‌ها در رفع ابهام معنایی از هم‌نویسه‌های تخصصی مورد آزمون قرار گرفتند.
یافته‌ها: سطح معنی‌داری آزمون رتبه‌های علامت‌دار ویلکاکسون (0001/0 = P، 909/5- = Z) نشان می‌دهد که میزان دقت نتایج بازیابی هم‌نویسه‌های تخصصی بعد از به کارگیری پیکره تخصصی برچسب‌گذاری‌شده در نظام بازیابی اطلاعات نسبت به قبل از آن تفاوت معنی‌داری دارد. بررسی رتبه‌های منفی و مثبت نشان می‌دهد میزان دقت نتایج بعد از به کارگیری پیکره تخصصی برچسب‌گذاری‌شده به میزان معنی‌داری افزایش یافته و به حد بیشینه آن یعنی 1 رسیده است.
نتیجه‌گیری: اگر طراحان سیستم­‌های بازیابی بر بهینه‌­سازی فرمول­‌های بازیابی متمرکز شوند و نظام‌­های بازیابی را برای جستجوی اسناد مرتبط توانمند سازند، پژوهشگران با هر ویژگی­ فیزیولوژیکی، تجربی و دانشی قادرند به اسناد مرتبط با نیاز اطلاعاتی خود با صرف زمانی اندک دسترسی یابند. در این پژوهش، ارزش پیکره متنی به عنوان گنجینه غنی دانش­محور، در ایجاد تمایز نقش معنایی هم‌نویسه‌های تخصصی، آشکار شد.

کلیدواژه‌ها


عنوان مقاله [English]

Investigating the Effectiveness of Semantic Tagging in Sense Disambiguation of Specialized Homographs from the perspective of Precision in Retrieving scientific texts

نویسندگان [English]

  • Mina Rezaei Dinani 1
  • Masoumeh Karbala Aghaei Kamran 2
  • VahidReza Mirzaeian 3
1 Ph.D. Candidate in Knowledge and Information Science, Faculty of Educational Sciences and Psychology, Alzahra University, Tehran, Iran
2 Department of Knowledge and Information Science, Faculty of Educational Sciences and Psychology, Alzahra University, Tehran, Iran
3 Assistant Professor, Department of English Language & Literature, Faculty of Literature, Alzahra University, Tehran, Iran.
چکیده [English]

Objective: The aim of this study was to explain the application of text corpus tagging method in sense disambiguation from specialized homographs and increasing the retrieval precision of scientific texts containing such homographs.
Methodology: This research was conducted experimentally and it is a supervised method that is one of the three methods of word sense disambiguation. The research sample consisted of 442 scientific articles of two groups of experimental group and control group. The control group had 221 full-text articles without tags and the experimental group had the same 221 tagged articles, which were tested in the information retrieval system to measure the effectiveness of tagging in sense disambiguation from specialized homographs.
Findings: The research findings indicate that while retrieval in the control group due to sense ambiguity of specialized homographs is accompanied with false drop and reduced precision, tagging of specialized homographs in the full text of articles in the experimental group have direct effect in sense disambiguation from specialized homographs. It is possible to retrieve specialized homographs related to each tag, while in retrieval based on the control group, this is not possible. The level of significance of the Wilcoxon signed-rank test (P = 0.0001, Z = -5/909) 
shows that the accuracy of retrieval results of specialized homograph after using the tagged text corpus in the information retrieval system is significantly different. Examination of negative and positive rankings shows that the accuracy of the results after using the tagged text corpus has increased significantly and has reached its maximum level of 1.
Conclusion: The rate of precision in retrieving scientific texts in the research findings is evidence of acceptable tagging effectiveness in sense disambiguation of specialized homographs and its effective role in optimizing the information retrieval system. If retrieval system designers focus on optimizing retrieval formulas in search of specialized homograph and empower retrieval systems to search for related documents, researchers with any physiological, experimental, and knowledge characteristics will be able to access related documents. Access their information needs in a short time. In this study, the value of the text corpus as a rich treasure of knowledge-based for information retrieval system was revealed in distinguishing the semantic role of specialized homographs. Although the research was conducted on limited corpus, the researcher believes that because this limited text corpus was designed in a principled way and the texts were consciously selected, the results of the findings can be generalized to all scientific texts in various fields.
 

کلیدواژه‌ها [English]

  • Specialized homograph
  • Information retrieval
  • Information organization
  • Tagging
  • Text corpus
آزاد، احسان (1386). طراحی و پیاده‌­سازی یک سیستم بازیابی اطلاعات متنی جدید برای زبان فارسی. پایان­‌نامه کارشناسی ارشد. گروه مهندسی کامپیوتر- هوش مصنوعی. دانشکده فنی-مهندسی. دانشگاه شیراز، شیراز.
افراشی، آزیتا؛ عاصی، مصطفی؛ جولایی، کامیار (1395). استعاره‌های مفهومی در زبان فارسی؛ تحلیلی شناختی و پیکره‌مدار. زبان‌شناخت، 6 (12)، 39-61.
اکبری، اسماعیل؛ حسینی بهشتی، ملوک‌السادات؛ نوروزی‌اقبالی، مهرداد (1384). اص‍طلاح‌ن‍ام‍ه‌ ع‍ل‍وم‌ زی‍س‍ت‍ی‌. ت‍ه‍ران‌: م‍رک‍ز اطلاع‍ات‌ و م‍دارک‌ ع‍ل‍م‍ی‌ ای‍ران‌.
بوث، باربارا؛ بلر، میشل (1382). اص‍طلاح‌ن‍ام‍ه‌ ج‍ام‍ع‍ه‌ش‍ن‍اس‍ی‌. ترجمه مهوش معترف. ت‍ه‍ران‌: م‍رک‍ز اطلاع‍ات‌ و م‍دارک‌ ع‍ل‍م‍ی‌ ای‍ران‌.
حسن­‌زاده، شیرین (1389). یک سیستم بازیابی اطلاعات متنی برای زبان فارسی. چهارمین کنفرانس داده­‌کاوی ایران. تهران، دانشگاه صنعتی شریف.
حسینی‌بهشتی، ملوک‌السادات؛ وفایی، سعیده؛ نوروزی‌اقبالی، مهرداد (1393). اصطلاح‌نامه ریاضیات. ت‍ه‍ران‌: م‍رک‍ز اطلاع‍ات‌ و م‍دارک‌ ع‍ل‍م‍ی‌ ای‍ران‌.
دستغیب، محمدباقر (۱۳۹۷). تولید پیکره متنی برای زبان فارسی با استفاده از راه‌­حل­های مبتنی بر دانش. چهارمین کنفرانس ملی دستاوردهای نوین در برق و کامپیوتر و صنایع. اسفراین، مجتمع آموزش عالی فنی و مهندسی اسفراین.
دلیخون، لیلا (1395). بررسی راه‌­های گسترش پرسش کاربران در موتورهای جستجو و پایگاه داده‌های تخصصی: مطالعه موردی دانشجویان کارشناسی ارشد فنی و مهندسی دانشگاه الزهرا (س). پایان‌نامه کارشناسی ارشد. دانشکده علوم تربیتی و روان‌شناسی. دانشگاه الزهرا، تهران.
رجبی، تقی؛ غریبی، حسین؛ حسینی‌بهشتی، ملوک‌السادات؛ نوروزی‌اقبالی، مهرداد (۱۳۸۳). اص‍طلاح‌ن‍ام‍ه‌ ش‍ی‍م‍ی‌. ت‍ه‍ران‌: م‍رک‍ز اطلاع‍ات‌ و م‍دارک‌ ع‍ل‍م‍ی‌ ای‍ران‌.
زرداری، سولماز (1395). مهندسی هستی‌‏نگاری علم اطلاعات و دانش‌شناسی بر اساس دائرۃ‌المعارف کتابداری و اطلاع‌رسانی. پایان‌نامه دکتری، دانشکده علوم تربیتی و روان‌شناسی، دانشگاه شهید چمران اهواز، اهواز.
ستوده، هاجر؛ هنرجویان، زهره (1391). مروری بر دشواری‌های زبان فارسی در محیط دیجیتال و تأثیرات آن‌ها بر اثر بخشی پردازش خودکار متن و بازیابی اطلاعات. کتابداری و اطلاع‌رسانی، 15(4)، 59-92.
ستوده، هاجر؛ هوشیار، مژگان (1397). بررسی نقش انواع بافتار هم نویسه‌ها در تعیین شباهت بین مدارک. پژوهشنامه پردازش و مدیریت اطلاعات، 33(3)، 1183-1206.
شاپوری، سودابه (1379). مشکلات جستجوی موضوعی استفاده‌­کنندگان از فهرست رایانه­‌ای کتابخانه مرکزی دانشگاه فردوسی مشهد. کتابداری و اطلاع­‌رسانی، 3(2)، 49-68.
شهبازی، مهری؛ شاهینی، شبنم (1394). بررسی میزان کارآیی پایگاه‌‏های اطلاعاتی مگ ایران، نورمگز و اس.آی.دی. در بازیابی و ربط مباحث علم اطلاعات و دانش‌‏شناسی با استفاده از کلیدواژه‏‌های آزاد و مقایسه آن‌ها از نظر میزان استفاده از کلیدواژه‏‌های مهارشده. پژوهشنامه پردازش و مدیریت اطلاعات، ۳۱(۲)،۴۳۱-۴۵۴.
صدیقی، مهری؛ حسینی‌بهشتی، ملوک‌السادات؛ نوروزی‌اقبالی، مهرداد (1384). اصطلاح‌نامه علوم زمین. ت‍ه‍ران‌: م‍رک‍ز اطلاع‍ات‌ و م‍دارک‌ ع‍ل‍م‍ی‌ ای‍ران‌.
صفری، سعید (1391). طراحی و ایجاد پیکره‌ی تولیدی زبان‌آموز فارسی. پایان‌­نامه کارشناسی ارشد. دانشکده ادبیات و علوم‌انسانی. دانشگاه علامه طباطبائی، تهران.
عبدالهی نورعلی، محمدصادق (1386). کندوکاو مسائل ریخت شناسی زبان فارسی در بازیابی اطلاعات از جستجوگرهای وب. پایان‌نامه کارشناسی ارشد، گروه علم اطلاعات و دانش­‌شناسی. دانشکده علوم تربیتی و روان‌شناسی. دانشگاه شیراز، شیراز.
عبدالهی نورعلی، محمدصادق؛ جوکار، عبدالرسول (1388). چالش‌­های شیوه نگارش زبان فارسی در بازیابی اطلاعات از موتورهای کاوش وب. مطالعات تربیتی و روان‌شناسی دانشگاه فردوسی مشهد. 10(2)، 67-90.
قیومی، مسعود (1398). تعیین خودکار معنای واژه‌های فارسی با استفاده از تعبیه معنایی واژه. پژوهشنامه پردازش و مدیریت اطلاعات، 35(1)، 25-50.
کامیابی‌گل، عطیه؛ اخلاقی باقوجری، الهام؛ عسگریان، احسان؛ حبیبی، هانیه (1397). استخراج اطلاعات از پیکره زبانی؛ معرفی پیکره مقاله‌های علمی پژوهشی دانشگاه فردوسی مشهد. کتابداری و اطلاع‌­رسانی. 21(2)، 3-25.
گل تاجی، مرضیه؛ بذرگر، سعیده (1389). بررسی مشکلات ریخت‌شناسی زبان فارسی در سه پایگاه اطلاعاتی مرکز منطقه‌ای اطلاع‌رسانی علوم و فناوری، پژوهشگاه اطلاعات و مدارک علمی ایران و جهاد دانشگاهی. کتابداری و اطلاع‌رسانی، 13(2)، 191-214.
مرتضایی، لیلا (1381). مسائل زبان و خط فارسی در ذخیره‌سازی و بازیابی اطلاعات. فصلنامه اطلاع‌رسانی، 17(1-2)، 1-7.
مسعودی، بابک؛ راحتی قوچانی، سعید (1394). رفع ابهام معنایی واژگان مبهم فارسی با مدل موضوعی LDA. پردازش علائم و داده‌ها، 4(26)، 117-125.
مظفری، زهرا؛ تاکی، گیتی؛ صباغ جعفری، مجتبی؛ یوسفان، پاکزاد (1397). سامانه رفع ابهام معنایی از حروف اضافه در زبان فارسی با استفاده از قالب‌های معنایی. پژوهش‌های زبانی، 9(1)، 99-117.
معروفی، افسانه؛ پیله‌ور، عبدالحمید (1392). رفع ابهام از معنی کلمه مبهم فارسی با استفاده از روش‌ها مبتنی بر پیکره و قاموس. اولین همایش منطقه‌ای رویکردهای نوین در مهندسی کامپیوتر و فناوری اطلاعات. رودسر، دانشگاه آزاد اسلامی.
مهرنهاد، زینب؛ قاسم‌زاده، محمد؛ نظارات، امین (1396). به کارگیری پیکره‌های زبانی در طراحی یک سامانه بازیابی اطلاعات دوزبانه. دومین کنفرانس ملی محاسبات نرم. دانشکده فنی و مهندسی شرق گیلان، دانشگاه گیلان.
نوروزی، یعقوب؛ هماوندی، هدی (1394). بررسی مشکلات جستجو و بازیابی تصاویر در موتورهای کاوش برگزیده مبتنی بر ویژگی‌های نگارشی زبان فارسی. کتابداری و اطلاع‌رسانی، 5(2)، 206-222.
نوروزی اقبالی، مریم؛ حسینی بهشتی، ملوک‌السادات؛ نوروزی اقبالی، مهرداد (1385). اصطلاح‌نامه فیزیک. ت‍ه‍ران‌: م‍رک‍ز اطلاع‍ات‌ و م‍دارک‌ ع‍ل‍م‍ی‌ ای‍ران‌.
هوشیار، مژگان (1394). مقایسه قدرت انواع بافتار متن در ابهام ­زدایی معنایی از هم‌نویسه‌های انگلیسی. پایان­‌نامه کارشناسی ارشد. گروه علم اطلاعات و دانش‌­شناسی. دانشکده علوم تربیتی و روان‌شناسی. دانشگاه شیراز، شیراز.
یوسفان نجف‌آبادی، احمد (1382). یک سیستم بازیابی اطلاعات متنی برای زبان فارسی بر پایه نمایه‌گذاری معانی پنهان. پایان‌نامه کارشناسی ارشد، مهندسی کامپیوتر، دانشگاه شیراز، شیراز.
یوسفی‌راد، ابراهیم (1388). آر. دی. اف: الگویی برای توصیف منابع در وب معنایی. فصلنامه کتاب. 79، 9- 22.
 
References
Abdollahi NorAli, M. S. (2007). Survey on morphological difficulties of Persian language in information retrieval from web search tools. M.S thesis, Library and Information science. Faculty of Education and Psychology, Shiraz University, Shiraz. (in Persian)
Abdollahi NorAli, M. S., & Jokar, A. (2009). Survey on morphological difficulties of Persian language in information retrieval from Web Search Engines. Educational and Psychological Studies, 10(2), 67-90. (in Persian)
Afrashi, A., Asi, S. M., & Joulaei, K. (2016). Conceptual metaphors in Persian: A cognitive perspective and a corpus driven analysis. Zabanshenakht (Language studies), 6(2), 39-61. (in Persian)
Akbari, E.,  Hosseini Beheshti, M., &  Noroozi Eghbali, M. (2005). Thesaurus of Biological Science. Tehran, Iranian Research Institute for Information Science and Technology. (in Persian)
Atkins, S., Clear, J., & Ostler, N. (1992). Corpus design criteria. Literary and Linguistic Computing, 7(1), 1-16.
Azad, E. (2007). Design and implementation of a modern information retrieval system for Farsi language. M. S thesis. Computer engineering artificial intelligence. Faculty of Engineering, Shiraz University, Shiraz. (in Persian)
Barba, E., Procopio, L., Campolungo, N., Pasini, T., & Navigli, R. (2020). MuLaNMultilingual label propagation for word sense disambiguation. IJCAI, 3837-3844.
Booth, B., & Blair, M. (1992). Thesaurus of sociological indexing terms. Tehran, Iranian Research Institute for Information Science and Technology. (in Persian)
Bowker, L. (2018). Corpus linguistics is not just for linguists: Considering the potential of computer-based corpus methods for library and information science research. Library Hi Tech, 36(4), 1-28. DOI: 10.1108/LHT-12-2017-0271
Dastghaib, M. B. (2018). Constructing Persian text corpus by using some knowledge-based approaches. Fourth National Conference on New Achievements in Electrical and Computer and Industries. Esfarayen,  university of Technology. (in Persian)
Delikhoun, L. (2016). A survey of query expansion (QE) of Users in Search Engines and Specialized Databases: A Case Study of Engineering Graduate Student at Alzahra University. Thesis for Master, Knowledge and Information Science. Faculty of Education and Psychology, Alzahra University, Tehran. (in Persian)
Fangzhou L., Qin, S. & Tao, J. (2008). Tree-guided transformation-based homograph disambiguation in Mandarin TTS system. Proceedings of the IEEE International Conference on Acoustics, Speech, and Signal Processing, Las Vegas, NV, USA. 4657-4660
Gale, K. W., Church, W. A., & Yarowsky, D. (1992). A Method for Disambiguating Word Senses in a Large Corpus. Computer and the Humanities, 26(5-6), 415-439.
Ghayoomi, M. (2019). Identifying Persian Words’ Senses Automatically by Utilizing the Word Embedding Method. Iranian Journal of Information Processing & Management; 35(1), 25-50. (in Persian)
Goltaji, M., & Bazregar, S. (2010). Investigating the morphological problems of Persian language in three databases of ISC, Irandoc & Jahad Institute. Library and Information Sciences, 13(2), 191-214. (in Persian)
Harada, T., & Tsuda, K. (2014). Classifying homographs in Japanese social media texts using a user Interest model. Procedia Computer Science, (35), 929-936.
Hasanzadeh, S. (2010). A text information retrieval system for Persian language. The Fourth Iran Data Mining Conference/ IDMC 10. Tehran, Sharif University of Technology. (in Persian)
Hearst, M. A. (1991). Noun homograph disambiguation using local context in large text corpora. Proceedings of the 7st Annual conference of the University of Waterloo Centre for the new OED and text research, Berkeley, 185-188.
Hoseini Beheshti, M. S., Vafaei, S., & Noroozi Eghbali, M. (2015). Thesaurus of mathematic. Tehran, Iranian Research Institute for Information Science and Technology. (in Persian)
Houshyar, M. (2016). The comparison of powers of different kinds of text contexts in sense disambiguation of English homographs. M. A. Thesis, Knowledge and Information Science, Information Management. Faculty of Educational Sciences and Psychology, Shiraz University, Shiraz. (in Persian)
Jones, C., & Waller, D. (2015). Corpus linguistics for grammar, A guide for research. London, Routledge.
Kamyabi Gol, A., Akhlaghi Baghujeri, E., Asgarian, E., & Habibi, H. (2018). Extracting information from language corpus: introducing the corpus of scientific articles of Ferdowsi University of Mashhad. Library and Information Sciences, 21(2), 3-25. (in Persian)
Khan, L., McLeod, D., & Hovy, E. (2004). Retrieval effectiveness of an ontology-based model for information selection. The VLDB Journal- The International Journal on Very Large Data Bases, 13(1), 71-85.
Kumar, S., Jat, S., Saxena, K., & Talukdar, P. (2019). Zero-shot word sense disambiguation using sense definition embedding. Proceedings of the 57th Annual Meeting of the Association for Computational Linguistics (ACL). Florence, Italy, 5670–5681.
Lazarinis, F. (2007). Evaluating the searching capabilities of e‐commerce web sites in a non‐English language: A Greek case study, Online Information Review, 31)6(, 881-891.
Lewandowski, D. (2008). Problems with the use of web search engines to find results in foreign languages. Online Information Review, 32(4), 668-672.
Maaroufi, A., & Pilehvar, A.  (2013). Word sense disambiguation of Persian words using methods based on corpus and dictionary. First National Conference on Advances in computer science and information retrieval approaches. Rudsar, Azad University, Guilan. (in Persian)
Mahmoud, H., Salah Kareem, S., & El-Shishtawy, T. (2018). A semantic retrieval system for extracting relationships from biological corpus. International Journal of Computer Science & Information Technology (IJCSIT), 10(1), 43-53.
Masoudi, B., & Rahati Ghochani, S. (2016). Farsi word sense disambiguation with LDA topic model. JSDP. 12(4), 117-125. (in Persian)
Mehrnahad, Z., Ghasemzadeh, M. & Nazarat, A. (2017) .Using language corpuses in designing a bilingual information retrieval system. 2rd International Conference on Soft Computing. Rudsar, Guilan University. (in Persian)
Menai, M. B. (2014). Word sense disambiguation using an evolutionary approach. Informatica, 38(3), 155-169.
Mortezai, L. (2001). Persian language and orthography for Information storage and retrieval. Iranian Journal of Information Processing & Management, 17(1-2), 9-26. (in Persian)
Mozaffari, Z., Taki, G., Sabbagh Jaffari, M., & Yusefian, P. (2018). Preposition sense disambiguation in Persian using semantic frames. Language Research, 9(1), 99-117. (in Persian)
Norouzi, Y., & Homavandi, H. (2015). Survey of Image Search and Retrieval Problems in Selected Search Engines based on the Persian Writing Styles. Library and Information Sciences, 5(2), 206-222. (in Persian)
Noroozi Eghbali, M., Hoseini Beheshti, M. S., & Noroozi Eghbali, M. (2007). Thesaurus of physics. Tehran, Iranian Research Institute for Information Science and Technology. (in Persian)
Pretschner, A., & Gauch, S. (1999). Ontology based personalized search. In Proceedings of the 11th IEEE, International Conference on Tools with Artificial Intelligence. Chicago, IL, USA.
Prokofyev, R., Demartini, G., Boyarsky, A., Ruchayskiy, O., & Cudré-Mauroux, P. (2013). Ontology-based word sense disambiguation for scientific literature. Advances in information retrieval: 35th European conference on IR research, ECIR, Berlin, Germany: Springer. 594-605.
Rajabi, T., Gharibi, H.,  Hosseini Beheshti, M. S. &  Noroozi Eghbali, M. (2004). Thesaurus of Chemistry. Tehran, Iranian Research Institute for Information Science and Technology. (in Persian)
Safari, S. (2011). Designing and Developing a FFL Learner Corpus. Thesis for Degree of Master of ART (M.A), Department of English Language & Literature, Faculty of Literature, Allameh Tabatabaei University, Tehran. (in Persian)
Schutze, H. (2014). Introduction to Information Retrieval: Relevance Feedback and Query Expansion. Retrieved from http://www.cis.uni-muenchen.de/~hs/teach/13s/ir/pdf/09expand.pdf
Sedighi, M., Hoseini Beheshti, M. S., & Noroozi Eghbali, M. (2004). Thesaurus of geosciences. Tehran, Iranian Research Institute for Information Science and Technology. (in Persian)
Semeval website (2020). International workshop on semantic evaluation. Retrieved 9 December from https://semeval.github.io/
Shahbazi, M. & Shahini, S. (2016). Study of the the efficacy Magiran, Noormags and SID database in retrieval and relevance of Information Science and Knowledge subject by free keywords and Compare them in terms of the use of controlled keywords. Iranian Journal of Information Processing & Management, 31(2), 431-454. (in Persian)
Shapoori, S. (2000). Problems of subject search for users of the computer catalog of the Central Library of Ferdowsi University of Mashhad. Library and Information Sciences, 3(2), 49-68. (in Persian)
Shen, B., Wu, Z., Wang, Y.,&  Cai, L. (2011). Combining Active and Semi-Supervised Learning for Homograph Disambiguation in Mandarin Text-to-Speech Synthesis. 12th Annual Conference of the International Speech Communication Association, Florence, Italy, 27-31.
Sotoudeh, H., & Honarjooyan, Z. (2012). A review of the difficulties of the Persian language in the digital environment and their effects on the effectiveness of automatic text processing and information retrieval. Library and Information science, 15(4), 59-92. (in Persian)
Sotoudeh, H. & Houshyar, M. (2018).The Role of Different Types of Homograph Contexts in Measuring Documents Similarities, Iranian Journal of Information Processing & Management, 33(3), 1195-1220. (in Persian)
Spink, A., Wolfram, D., Jansen, M. B. J., & Saracevic, T. (2001). Searching the Web: the public and their queries. Journal of the American Society for Information Science and Technology. 52(3), 226-234.
Stefanowitsch, A. (2006). Corpus-based approaches to metaphor and metonymy. In Corpus-Based Approaches to Metaphor and Metonymy. Edited by Anatol Stefanowitsch and Stefan Th. Gries, Berlin, New York: De Gruyter Mouton. Retrieved from https://doi.org/10.1515/9783110199895.1
Tabatabaie Jafari, Z. (2011). A Survey to Query Expansion (QE) in Information Searching Behavior in Search Engines: A study of LIS graduate student Tehran states university. Thesis for degree of master of ART (MA), Library & Information science. Faculty of Humanities, University of Qom, Qom. (in Persian)
Vallet, D., Fernandez, M., & Castells, P. (2005). An ontology-based information retrieval model. In European Semantic Web Conference. Springer, Berlin, Heidelberg. 455-470.
Voorhees, E. M. (2002). The philosophy of information retrieval evaluation. In CLEF '01: Revised Papers from the Second Workshop of the Cross-Language Evaluation Forum on Evaluation of Cross-Language Information Retrieval Systems, London, UK. Springer-Verlag, 355-370.
Yousefan Najafabadi, A. (2004). A Farsi text Information retrieval system based on latent semantic indexing. M. A. Thesis. School of Electrical and Computer Engineering, Shiraz University, Shiraz. (in Persian)
Yousefi Rad, E. (2009). R.D.F.: A model for resource description in semantic web. National Studies on Librarianship and Information Organization, 20(3), 9-22. (in Persian)
Zardary, S. (2016). Ontology engineering of knowledge and information science based on Encyclopedia of Library and Information Science. Ph. D. degree, Knowledge and Information Science Department. Faculty of Education and Psychology, Shahid Chamran University of Ahwaz, Ahwaz. (in Persian)
Zhang, J., & Lin, S. (2007). Multiple language supports in search engines. Online Information Review, 31(4), 516-532.