درباره «موضوع» و «تحلیل موضوعی»: نکته ها و چشم اندازها

نوع مقاله : مقاله پژوهشی

نویسندگان

1 مربی پژوهشی سازمان اسناد و کتابخانه ملی ایران، دانش آموخته دکتری علم اطلاعات و دانش‌شناسی، دانشکده علوم تربیتی و روان‌شناسی، دانشگاه خوارزمی، تهران، ایران.

2 استاد گروه علم اطلاعات و دانش‏شناسی، دانشکده علوم تربیتی و روان‌شناسی، دانشگاه خوارزمی، تهران، ایران

3 استادیار گروه علوم کامپیوتر، دانشکده علوم ریاضی و کامپیوتر، دانشگاه خوارزمی، تهران، ایران.

4 استاد گروه مهندسی فناوری اطلاعات، دانشکده مهندسی صنایع و سیستم‌ها دانشگاه تربیت مدرس، تهران، ایران

چکیده

هدف: با توجه به اهمیت بازیابی موضوعات منابع اطلاعاتی و جستجوی موضوعی کاربران ، در این پژوهش چیستی«موضوع» و چگونگی تحلیل و استخراج موضوعات در فرایند تعیین کلیدواژه های موضوعی، و مسائل و راه حل‌های ممکن مورد بحث قرار می گیرند.
روش پژوهش: این مقاله پژوهشی مفهومی است که با روش کتابخانه ای- سندی مفاهیم «موضوع» و «تحلیل موضوعی» را در گزیده ای از متون شاخص علم اطلاعات و دانش شناسی با نگاهی بر مفاهیم متناظر در حوزه پردازش زبان طبیعی بررسی می کند.
یافته‌ها: «موضوع» یا «دربارگی» منابع و تحلیل موضوعی عبارت است از شناسایی موضوعات و مفاهیم مندرج در منبع اطلاعاتی با قوای فکری نیروی انسانی، با الگوریتم‌های کامپیوتری، یا ترکیب این دو. تعدد ابزارهای تحلیل موضوعی و انتساب کلیدواژه‌ها، میزان پایین کاربرد طرح‌های استاندارد توصیف، عدم همگونی در تحلیل موضوعی، عدم همخوانی عبارت‌های جستجوی کاربران با کلیدواژه‌های انتساب داده شده، و روزآمد نبودن توصیف منابع از نقاط ضعف رویکرد تحلیل موضوعی توسط انسان است. روش‌های خودکار هوش مصنوعی و پردازش زبان طبیعی توان افزایش سرعت و یکدستی در فرایندهای مختلف توصیف و سازماندهی اطلاعات و از جمله استخراج کلیدواژه های موضوعی را دارند، اما ارزیابی کارآمدی خروجی این روش‌ها، به تنهایی، یا در مقایسه با کلیدواژه‌های تولید انسان، و از دیدگاه‌های مختلف ضروری است.
نتیجه‌گیری: کتابخانه‌ها و مراکز اطلاع‌رسانی می‌توانند به دور از شتابزدگی، از روش‌های پردازش زبان طبیعی و هوش مصنوعی در تحلیل موضوعی و انتساب یا استخراج کلیدواژه-های موضوعی استفاده کنند و نیروی انسان را در ارتقاء کیفیت خدمات و فرایندها به کارگیرند.

کلیدواژه‌ها


عنوان مقاله [English]

About "Subject" and "Subject Analysis": Viewpoints and Perspectives

نویسندگان [English]

  • Farzaneh Shadanpour 1
  • Nosrat Riahinia 2
  • Keivan Borna 3
  • Gholam Ali Montazer 4
1 Ph.D of Knowledge and Information Science, Instructor of National Library and Archives of Iran, Faculty of Education and Psychology, Kharazmi University, Tehran, Iran.
2 Professor, Department of Knowledge and Information Science, Faculty of Education and Psychology, Kharazmi University, Tehran, Iran.
3 Assistant Professor, Department of Mathematics and Computer Science, Faculty of Computer Science, Kharazmi University, Tehran, Iran
4 Professor, Department of Information Technology, Faculty of Industrial/ Systems Engineering, University of Tarbiat- Modarres, Tehran, Iran.
چکیده [English]

Objective: Since the discovery and representation of subjects contained in information resources is the most important goal in information description, analysis and retrieval systems, and since subject search is the most common type of user search in databases and library catalogs, in this study what is "subject" and how to analyze and extract subject matters in the process of determining subject keywords for an information resource, as well as some research and operational perspectives are discussed.
Methodology: This conceptual paper uses documentary research method to examine the concepts of "subject" and "subject analysis", presented in a selection of related research works in the field of Information Science, as well as considering some corresponding concepts in the field of Computer Science and Natural Language Processing.
Findings: Despite various interpretations of what "subject" is, which some assume to be an axiom, and its definition unnecessary, there is consensus, explicitly or implicitly, on its meaning of "aboutness". Subject analysis of information resources, as part of the indexing process, is the analysis and identification of stated topics and concepts and/or obvious features of the information source that may involve manpower, computer algorithms designed to identify textual terms or the combination of the two is done. Each of these methods has its strengths and weaknesses. Search and retrieval problems due to the multiplicity of subject analysis tools and keyword assignment, low usage rate of standard descriptive schemas, inconsistencies between indexed terms assigned by a single indexer at different times, as well as between multiple indexers for the same information resource, human error in general, the inconsistency of users’ search terms with the assigned keywords, and the lack of on time description of resources due to the growing production of them are among the weaknesses of the human subject analysis approach. The application of automated methods of artificial intelligence and natural language processing offers promising prospects for increasing speed and consistency in various processes of describing and organizing information, including the extraction of subject keywords. However, evaluating the efficiency of the output of these methods, alone or in comparison with the keywords of human production, specially from the perspective of users, is required.
Conclusion: In the competition of machine algorithms with the human mind in the analysis and recognition of resource subjects, the human mind excels; whether it is an indexer who expresses in his own language what the source is about, or a designer who can design a machine that mimics the computational steps of his mind to saves time and resources. Libraries and information centers can, far from rushing to replace conventional processes and procedures, use the various methods and tools available from the Natural Language Processing and Machine Learning fields to design and develop automated systems for indexing and extracting or assigning subject keywords - and in the larger perspective, automated classification- to use resources (financial, human, and time) for the ultimate goal of maximizing productivity, shortening the subject access path to resources for users, and facilitating the description process.

کلیدواژه‌ها [English]

  • 'Subject
  • '
  • 'Subject Analysis'
  • 'Subject Indexing'
  • 'Natural Language Processing'
اندرسن، جیمز دی (1385). سازماندهی دانش. ترجمه حمیدرضا جمالی مهمویی. در دایره‌المعارف کتابداری و اطلاع‌رسانی، ج 2. سرویراستار ابراهیم افشار، با همکاری سودابه نوذری. بازیابی از: http://portal.nlai.ir/daka/Wiki%20Pages/%D8%B3%D8%A7%D8%B2%D9%85%D8%A7%D9%86%D8%AF%D9%87%D9%8A%20%.aspx
پوراحمد، علی اکبر؛ حسنی، محمدرضا (1387). فهرست‌نویسی موضوعی: اصول و روش‌ها. ویراسته رحمت الله فتاحی. تهران: کتابدار.
پورتر، ابوت اچ (1397). سواد روایت. ترجمه رویا پورآدر و نیما اشرفی. تهران: اطراف.
خداپرستی، فرج الله (1376). فرهنگ جامع واژگان مترادف و متضاد زبان‌ فارسی. شیراز: دانشنامه فارسی. بازیابی از: https://vajehyab.com/motaradef/%D9%85%D9%88%D8%B6%D9%88%D8%B9
خوشیان، ناهید؛ میرزاییان، وحیدرضا (1399). پرکاربردترین عملکردهای پردازش زبان طبیعی در حوزه علوم کتابداری و اطلاع رسانی. دانش شناسی، 6(23)، 117-151.
دهخدا، علی‌اکبر (1399). لغت‌نامه دهخدا (نسخه دیجیتال) براساس نسخه فیزیکی ۱۵ جلدی انتشار سال ۱۳۷۷.
موسسه لغت‌نامه دهخدا و مرکز بین‌المللی آموزش زبان فارسی دانشگاه تهران. بازیابی از: https://dehkhoda.ut.ac.ir/fa/dictionary/309078/%D9%85%D9%88%D8%B6%D9%88%D8%B9
رازی، فریده (1372). ف‍ره‍ن‍گ‌ واژه‌ه‍ای‌ ف‍ارس‍ی‌ س‍ره‌: ب‍رای‌ واژه‌ه‍ای‌ ع‍رب‍ی‌ در فارسی معاصر. تهران: نشر مرکز. بازیابی از: https://vajehyab.com/sareh/%D9%85%D9%88%D8%B6%D9%88%D8%B9
سپهر، فرشته؛ اباذری، زهرا (1395، 8 و 9 اردیبهشت). امکان سنجی استفاده از هستی‌شناسی در کتابخانه‌های دیجیتالی ایران. مقاله ارائه شده در دومین کنفرانس بین‌المللی وب پژوهی، تهران.
سلطانی، پوری (1351). رده‌بندی کولن. خبرنامه انجمن کتابداران ایران، 5(3)، 115-120.
سلطانی، پوری (1381). سرعنوان‌های موضوعی فارسی (کتاب). در عباس حری و نرگس نشاط (ویراستاران)، دایره المعارف کتابداری و اطلاع‌رسانی (ویراست نخست). تهران: سازمان اسناد و کتابخانه ملی ایران. بازیابی از: http://portal.nlai.ir/daka/Wiki%20Pages/%D8%B3%D8%B1%D8%B9%D9%86%D9%88%D8%A7%D9%86%20%D9 %81%D8%A7%D8%B1%D8%%83%D8%AA%D8%A7%D8%A8).aspx
سلطانی، پوری؛ راستین، فروردین (1379). دانشنامه کتابداری و اطلاع‌رسانی. ویراست 3. تهران: فرهنگ معاصر.
شهبازی، فرزاد؛ نوروزی، یعقوب؛ علیپور حافظی، مهدی (1393). بررسی میزان استفاده نرم‌افزارهای کتابخانه دیجیتالی ایران از ویژگی‌های نظام‌های خبره در بازیابی اطلاعات. پژوهشنامه پردازش و مدیریت اطلاعات، 30(3)، 823-851. بازیابی از:              http://jipm.irandoc.ac.ir/article-1-2589-fa.html
علیپورحافظی، حامد؛ حری، عباس؛ اسفندیاری مقدم، علیرضا؛ علیپور حافظی، مهدی (1392). تحلیل وضعیت سازماندهی منابع اطلاعاتی در کتابخانه‌های دیجیتالی ایران. پژوهشنامه پردازش و مدیریت اطلاعات، ۲۹(۱)، ۳۵-۵۹. بازیابی از: http://jipm.irandoc.ac.ir/article-fa.html
عمید، حسن (۱۳۸۹). فرهنگ فارسی عمید. تهران: اَشجَع. بازیابی از:
فتاحی، رحمت الله (1385). فهرستنویسی. در دایرﺓالمعارف کتابداری و اطلاع‌رسانی. ج 2. بازیابی از: http://portal.nlai.ir/daka/Wiki%20Pages/%D9%81%D9%87%D8%B1%D8%B3% 8A.aspx
فتاحی، رحمت الله؛ طاهری، مهدی (1384). فهرست‌نویسی: اصول روش‌ها. ویرایش 4. تهران: کتابدار.
فتاحی، رحمت الله؛ نیک زمان، امیر (1391). تحلیل جستجوهای موضوعی کاربران در فهرست رایانه‌ای به ‌لحاظ نوع و چگونگی همخوانی آن‌ها با سرعنوان‌های موضوعی فارسی (با استفاده از ثبت داد و گرفت). پژوهشنامه پردازش و مدیریت اطلاعات، ۲۸(۱)، ۲۵۱-۲۷۱. بازیابی از: http://jipm.irandoc.ac.ir/article-1-1802-fa.html
لطیفی، سعید؛ زارعی، عاطفه؛ غفاری، سعید (1394). نقش سرعنوان­های موضوعی فارسی در بازیابی منابع اطلاعاتی کودکان از دیدگاه کتابداران کتابخانه­های عمو می‌استان همدان. نظام­ها و خدمات اطلاعاتی، 4(3و4)، 81-92. https://iss.srbiau.ac.ir/article_9720.html?lang=fa
مرادی، خدیجه؛ حاجی زین العابدینی، محسن؛ لیلی، حمید (1392). داده‌های توصیفی و روابط کتاب‌شناختی در پیشینه‌های کتابشناختی کتابخانه‌های دیجیتالی ایران بر اساس استاندارد آر. دی. ای. فصلنامه مطالعات ملی کتابداری و سازماندهی اطلاعات، 24(2)، 22-40. بازیابی از: http://nastinfo.nlai.ir/article_69_3048cadf46d39230306736859f2821cf.pdf
معین، محمد. فرهنگ فارسی. بازیابی از: https://vajehyab.com/moein/%D9%B9
نوروزی، یعقوب؛ غلامی، طاهره؛ جعفری‌فر، نیره (1396). وضعیت کتابخانه‌های دیجیتالی ایران بعد از گذشت یک دهه چگونه است؟ فصلنامه مطالعات ملی کتابداری و سازماندهی اطلاعات، 28(4)، 147-170. بازیابی از: http://nastinfo.nlai.ir/article_2195_3914aa395fac32e1e99b78effcfdd081.pdf
 
References
Allahyari, M., Pouriyeh, S., Asefi, M., Safaei, S., Trippe, E. D., Gutierrez, J. B., & Kochut, K. (2017). A brief survry of text mining: Classification, clustering, and Extraction techniques. In Proceedings of KDD Bigdas, Holifax, Canada, August 2017. 13p.
American National Standards Institutes. (1997). Basic Criteria for Indexes. Bethesda, Maryland: NISO Press.
Amid, Hassan (2010). Amid Persian dictionary. Tehran: Ashja. Retrieved from http://www.vajehyab.com/?q=%D9%85%D9%88%D8%D8%B9&f=amid. (in Persian)
Anderson, J. D. (2006). Knowledge organization. Translated to Persian by Hamid Reza Jamali Mahmouei. In Encyclopedia of Library and Information Science, vol. 2. Afshar, E. (Editor in chief) and Nozari, S. (Co-editor). Retrieved from http://portal.nlai.ir/daka/Wiki%20Pages/%D8%B3%D8%A7%D9%86%D8%AF%D9%87%D9%8A%20%20%D8% %B4.aspx. (in Persian)
Arastoopoor, S., & Fattahi, R. (2012). Users' perception of aboutness and ofness in images: An approach towards subject indexing based on Ervin Panofsky's theory and users ' view. 12 th International ISKO Conference.
Banu, G. R., & Chitra, V. K. (2015). A suyvey of text mining concepts. International Journal of Innovation in Engineering and Technology (IJIET), 5(2), 121-127.
Berwick Sayer, W. C. (1954). An introduction to library classification: Theoretical, historical, and practical. 9th ed. London: Grafton.
Bliss, H. E. (1939). The organization of knowledge in libraries: And the subject approach to books. New York: Wilson.
Borko, H., & Bernier, C. L. (1978). Indexing: Concepts and methods. New York: Academic Press Inc.
Chan, L. M. (2007). Cataloging and Classification: An Introduction, 3rd ed. Lanham, MD: Scarecrow Press.
Chu, C., & O'Brien, A. (1993). Subject analysis: The critical first stage in indexing. Journal of Information Science, 19(6), 439-54.
Cutter, C. A. (1904). Rules for a Dictionary Catalog. 4th ed. Washington, DC: Government Printing Office.
Dehkhoda, Ali Akbar (2020). Dehkhoda Dictionary (Digital version) Based on the 15-volume physical version, published in 1998. Dehkhoda Dictionary Institute and International Center for Persian Language Teaching, University of Tehran. Retrieved from https://dehkhoda.ut.ac.ir/fa/dictionary/309078/%D9%85%D9%88%D8%B9. (in Persian)
Dewey, M. (2011). Dewey Decimal Classification. 23rd ed. Dublin, OH: OCLC Online Computer Library Center.
Diao, J. (2018). Evolution of Western Library Catalogs: The Rising Expectations of Users. International Journal of Librarianship, 3(1), 78-93.
Dutta, B., & Dutta, C. (2013). Concept of ‘subject’ in the context of library and information science from a new angle. Annals of Library and Information Studies, 2013, 60(2), 78-87. Retrieved from http://eprints.rclis.org/19813/
Fairthorne, R. A. (1969). Content Analysis, Specification, and Control. Annual Review of Information Science and Technology, 4, 73-109.
Farradane, J. (1980). Relational Indexing, Part II. Journal of Information Science, 1(6), 313–14.
Fattahi, R, & Nikzaman, A. (2012). An Analysis of the Match between the Forms and Vocabulary of Users' Subject Queries with the Persian Subject Headings in a University OPAC. Iranian Journal of Information Processing and Management, 28(1), 251-271. Retrieved from http://jipm.irandoc.ac.ir/article-1-1802-fa.html. (in Persian)
Fattahi, R., & Taheri, M. (2005). Cataloging: Principles and methods. 4th ed. Tehran: Ketabdar. (in Persian)
Fattahi, R. (2006). Cataloging In Encyclopedia of Library and Information Science, vol. 2. Afshar, E. (Editor in chief) and Nozari, S. (Co-editor). Retrieved from http://portal.nlai.ir/daka/Wiki%20Pages/%D9%81%D9%87%D8%B1%D8%B3%D8%AA%D9%86%D9%88%D9%8A%D8%B3%D9%8A.aspx. (in Persian)
Functional requirements for subject authority data (FRSAD): a conceptual model. (2011). Edited by Marcia Lei Zeng, Maja Žumer and Athena Salaba. München: De Gruyter Saur. (IFLA series on bibliographic control; vol. 43). Retrieved from http://www.ifla.org/files/assets/classification-and-indexing/functional-requirements-for-subject-authority-data/frsad-final-report.pdf
Gil- Leiva, I. (2017). SISA- automatic indexing system for scientific articles: Experiments with location heuristics rules versus TF.IDF rules. Knowledge Organization, 44(3), 139-162.
Guthrie, L. S. (1992). An Overview of Medieval Library Cataloging, Cataloging & Classification Quarterly, 15(3), 93-100. DOI: 10.1300/J104v15n03_07
Hamid, F. (2016). Evaluation techniques and graph-based algorithm for automatic summarization and keyphrase extraction. (Doctoral dissertation). Available from ProQuest Dissertations & Theses Global database. (UMI No. 10307512)
Hjørland, B. (2018a). Indexing: Concepts and theory. In ISKO Encyclopedia of Knowledge Organization, eds. Birger Hjørland, coed. Claudio Gnoli. Retrieved from http://www.isko.org/cyclo/indexing
Hjørland, B. (2018b). Subject (of documents). Knowledge Organization, 44(1), 55-64. Also available in ISKO Encyclopedia of Knowledge Organization, ed. Birger Hjørland, coed. Claudio Gnoli. Retrieved from http://www.isko.org/cyclo/subject
Holley R. M., & Joudrey, D, N. (2020). Aboutness and conceptual analysis: A review. Cataloging & Classification Quarterly.
Hutchins, W. J. (1978). The concept of 'aboutness' in subject indexing. Aslib Proceedings, 30(5), 172-181. Retrieved from https://doi.org/10.1108/eb050629
Hutchins, W. J. (1975). Languages of Indexing and Classification. Herts, England: Peter Peregrinus.
Goh, R. (2018). Using Named Entity Recognition for Automatic Indexing. Paper presented at the IFLA WLIC, 2018, Kuala Lumpur, Malaysia.
Golube, K., Hagelbach, J., & Ardo, A. (2018). Automatic classification using DDC on the Swedish Union Catalogue. CEUR-WS.org/vol-2200/paper1.pdf
Gopinath, M. (1976). Colon classification. In Classification in the 1970s: A second look. edited by Arthur Meltby (rev. ed. Pp. 51-80). London: Clive Bingly.
Hurtado, J. L. (2016). Text mining and topic modeling for social and medical decision support. (Doctoral dissertation). Available from ProQuest Dissertations & Thesis Global database. (UMI No. 10583055)
IFLA Library Reference Model: A conceptual model for bibliographic information (2017). Edited by Pat Riva, Patrick Le Boeuf, and Maja Zumer. Retrieved from https://www.ifla.org/files/assets/cataloguing/frbr-lrm/ifla-lrm-august-2017_rev201712.pdf
International Organization for Standardization (ISO). (1985). Documentation - Methods for Examining Documents, determining their Subjects and Selecting Indexing Terms (ISO 5963-1985). Geneva: International Organization for Standardization.
International Organization for Standardization (ISO). (2017). Documentation -
Information and documentation — Foundation and vocabulary (ISO 5127-2017).
Geneva: International Organization for Standardization. Retrieved from https://www.iso.org/obp/ui/#iso:std:iso:5127:ed-2:v1:en
Joudrey, D. N. & Taylor, A. G. (2018). The Organization of Information. 4th ed. Santa Barbara, CA: Libraries Unlimited.
Junger, U. (2018). Automated first- The subject cataloguing policy of the Deutsche Nationalbibliottek. Paper presented at: IFLA WLIC 2018- Kuala Lumpur, Malaysia- Transform Libraries, Transform Societies in session 115- Subject Analysis and Access. Retrieved from http://library.ifla.org/2213/1/115-junger-en.pdf
Kaiser, J. (1911). Systematic indexing. London: Isaac Pitman & Sons.
Khodaparasti, Farajollah (1997). A comprehensive dictionary of persian synonyms & antonyms. Shiraz: Persian Encyclopedia. Retrieved from https://vajehyab.com/motaradef/%D9%85%D9%88%D8%B6%D9%88%B9. (in Persian)
Khoshian, N., & Mirzaeian, V. (2020). The Most Widely Used Functions of Natural Language Processing in the Field of Library Science and Information Science. Knowledge Retrieval and Semantic Systems, 6(23), 117-151. (in Persian)
Lancaster, F. W. (2003). Indexing and Abstracting in Theory and Practice. 3rd ed. Champaign, IL: University of Illinois).
Lancaster, F. W., Elliker, C., & Harkness, T. (1998). Subject analysis. Annual Review of Information Science and Technology (ARIST), 24, 35-84.
Latifi, S., zarei, A., & Ghaffari, S. (2015). Studying the role of Persian Subject Headings in retrieving the children information resources from the Perspective of Librarians of‌ Hamadan‌ Province public libraries. Journal of Information Systems and Services, 4(4), 81-92. Retrieved from https://iss.srbiau.ac.ir/article_9720.html?lang=en. (in Persian)
Lazemi, S., Ebrahimpour-Komleh, H., & Noroozi, N. (2019). PAKE: A supervised approach for Persian automatic keyword extraction using statistical features. Springer Nature Applied Science, 1, 1574. DOI: 10.1007/s42452-019-1627-5
Library of Congress (2020). H 180: Assigning and Constructing Subject Headings, List of the Subject Heading[s] Manual. Retrieved from https://www.loc.gov/aba/publications/FreeSHM/H0180.pdf
Mai, J. E. (2000). The Subject Indexing Process: an investigation of problems in knowledge representation (Doctoral dissertation). Retrieved from http://jenserikmai.info/Papers/2000_PhDdiss.pdf
Margolis, E., & Laurence, S. (2019). Concepts, In The Stanford Encyclopedia of Philosophy, Edward N. Zalta (ed.). Retrieved from https://plato.stanford.edu/cgi-bin/encyclopedia/archinfo.cgi?entry=concepts
Metcalfe, J. (1973). When is a Subject Not a Subject? In Towards a Theory of Librarianship, ed. by C. H. Rawski. 303-338. New York: Scarecrow Press.
Meng, R., Zhao, S., Han, Sh., He, D., Brusilovski, P., & Chi, Y. (2017). Deep keyphrase generation. ACL 2017. DOI: 10.18653/v1/P17-1057
Miksa, F. (1983). The Subject in the Dictionary Catalog from Cutter to the Present. Chicago: ALA.
Miksa, S. D. (2021). Cataloging Principles and Objectives: History and Development. Cataloging & Classification Quarterly, 59(2-3), 97-128.
Mo'in, M. Persian Dictionary [online]. Retrieved from https://vajehyab.com/moein/%D9%85%D9%88%D8%B6%D9%88%D8%B9/. (in Persian)
Moradi, K., Haji Zainul Abedini, M., & Dalil, H. (2013). Descriptive data and bibliographic relationships in the bibliographic records of digital libraries of Iran based on Resource Description and Access (RDA) Standard. Librarianship and Information Organization Studies, 24(2), 22-40. Retrieved from http://nastinfo.nlai.ir/article_69.html?lang=en. (in Persian)
Norouzi, Y., Gholami, T., & Jafarifar, N. (2018). What is the Situation of Iranian Digital Libraries after a Decade? Librarianship and Information Organization Studies, 28(4), 147-170. Retrieved from http://nastinfo.nlai.ir/article_2195.html?lang=en. (in Persian)
Pokorny, J. (2018). Automatic subject indexing and classification using text recognition and computer based analysis of the table of contents. In Chau, L., & Mounier, P. ELPUB 2018. June 2018, Toronto, Canada. DOI: 10.4000/proceedings.elpub.2018.19.
Porter, A. H. (2018). The Cambridge introduction to narrative. Translated by Roya PourAzar and Nima M. Ashrafi. Tehran: Atraf. (in Persian)
Pourahmad, A. A., & Hassani, M. R. (2008). Subject cataloging: Principles and methods. Edited by R. Fattahi. Tehran: Ketabdar. (in Persian)
Ranganathan, S. R. (1967). Prolegomena to library classification. 3rd ed. London: Asia Publishing House.
Razi. Farideh (1993). A dictionary of pure Persian words for the Arabic loan-words in contemporary Persian. Tehran: Center Publication. Retrieved from https://vajehyab.com/sareh/%D9%85%D9%88%D8%B6%D9%88%D8%B9. (in Persian)
Reynolds, S. J. (1989). In theory there is no solution: The impediments to a subject cataloging code. Library Quarterly, 59(3), 231–32.
Rose, S., Engel, D., Cramer, N., & Cowley, W. (2010). Automatic keyword extraction from individual documents. In Text mining: Application and theory, edited by Berry, M. W. and Koga, J. Wiley & Sons, pp. 3-20. DOI: 10.1002/9780470689446.ch1
Sepehr, Fereshteh, and Abazari, Zahra (2016). Using ontology in Iranian digital libraries: A Feasibility study. Paper presented at the Second International Conference on Web Research, Tehran. (in Persian)
Shahbazi, F., Norouzi, Y., & Alipour-Hafezi, M. (2015). Evaluation of using expert system features in information retrieval in Iranian digital library software. Iranian Journal of Information Processing and Management, 30(3), 823-851. Retrieved from http://jipm.irandoc.ac.ir/article-1-2589-fa.html. (in Persian)
Short, M. (2019). Text mining and subject analysis for fiction; or, using machine learning and information extraction to assign subject headings to dime novels. Cataloging and Classification Quarterly, 57(5), 315-336. DOI: 10.1080/01639374.2019.1653413
Siddiqi, S., & Sheram, A. (2015). Keyword and keyphrase extraction techniques: A literature review. International Journal of Computer Applications, 109(2). DOI: 10.5120/19161-0607
Soltani, P. (1972). Colon Classification. Iranian Librarians Association Newsletter, 5(3), 115-120. (in Persian)
Soltani, Pouri (2002). Persian subject headings (book). In Abbas Hori and Narges Neshat (Editors), Encyclopedia of Library and Information Science (first edition). Tehran: National Archives and Library of Iran. Retrieved from http://portal.nlai.ir/daka/Wiki%20Pages/%D8%B3%D8%B1%D8%B9%D9%86%D9%88%D8%A7%D9%86%D9%8A(%D9%83%D8%AA%D8%A7%D8%A8).aspx. (in Persian)
Soltani, P., & Rastin, F. (2000). Encyclopedia of Library and Information Science. 3rd Ed. Tehran: Farhang-e Mo'aser.
Sun, C., Hu, L., Li, S., Li, T., Li, H., & Chi, L. (2020). A review of unsupervised key phrase extraction methods using within-collection resources. Symmetry, 12(1864). DOI:10.3390/sym12111864
Tchoua, R. B. (2019). Hybrid human-machine scientific information extraction. (Doctoral dissertation). Available from ProQuest Dissertations & Theses Global database. (UMI No. 13904924)
Tushara, M. G., Mownika, T., & Mangamuru, R. (2019). A comparative study on different keyword extraction algorithms. In Proceedings of the Third International Conference on Computing Methodologies and Communication (ICCMC 2019), Erode. India. 969-973
Vickery, B. C. (1968). Analysis of information. In Encyclopedia of library and information science, vol. 1, edited by A. Kent and H. Lancour. New York: Dekker, 355-384.
Vickery, B. C., & Vickery, A. (2004). Information science in theory and practice. 3rd ed. München: K. G. Saur.
Wongchaisuwat, P. (2018). Topics in document classification. (Doctoral dissertation). Available from ProQuest Dissertations & Theses Global database. (UMI No. 10749400)
Wellisch, H. H. (1991). Indexing from A to Z. New York: Wilson.
Wilson, P. (1968). Two kinds of power: An essay on bibliographic control. Berkeley, CA: University of California Press.