درباره «موضوع» و «تحلیل موضوعی»: نکته ها و چشم اندازها

نوع مقاله : مقاله پژوهشی

نویسندگان

1 عضو هیئت علمی سازمان اسناد و کتابخانه ملی ایران

2 ، استاد گروه علم اطلاعات و دانش‏شناسی، دانشکده علوم تربیتی و روان شناسی ، دانشگاه خوارزمی، تهران، ایران.

3 استادیار گروه علوم کامپیوتر، دانشکده علوم ریاضی و کامپیوتر، دانشگاه خوارزمی، تهران، ایران.

4 استاد گروه مهندسی فناوری اطلاعات، دانشکده مهندسی صنایع و سیستم‌ها دانشگاه تربیت مدرس، تهران، ایران

10.30481/lis.2022.349952.1979

چکیده

هدف: با توجه به اهمیت بازیابی موضوعات منابع اطلاعاتی و جستجوی موضوعی کاربران ، در این پژوهش چیستی«موضوع» و چگونگی تحلیل و استخراج موضوعات در فرایند تعیین کلیدواژه های موضوعی، و مسائل و راه حل‌های ممکن مورد بحث قرار می گیرند.
روش پژوهش: این مقاله پژوهشی مفهومی است که با روش کتابخانه ای- سندی مفاهیم «موضوع» و «تحلیل موضوعی» را در گزیده ای از متون شاخص علم اطلاعات و دانش شناسی با نگاهی بر مفاهیم متناظر در حوزه پردازش زبان طبیعی بررسی می کند.
یافته‌ها: «موضوع» یا «دربارگی» منابع و تحلیل موضوعی عبارت است از شناسایی موضوعات و مفاهیم مندرج در منبع اطلاعاتی با قوای فکری نیروی انسانی، با الگوریتم‌های کامپیوتری، یا ترکیب این دو. تعدد ابزارهای تحلیل موضوعی و انتساب کلیدواژه‌ها، میزان پایین کاربرد طرح‌های استاندارد توصیف، عدم همگونی در تحلیل موضوعی، عدم همخوانی عبارت‌های جستجوی کاربران با کلیدواژه‌های انتساب داده شده، و روزآمد نبودن توصیف منابع از نقاط ضعف رویکرد تحلیل موضوعی توسط انسان است. روش‌های خودکار هوش مصنوعی و پردازش زبان طبیعی توان افزایش سرعت و یکدستی در فرایندهای مختلف توصیف و سازماندهی اطلاعات و از جمله استخراج کلیدواژه های موضوعی را دارند، اما ارزیابی کارآمدی خروجی این روش‌ها، به تنهایی، یا در مقایسه با کلیدواژه‌های تولید انسان، و از دیدگاه‌های مختلف ضروری است.
نتیجه‌گیری: کتابخانه‌ها و مراکز اطلاع‌رسانی می‌توانند به دور از شتابزدگی، از روش‌های پردازش زبان طبیعی و هوش مصنوعی در تحلیل موضوعی و انتساب یا استخراج کلیدواژه-های موضوعی استفاده کنند و نیروی انسان را در ارتقاء کیفیت خدمات و فرایندها به کارگیرند.

کلیدواژه‌ها


عنوان مقاله [English]

About "Subject" and "Subject Analysis": Viewpoints and Perspectives

نویسندگان [English]

  • Farzaneh Shadanpour 1
  • Nosrat Riahinia 2
  • Keyvan Borna 3
  • Gholam Ali Montazer 4
1 Faculty member/ Iran National Library and Archives
2 Professor, Department of Knowledge and Information Science, Faculty of Education and Psychology, Kharazmi University, Tehran, Iran
3 Assistant Professor, Department of Mathematics and Computer Science, Faculty of Computer Science, Kharazmi University, Tehran, Iran
4 Professor, Department of Information Technology, Faculty of Industrial/ Systems Engineering, University of Tarbiat- Modarres, Tehran, Iran.
چکیده [English]

Objective:Since the discovery and representation of subjects contained in information resources is the most important goal in information description, analysis and retrieval systems, and since subject search is the most common type of user search in databases and library catalogs, in this study what is "subject" and how to analyze and extract subject matters in the process of determining subject keywords for an information resource, as well as some research and operational perspectives are discussed.
Methods:This conceptual paper uses documentary research method to examine the concepts of "subject" and "subject analysis", presented in a selection of related research works in the field of Information Science, as well as considering some corresponding concepts in the field of Computer Science and Natural Language Processing.
Results: Despite various interpretations of what "subject" is, which some assume to be an axiom, and its definition unnecessary, there is consensus, explicitly or implicitly, on its meaning of "aboutness". Subject analysis of information resources, as part of the indexing process, is the analysis and identification of stated topics and concepts and / or obvious features of the information source that may involve manpower, computer algorithms designed to identify textual terms, or the combination of the two is done. Each of these methods has its strengths and weaknesses. Search and retrieval problems due to the multiplicity of subject analysis tools and keyword assignment, low usage rate of standard descriptive schemas, inconsistencies between indexed terms assigned by a single indexer at different times, as well as between multiple indexers for the same information resource, human error in general, the inconsistency of users' search terms with the assigned keywords, and the lack of on time description of resources due to the growing production of them are among the weaknesses of the human subject analysis approach. The application of automated methods of artificial intelligence and natural language processing offers promising prospects for increasing speed and consistency in various processes of describing and organizing information, including the extraction of subject keywords. However, evaluating the efficiency of the output of these methods, alone or in comparison with the keywords of human production, specially from the perspective of users, is required.
Conclusion: In the competition of machine algorithms with the human mind in the analysis and recognition of resource subjects, the human mind excels; whether it is an indexer who expresses in his own language what the source is about, or a designer who can design a machine that mimics the computational steps of his mind to saves time and resources. Libraries and information centers can, far from rushing to replace conventional processes and procedures, use the various methods and tools available from the Natural Language Processing and Machine Learning fields to design and develop automated systems for indexing and extracting or assigning subject keywords - and in the larger perspective, automated classification- to use resources (financial, human, and time) for the ultimate goal of maximizing productivity, shortening the subject access path to resources for users, and facilitating the description process.

کلیدواژه‌ها [English]

  • 'Subject
  • '
  • 'Subject Analysis'
  • 'Subject Indexing'
  • 'Natural Language Processing'