چالش‌های بازیابی نام‌های پژوهشگران در مخازن اطلاعاتی: مطالعه موردی (سامانه اطلاعات علمی دانشگاه فردوسی مشهد)

نوع مقاله : مقاله پژوهشی

نویسنده

گروه علم اطلاعات و دانش‌شناسی، دانشکده ادبیات و علوم انسانی، دانشگاه زابل، زابل، ایران

چکیده

هدف: یکی از مهمترین شناسه‌­هایی که کاربران هر نظام اطلاعاتی در جستجوهای خود از آن بهره می‌­برند، شناسه نام پدیدآور است. بنابراین طراحان و مدیران هر نظام اطلاعاتی همواره در پی آن هستند تا کیفیت بازیابی محتوا را بر اساس جستجوی نام پدیدآورنده بهبود بخشند. محتوای مخازن اطلاعاتی و کیفیت ارائه خدمات در آن­ها متأثر از کیفیت و چگونگی ذخیره و بازیابی نام‌­های اشخاص است. هدف مقاله حاضر، بررسی مشکلات و چالش‌­های جستجوی نام اشخاص در مخازن سازمانی دانشگاهی از جنبه کاربردی آن است.
روش: به منظور بررسی چالش­‌های عملی جستجوی نام پژوهشگران در مخزن سازمانی دانشگاه فردوسی مشهد، از روش ارزیابانه و مشاهده استفاده گردید. در این روش، از اندازه‌گیری عملکرد که نوع اختصاصی‌­تری از پژوهش ارزیابانه است، استفاده شده است. بر این اساس، در این پژوهش تلاش شده است تا عملکرد موتور جستجوی سامانه مخزن دانشگاه فردوسی مشهد از جهت جستجوی نام اشخاص دارای ابهام مورد بررسی قرار گیرد.
یافته­‌ها: با وجود حجم نسبتاً کم اطلاعات در این مخزن در مقایسه با مخازن سازمانی خیلی بزرگ، بررسی جستجو بر اساس نام پدیدآور در این مخزن سازمانی نشان داد مسائل و چالش­‌های مربوط به جستجوی نام در این مخزن نیز وجود دارد. درصد بالایی از نام‌های خانوادگی مشابه نشان داد که کاربران مجبورند در بسیاری از جستجوها علاوه بر نام خانوادگی از نام کوچک افراد نیز آگاه باشند. حدود 40 درصد از اسامی چندبخشی یا مرکب بودند که به دلایل مختلف باعث ایجاد بازیافت نامربوط یا کم مربوط می­‌گردند.
نتیجه­‌گیری: مستندسازی اسامی پژوهشگران در سطح ملی و بین­‌المللی از جمله مهمترین و اثرگذارترین راهکارهای برون­‌رفت از چالش جستجوی نام­‌ها است. ضروری است تا از پژوهشگران خواسته شود اطلاعات خود را با دقت در سامان‌ه­ای جامع وارد نمایند و کتابداران نیز به صورت دستی نام آن­‌ها را کنترل و مستند نمایند. به این ترتیب نظام ملی کنترل مستند نام­‌های پژوهشگران ایرانی به زبان فارسی و انگلیسی پدید می­‌آید که می‌­تواند استفاده‌­های فراوانی داشته و مشکلات جستجو بر اساس نام را تا حدود زیادی مرتفع سازد.

کلیدواژه‌ها


عنوان مقاله [English]

Challenges of Retrieving Researchers' Names in Information Repositories: A Case Study (Scientific Information System of Ferdowsi University of Mashhad)

نویسنده [English]

  • Hedayat Behroozfar
Department of Knowledge and Information Science, Faculty of Literature and Humanities, University Of Zabol, Zabol, Iran
چکیده [English]

Objective: One of the most important identifiers that users of any information system use in their searches is the author name identifier. Therefore, the designers and managers of any information system are always looking to improve the quality of content retrieval based on the search for the author's name. The content of information repositories and the quality of service delivery in them is affected by the quality and manner of storing and retrieving personal names. The purpose of this article is to investigate the problems and challenges of searching for the names of individuals in academic organizational repositories from its practical aspect.
Methodology: In order to investigate the practical challenges of searching for researchers in the organizational repository of Ferdowsi University of Mashhad, the evaluation and observation methods were used. In this method, performance measurement, which is a more specific type of evaluative research, is used. Accordingly, in this study, an attempt has been made to investigate the performance of the search engine of the reservoir system of Ferdowsi University of Mashhad in order to search for the names of ambiguous persons.
Findings: Despite the relatively small amount of information in this repository compared to very large organizational repositories, a search based on the name of the author in this organizational repository showed that there are issues and challenges related to name retrieval in this repository. A high percentage of similar surnames indicated that users had to be aware of people's first and last names in addition to surnames in many searches. About 40 percent of the names were multi-part or compound, which for various reasons lead to irrelevant or less relevant retrieving.
Conclusion: Given that all the ambiguous names extracted from the researchers' Name List in the Ferdowsi University of Mashhad repository were searched in order to examine the performance of the search, the result indicated that there were challenges in searching for the names of individuals and the designed system could not display related results. In general, it can be said that the organizational repository of Ferdowsi University of Mashhad, when searching for the ambiguous names, has problems and confusion due to the similarity of the individual' names, or due to language problems and It's spelling. Authority control of the names of the researchers nationally and internationally is one of the most important and effective ways out of the challenge of the name searching. It is necessary to ask researchers to enter their information carefully in comprehensive systems and librarians to manually control the authority of their names. In this way, a national system of authority control of Iranian researchers in Persian and English languages emerges, which can have many uses and solve the problems of searching by name to a large extent.
 

کلیدواژه‌ها [English]

  • Authority control
  • Information retrieval
  • Organizational repositories
  • Names
  • Scientific information systems
آخشیک، سمیه؛ فتاحی، رحمت الله (1391). تحلیل چالش‌های پیوسته‌نویسی و جدانویسی واژگان فارسی در ذخیره و بازیابی اطلاعات در پایگاه‌های اطلاعاتی. کتابداری و اطلاع‌­رسانی، 15(3)، 9-30.
پاول، ار. رونالد (1379). روش­های اساسی پژوهش برای کتابداران (نجلا حریری، مترجم). تهران: مرکز انتشارات علمی دانشگاه آزاد اسلامی (نشر اثر اصلی 1997).
پریرخ، مهری؛ زاهدی نوقابی، مهدی (1390). بررسی مخزن سازمانی دانشگاه فردوسی مشهد و سنجش میزان همخوانی آن با معیارهای تخصصی. علوم و فناوری اطلاعات، 26(3)، 519-545.
زاهدی نوقابی، مهدی (1389). بررسی مخازن سازمانی دانشگاه فردوسی مشهد و سازگاری آن با معیارهای علمی (پایان­‌نامه کارشناسی ارشد). دانشگاه فردوسی مشهد، دانشکده علوم تربیتی و روان‌شناسی.
زاهدی نوقابی، مهدی (1394). تحلیل عامل­‌های اثرگذار بر پیاده­‌سازی مخازن سازمانی در دانشگاه‌­ها و مراکز علمی بر پایه نظریه‌های سیستم‌­های اطلاعاتی. پژوهشنامه کتابداری واطلاع­‌رسانی، 5(1)، 280-300.
مرتضوی، سید محمد؛ ندیمی شهرکی، محمدحسین؛ موسی خانی، مصطفی (1396). بهبود صحت ابهام­زدایی نام نویسنده با استفاده از خوشه­‌بندی تجمعی. پردازش علائم و داده‌­ها، 34(4)، 117-127.
مظفری، نیلوفر (1399). ارائه روشی مبتنی بر ژنتیک برای رفع ابهام نام نویسندگان مقالات. پردازش و مدیریت اطلاعات، 36(3)، 791-816.
References
Akhshik, S., Fattahi, R. (2012). Analyzing the Challenges of writing Persian Vocabulary in Continuous and Separate format in Storing and Retrieving Information in Databases. Library & Information Sciences, 15(3), 9-30. (in Persian)
 Bansode, S. Y. (2011). Developing institutional repository in university library: A case study of University of Pune. International Journal of Information Dissemination and Technology, 4,188-192. Available at: https://www.ijidt.com/index.php/ijidt/article/view/32/32.
Cannan, J. P., Frank, P., & Hawkins, L. (2019) LC/NACO Authority File in the Library of Congress BIBFRAME Pilots, Journal of Library Metadata, 19, 1-2, 39-51. DOI: 10.1080/19386389.2019.1589693
Carver, B. (2003). Creating an institutional repository: a role for librarians. ExLibris, 181, Retrieved May 18, 2014 from http://marylaine.com/exlibris/xlib181.html
Cleveland, G. (1998). Digital libraries: definitions, issues and challenges. IFLA Universal Dataflow and Telecommunications Core Program, Occasional Paper 8, Retrieved March 18, 2014 from www.ifla.org/VI/5/op/udtop8/udtop8.htm
Elliott, S. (2010). Survey of Author Name Disambiguation: 2004 to 2010. Library Philosophy and Practice (e-journal), paper 473, Retrieved May 18, 2014 from http://digitalcommons.unl.edu/libphilprac/473/
Fattahi, R. (1997). AACR2 and Catalogue Production Technology: Relevance of cataloguing principles to the online environment in The Principles and Future Development of AACR: Proceedings of the International Conference on the principles and Future Development of AACR, Toronto, 23-25 October 1997. Edited by Jean Weihs.-- Chicago: ALA, Canadian Library Association, Library Association, 17-43.
Gu, S., Xu, X., Zhu, J., & Ji, l. (2016). Name Disambiguation Method based on Multi-step Clustering. The 7th International Conference on Ambient Systems, Networks and Technologies, 488-495. doi: 10.1016/j.procs.2016.04.237
Han, H., et al. (2004). Proceedings of the 4th ACM/IEEE-CS joint conference on Digital libraries, Tuscon, AZ, 296-305. Retrieved April 19, 2018 from http://doi.acm.org/10.1145/996350.996419
Hill, A. (2008). "What's in a name?" Prototyping a name authority service for UK repositories. Proceedings of the 10th International Conference of the International Society of Knowledge Organization.  Montreal, Canada.  Retrieved March 22, 2014 from http://names.mimas.ac.uk/documents/Names_ISKO2008_paper.pdf
Lynch, C. A. (2003). Institutional repositories: essential infrastructure for scholarship in the digital age. ARL Bimonthly Report, 226, Retrieved March 18, 2014 from http://www.arl.org/newsltr/226/ir.html
McKay, D., Sanchez, S., & Parker, R. (2010). What’s My Name Again? Sociotechnical Considerations for Author Name Management in Research Databases. In OZCHI 2010 Proceedings. OZCHI 2010, November 22-26, Brisbane: ACM digital library.
Mortazavi, S., Nadimi Shahraki, M., & Mosakhani, M. (2018). Improving the accuracy of the author name disambiguation by using clustering ensemble. Signal & Data Processing, 14(4), 117-127. (in Persian)
Mozafari, N. (2021). A Genetic-based Approach for Author Name Disambiguation Problem. Iranian Journal of Information Processing Management, 36(3), 791-816. (in Persian)
Qiu, J. (2008). Scientific publishing: Identity crisis. Nature, 451, 766-767.
Parirokh, M., & Zahedi Nooghabi, M. (2011). A Study of Institutional Repository of Ferdowsi University of Mashhad (FUM), and its Compatibility with Scientific Criteria. Iranian Journal of Information Processing Management, 26(3), 519-545. (in Persian)
Powell, R. R. (1997). Basic research methods for librarians. Tehran: Scientific Publishing Center of Azad Islamic University. (in Persian)
Ratanya, F. C. (2017). Institutional repository: Access and use by academic staff at Egerton University, Kenya. Library Management, Vol.38, no.4/5, Available at:  http://dx.doi.org/10.1108/LM-02-2017- 0018.
Rozum, B.,  & Thomas, B. (2016). Populating your institutional repository and promoting your students: IRs and undergraduate research. In making institutional repositories work (pp.311-318) WestLafayette, IN: Purdue University Press. Available at: https://digitalcommons.usu.edu/cgi/viewcontent.cgi?article=1248&context=lib_pubs.
Salo, D. (2009). Name Authority Control in Institutional Repositories. Cataloging & Classification Quarterly, 47(3), 249-261. Retrieved April 9, 2018 from http://dx.doi.org/10.1080/01639370902737232
Sanyal, D. K., bhowmick, P. K. & Das, P. P. (2019). A review of author name disambiguation techniques for the PubMed bibliographic database. Journal of Information Science, 1-28. DOI: 10.1177/0165551519888605
Smalheiser, N. & Torvik, V. (2009). Author name disambiguation. in B. Cronin, Annual Review of Information Science and Technology, 43, pp. 287-313.
Sun, S., Chang, H., Li, N. & Chen, Y. (2017). Name Disambiguation for Chinese Scientific Authors with Multi-level Clustering. In: EEE International Conference on Computational Science and Engineering (CSE) and IEEE International Conference on Embedded and Ubiquitous Computing (EUC). DOI 10.1109/CSE-EUC.2017.39
Veve, M. (2009). Supporting Name Authority Control in XML Metadata: A Practical Approach at the University of Tennessee. Library Resources &Technical Services, 53(1), 41-52. Retrieved May 15, 2018 from http://search.ebscohost.com/login.aspx?direct=true&dblive
Wikipedia (2014). Institutional repositories. Retrieved May 18, 2018 from http://en.wikipedia.org/wiki/ Institutional_repository
Xia, J. (2006). Personal name identification in the practice of digital repositories. Program: ElectronicLibrary & Information Systems, 40(3), pp. 256-267.
Zahedi Nooghabi, M. (2010). Investigation of organizational repositories of Ferdowsi University of Mashhad and its compatibility with scientific criteria (master's thesis). Ferdowsi University of Mashhad, Faculty of Educational Sciences and Psychology. (in Persian)
Zahedi Nooghabi, M. (2015). An Analysis of the Factors Affecting the Institutional Repositories Development in Universities based on the Information Systems Theories. Library & Information Science Research, 5(1), 280-300. (in Persian)
Zhang, Y., Zhang, F., & Yao, P. (2018). Name disambiguation in AMiner: clustering, maintenance, and human in the loop. In: Proceedings of the 24th ACM SIGKDD international conference on knowledge discovery & data mining, London, 19–23 August 2018, pp. 1002–1011. New York: ACM.