نوع مقاله : مقاله پژوهشی
نویسنده
دانشجوی دورة دکتری کتابداری و اطلاعرسانی دانشگاه فردوسی مشهد
چکیده
کلیدواژهها
"ساختار زبان ما، تا حدود زیادی بر نوع درک ما از جهان تأثیر میگذارد. فرضیه سایپر- ورف[1]"
مقدمه
زبان، نظامی از نشانههای زبانی[2]، روابط میان این نشانهها و قراردادهای اجتماعی است (مشکوه الدینی، 1373) که مؤلفان به عنوان ابزاری برای بازنمون اندیشه، از آن بهره میگیرند. دستاندرکاران سازماندهی اطلاعات نیز برای بازنمون محتوای اطلاعاتی مدارک در نظامهای ذخیره و بازیابی اطلاعات، از سویی با زبان مؤلفان اطلاعات، و از سوی دیگر با زبان نظامهای ذخیره و بازیابی اطلاعات، و در نهایت با زبان کاربران جستجوکنندة اطلاعات روبرویند، که باید این سه عنصر را در یک نظام مورد توجه قراردهند (زندیروان، 1385). نظام ذخیره و بازیابی برای بازنمون یا نمایهسازی اطلاعات، یکی از زبانهای آزاد[3]، مهار شده یا مقید[4] و اصطلاحنامهای[5]، یا تلفیقی از زبانهای یادشده را، انتخاب میکند. این انتخاب بنا به نوع و ماهیت اطلاعاتی که قرار است در نظام ذخیره شود و همچنین بافت جامعه استفادهکننده از این اطلاعات، انجام میپذیرد (نیکلسون[6]، دانزایر[7]، نیل[8]، 2002). استفاده از زبان مهار شده در برابر زبان مهار نشده، به تفاوت عمیق بین نظامهای مختلف ذخیره و بازیابی در این زمینه منجر میشود، زیرا بهکارگیری هر نوعی از «مهار»[9]، مستلزم اعمال تغییراتی در زبان طبیعی و تبدیل آن به زبان نمایهسازی برای نظام است. حصول ربطِ مورد انتظار در نتایج بازیابی اطلاعات، تنها زمانی میسر خواهد بود که طراحان نظامهای ذخیره و بازیابی اطلاعات، زبان مؤلف، زبان کاربر و زبان نظام را بر مبنای دیدگاه سیبرنتیکی در یک کلیّت مورد توجه قرار دهند و هیچ یک از زبانهای یاد شده، یا ویژگیهای آنها را در طراحی خود حذف نکنند. نظام ذخیره و بازیابی اطلاعات با بهکارگیری یک زبان نمایهسازی، تلاش میکند میان کاربر و مؤلف فضای مفاهمه ایجاد کند، تا از این طریق تعاملات اثربخش، برای جریان یافتن اطلاعات شکل گیرد. آنچه در این عرصه فراروی سیاستگذاران و طراحان نظامهای ذخیره و بازیابی اطلاعات قرار دارد: انتخاب پایگاهی از واژگان برای بازنمون اطلاعات، ابهامزدایی از مفهوم واژه[10] برای نظام ذخیره و بازیابی اطلاعات و در نهایت، تعریف دستوری[11] برای ترکیب واژگان نظام در حین سازماندهی اطلاعات و همچنین قواعدی برای ترکیب این واژگان در حین بازیابی اطلاعات است. نوع جهتگیری سیاستگذاران و طراحان نظام نسبت به این خط مشی بنیانی، به شکلگیری زبان نظام ذخیره و بازیابی اطلاعات با ساختاری متفاوت از زبان طبیعی میانجامد. انتخاب مجموعهای از واژگان که برخاسته از زبان طبیعی یا زبان تخصصی در یک حوزة موضوعی خاص است، همراه با اعمال تغییراتی در آن همچون استفاده از فهرست سیاهه بازدارنده[12]، به شکلگیری پایگاهی از واژگان برای نظام ذخیره و بازیابی اطلاعات منجر میشود. استفاده از اصطلاحنامهها، روشهای طبقهبندی واژگانی[13] که واژه را با گروهی از واژههای مترادف یا یکی از مفاهیم آن برچسبدهی میکند، همچنین استفاده از شبکههای معنایی و صورتگرایی قالبمحور[14] ، استفاده از فرمولهای منطق توصیفی[15] و ساختار استدلال[16] و تجزیه قراردادی مفهوم[17] راهکارهایی برای ابهامزدایی از مفهوم واژه بودهاند که تاکنون در نظامهای ذخیره و بازیابی اطلاعات بهکار رفتهاند، و در نهایت سطح استفاده از اصطلاحهای تکواژهای[18] در برابر اصطلاحهای ترکیبی[19] و عبارتها[20]، همچنین پیشهمارایی و پسهمارایی واژگان، دستوری است که سیاستگذاران یک نظام برای نظام ذخیره و بازیابی اطلاعات برمیگزینند. هریک از فرایندهای یادشده، تلاش در «مهار» زبان طبیعی و تعریف پذیر ساختن آن برای نظام ذخیره و بازیابی اطلاعات دارد. توانایی نظام ذخیره و بازیابی اطلاعات در ایجاد فضای مفاهمه میان کاربر و مؤلف، ارتباط مستقیمی با «مهار» به کار رفته در زبان نظام دارد، به گونهای که زبان نظامهای ذخیره و بازیابی اطلاعات را، بنا به میزان و نوع مهار اعمال شده در ساختارشان روی یک طیف هستیشناسی به شکل زیر، میتوان از ساختارهای معنایی ضعیف تا ساختارهای معنایی قوی چیدمان داد. [21] [22] [23] [24] [25] [26] [27] [28] [29] [30] [31] [32] [33] [34] [35]
همانطور که از طیف هستیشناسی مشخص است، زبانهای نظام ذخیره بازیابی اطلاعات از فهرست لغات در پایین طیف، تا مدل منطقی در بالای طیف، در تغییر است و اصطلاحنامه نیز در نیمة پایینی این طیف قرار دارد. چنانکه اشاره شد، تفاوت هر یک از زبانهای یاد شده روی طیف، برخاسته از نوع و میزان مهار اعمال شده در آن زبان نسبت به زبان طبیعی است، اما پرسش اساسی اینجاست که برای افزایش ربط مورد نظر کاربر در نتایج بازیابی اطلاعات، بهکارگیری چه رویکردی در فرایند «مهار» برای زبان نظام ذخیره و بازیابی اطلاعات مطلوبتر است؟ آیا رویکرد اعمال بیشتر محدودیتها به ساختار زبان، که یک رویکرد انقباضی است، همچون بهکارگیری سیاهه بازدارنده، یا رویکرد تزریق بیشتر خصیصههای شناختی انسان نسبت به زبان در ساختار زبان نظام ذخیره و بازیابی اطلاعات، همچون استفاده از طبقهبندی واژگانی و اصطلاحنامه، که یک رویکرد انبساطی است؟ کدام یک از این دو رویکرد، فضای مفاهمه میان کاربر و مؤلف را با اثربخشی بیشتر همراه میکند و تعاملهای بین زبان نظام، زبان کاربر و زبان مؤلف را تسهیل و تصریح مینماید؟
مدل تعامل بین زبان در یک نظام ذخیره و بازیابی اطلاعات[36]
«کارل داچ»[37] مدل را اینگونه تعریف میکند: «مدل، مجموعهای نماد و قاعده عملی در اختیار ما می گذارد تا آنها را با نقاطی متناظر در ساختار یا فرایند موجود منطبق سازیم. هدف از مدل سازی، ارائه وسیلهای برای سازماندهی داده ها یا عناصر یک ساختار منسجم، فراهم آوردن امکان اندازه گیری پدیده ها، امکان پیشگویی اوضاع آینده، یا آشکار ساختن حقایق یا مناسباتی است که تا کنون ناشناخته مانده است». (باد:91:1377) با این تعریف، نخستین گام در پرداختن به مقولة زبان در نظام ذخیره و بازیابی اطلاعات، ارائة مدل از تعامل بین زبانهای مختلف در نظام میتواند باشد، زیرا مدل تعامل بین زبانی، الزامهایی همچون موارد زیر را میتواند برآورده سازد:
با نظر به الزامهای فوق، نگارنده در این بخش تلاش میکند مدلی از فرایند تعامل بین زبانی در یک نظام ذخیره و بازیابی اطلاعات ارائه نماید.
در یک نظام ذخیره و بازیابی اطلاعات، آنچه اتفاق میافتد، ارتباط و تعامل بین کاربر، مؤلف و نظام ذخیره و بازیابی اطلاعات از طریق زبان است. مؤلف و کاربر ضمن اینکه اجزایی از نظام ذخیره و بازیابی اطلاعات هستند، زبان خاص خود را دارند و از زبان نظام پیروی نمیکنند. زبان کاربر و زبان مؤلف، هر دو در ساختار زبان طبیعی تعریف شدهاند؛ بنابراین، از مزیت قرابت و نزدیکی به یکدیگر برخوردارند؛ البته این نزدیکی به تطابق کامل زبان کاربر و زبان مؤلف منجر نخواهد شد. علاوه بر وجود اختلافهای: سطح علمی، اقتصادی، اجتماعی، فرهنگی و تفاوتهای زمانی و مکانی کاربر نسبت به مؤلف که امکان نادیده گرفتن هیچیک مقدور نیست؛ در یک تعامل مستقیمِ کاربر در نظام ذخیره و بازیابی اطلاعات، اینکه کاربر به طور دقیق نمیداند چه میخواهد، یا نمیتواند آنچه را میخواهد صریح مطرح کند، به ایجاد فاصله بین زبان کاربر و زبان مؤلف منجر خواهد شد. این در حالی است که زبان نظام ذخیره و بازیابی اطلاعات، ضمن اینکه برگرفته از زبان کاربر و زبان مؤلف است، با این دو بسیار متفاوت است. نوع و میزان این تفاوت، به ماهیت و میزان «مهار» بهکار رفته در زبان نظام ذخیره و بازیابی اطلاعات بستگی دارد. با این رویکرد میتوان سه زبان یاد شده را در سه رأس یک مثلث در نظر گرفت؛ به گونهای که فضای داخلی مثلث، فضای توافق شده یا به عبارتی فضای مفاهمه بین این سه زبان را تشکیل دهد.
شکل2. مدل تعامل بین زبان کاربر، زبان مؤلف و زبان نظام ذخیره و بازیابی اطلاعات
سطح داخلی مثلث، فضای مفاهمه بین سه زبان کاربر، مؤلف و نظام ذخیره وبازیابی اطلاعات را تشکیل میدهد؛ اما در تعامل کاربر با نظام، اثربخشی تمام نقاط این سطح به یک اندازه نیست. مؤثرترین نقاط، نقطة برآیند این سه زبان، قرار گرفته در کانون مثلث و همچنین فضای پیرامونی این نقطه، است. میتوانیم این نقطه و فضای پیرامونی آن را فضای اثربخش بین سه زبان کاربر، مؤلف و نظام بنامیم. درنظر گرفتن فضای پیرامونی برای نقطة برآیند سه زبان، بدین لحاظ است که در هیج تعاملی بین کاربر، مؤلف و نظام، نمیتوان به صورت مطلق، برای انجام یک جستجو، روی یک یا چند اصطلاح با به کارگیری یک فرمول جستجو توافق کرد. جستجوها، اغلب با به کارگیری چندین فرمول جستجو در چندین نوبت و به کارگیری گروهی از اصطلاحها در هر نوبت، نتیجة دلخواه کاربر را تأمین میکند.
بهینهسازی عملکرد در یک نظام ذخیره و بازیابی اطلاعات زمانی تأمین میشود که نظام بتواند اختلاف مساحت میان فضای مفاهمه بین سه زبان، با فضای اثربخش بین سه زبان را به حداقل برساند. از آنجا که نظام نمیتواند بر زبان کاربر و زبان مؤلف تأثیر بگذارد، اعمال نیروی خود را از طریق «مهار» بر زبان نظام ذخیره و بازیابی اطلاعات انجام میدهد. نظام از طریق جایگزینی «زبان نمایهسازی» به جای زبان طبیعی و به کارگیری عوامل جستجو[38] برای ترکیببندی واژگانِ زبان نمایهسازی در لحظة جستجو، به اعمال مهار در زبان نظام میپردازد، بر این اساس «مهار» میتواند رأس «مثلث تعامل بین سه زبان» را به قاعدة مثلث نزدیک یا از آن دور سازد و بدین وسیله با تغییر ارتفاع مثلث، به افزایش و یا کاهش مساحت مثلث[39] منجر شود، زیرا مساحت مثلث نسبت مستقیم با ارتفاع آن دارد. هر میزان کاهش ارتفاع مثلث، به کاهش مساحت آن منجر میشود و در نتیجه اختلاف مساحت میان فضای مفاهمه بین سه زبان، با فضای اثربخش بین سه زبان را کاهش میدهد و در این شرایط، عملکرد بهینة نظام ذخیره و بازیابی اطلاعات در بُعد زبان تأمین میشود. این شرایط زمانی تحقق مییابد که زبان نمایهسازی به کار رفته در نظام، در نزدیکی به زبان طبیعی تلاش داشته باشد تا از این طریق رأس مثلث تعامل بین زبانی، که زبان نظام ذخیره و بازیابی است، به قاعدة آن که زبان طبیعی است نزدیک شود.
اما مسئله این است، نظامهایی که تا کنون از زبان طبیعی برای سازماندهی و بازیابی اطلاعات استفاده کردهاند، در بیشتر موارد نه تنها به حصول ربط مورد انتظار کاربر منجر نشدهاند، بلکه با عدم مدیریت بر واژگان، بینظمی حاکم بر نظام را در بخش زبان، افزایش دادهاند. نکتة قابل توجه اینجاست که تمام این نظامها تنها از واژگان زبان طبیعی استفاده کرده، و ویژگیهای شناختی انسان نسبت به این واژگان، شامل رابطههای بین واژگان و خصیصههای درونی واژگان را نادیده گرفتهاند. به نوعی میتوان گفت، نظامهای ذخیره و بازیابی اطلاعات، تنها مدعی به کارگیری زبان طبیعی بودهاند، درحالی که فقط از بخشی از این زبان استفاده میکردهاند.
زبان نمایهسازی در محیط تعامل سه بعدی اطلاعات
زبان نمایهسازی (همانند زبانهای طبیعی، مثل: انگلیسی، چینی، یا عربی) دارای یک واژگان (اصطلاحهایی که برای نمایهسازی به کار میرود) و یک نحو[40]، یا دستورکار[41] است. فرایند «مهار» در زبانهای نمایهسازی مهارشده، از دو طریق بر همپوشانی[42] و اغتشاش[43] درکاربرد مفاهیم فایق میآید: 1. تعیین محدودیتها برای تعداد و شکل اصطلاحهای مرجّح، که مدیریت بر اصطلاحهای مترادف و شکلهای گوناگون آنها را میسر میسازد 2. تعیین روابط بین اصطلاحها و در صورت لزوم قواعدی برای ترکیب آنها (براوتون[44] ، 2006، 13). وارد ساختن این دو خصیصه به زبان نظام، به جداسازی بین زبان نمایهسازی مهارشده و زبان طبیعی و در حقیقت ایجاد تفاوت میان زبان نظام و زبان کاربر، منجر میشود. دو روش مطرح شده برای فرایند مهار، دارای دو رویکرد متفاوت است. اولین گزینه برای ایجاد یک پایگاه واژگان در نظام ذخیره و بازیابی اطلاعات، با اعمال محدودیتها در فهرست واژگان زبان طبیعی، رویکرد انقباضی را پیش میگیرد، در حالی که در گزینة دوم، روابط تعریف شده در حوزة شناختی انسان نسبت به واژگان، به زبان نظام ذخیره و بازیابی اطلاعات افزوده میشود، که این رویکرد، یک رویکرد انبساطی است. درطرح پیشزمینهای برای پاسخ به دو پرسش مطرح شده در مقدمة این مقاله، بیان پارهای از دیدگاهها، ضروری به نظر میرسد:
بنا به دو دیدگاه مطرحشده، تقویت رویکرد انبساطی در فرایند مهار برای زبان نظام ذخیره و بازیابی اطلاعات، ضرورتی اجتناب ناپذیربه نظر میرسد. از این رو، غنیسازی اصطلاحنامه، که رویکرد هستیشناسانه نسبت به زبان دارد، برای محیطهای شبکهای و پایگاههای اطلاعات تخصصی، ضمن محقق ساختن امکان سازماندهی اطلاعات همراه با حفظ دقت معنایی[52]، میتواند به اثربخشی نظام، در بازیابی اطلاعات مرتبط برای کاربر نهایی منجر شود. بنابراین، در چنین نظامهایی، باید ساختار مفهومی زبان جایگزین ساختار موضوعی شود. اثربخشی نظامهای مفهومی نسبت به نظامهای موضوعی در بازیابی اطلاعات، ناشی از تعریف روابط بین عناصر تشکیل دهندة نظام است. با تعریف روابط بین اشیا و روابط بین ویژگیها، روابط مفهومی شکل میگیرند (فلبر، 1381، 180). تعریف اینگونه روابط باعث میشود زبان به کار رفته در نظام ذخیره و بازیابی، به یک نظام زبانی مستقل از متنهای ذخیرهشده در نظام بدل گردد و فهم مفهوم واژه برای رایانه، به متن وابسته نباشد و نظام با ردگیری پیوندهای تعریف شده برای هر یک از واژهها، امکان دریافت معنی واژه را به صورت مستقل از متن و تنها وابسته به نظام زبانی خود (همچون اصطلاحنامه) داشتهباشد. در حالی که در یک نظام موضوعی یا واژگانی مانند فهرست لغات، مفهوم هر یک از واژهها، به متن وابسته است. وابستگی مفهوم واژهها به متن و ساختار جمله، فهم موضوعی مدارک اطلاعاتی به صورت هوشمند توسط رایانه را دشوار میسازد و در نتیجه تعداد زیادی از مدارک بازیابی شده در جستجوهای کلیدواژهای، از دایرة مفهومی نیاز کاربر فاصله دارند. اصطلاحنامه از جمله واژگان ابزارهایی است که روابط بین واژگان را در یک نظام ذخیره و بازیابی اطلاعات وارد میسازد.
اصطلاحنامه در محیط تعامل سه بُعدی اطلاعات
اصطلاحنامه در معنای متداول امروزی آن، مفهومی است که از دهة 1950 به بعد، تقریباً صد سال پس از اصطلاحنامة «روژه»[53] شکل گرفت. بدین لحاظ، بهتر است بین اصطلاحنامه با مفهوم سنتی آن به نام اصطلاحنامة مرجع[54]، با اصطلاحنامة بازیابی اطلاعات[55] که مفهوم متداول امروزی اصطلاحنامه است، تمایز قایل شد. اصطلاحنامة مرجع که بیشتر مورد استفادة نویسندگان و روزنامهنگاران بوده است، فهرستی از اصطلاحهای مترادف و شبه مترادف را تشکیل میداده که مکمل یا پیوستی بر واژهنامهها محسوب میشده است. این نوع از اصطلاحنامه، مؤلفان را در حین نگارش، برای یافتن بهترین معادل واژگانی، برای مفهوم ذهنی ایشان یاری میداده است. برخلاف اصطلاحنامة مرجع که نگارش یک اندیشه را دستیاری میکند، اصطلاحنامة بازیابی اطلاعات، باید به بازیابی آن اندیشه کمک کند. بر اساس این باور، تعریف اصطلاحنامه بازیابی اطلاعات از دید «وندا براوتون»[56] اینگونه است: «اصطلاحنامه، 1. ابزاری برای نمایهسازی موضوعی اسناد است 2. فهرستی ساختار یافته از اصطلاحها (به طور معمول در یک حوزة موضوعی ویژه) را در بر میگیرد که ممکن است نمایهساز، یا مدیر پیشینهها[57]، برای توصیف اسناد به گونهای آن را بهکار ببرد که 3. کاربران نهایی هنگام جستجوی منبعی در مورد موضوعی ویژه، بتوانند فقره[58]های با ربط را بازیابی کنند (براوتون، 2006، 4)». در برابر اصطلاحنامه که یک نظام مفهومی است، فهرستهای کلیدواژهای و سرعنوانهای موضوعی قرار دارد که هر دو در زبان نمایهسازی، نظامی لغت مدار شمرده میشوند. تمام چنین نظامهایی، به جای مفاهیم یا مقولهها، ویژگی کاربرد خود لغات را به عنوان اساس چیدمان، در میان میگذارند. این، بدان معناست که نظم تحمیلی[59] و تصمیمگیری در مورد روابط میان اصطلاحها، جایگزین مسائلی که بر لغات و معانی تأثیر میگذارد، نظیر رخداد مترادفها و املاهای متفاوت و دشواریهای کار در متن زبان طبیعی میشود (براوتون، 2006، 20). با وجود تفاوت میان نظامهای لغت مدار با نظامهای مفهومی همچون اصطلاحنامه، هنوز نظامهای ذخیره و بازیابی که حتی از نظامهای مفهومی استفاده میکنند، نتوانستهاند بر اغتشاش حاکم بر زبان در نظام خود فایق آیند. این مطلب شاید از آنجا ناشی میشود که اصطلاحنامه تنها روابط بین واژگان را مطرح میسازد و از بیان خصایص درونی واژگان چشمپوشی میکند.
هستیشناسی
بنا به نظر «داکونتا»[60] (2003) هر یک از ابزارهای ابهامزدایی مفهوم واژه، سطحی از سطوح متعدد معناشناسی را در یک ساختار هستیشناسی به خود اختصاص میدهد؛ بنابراین هستیشناسی، مقولهای جدید در سازماندهی داده به شمار نمیرود. هستیشناسی سطوح مختلفی دارد که در یک طیف، بین ساختارهای معنایی ضعیف از فهرست واژگان، طبقهشناسیها، اصطلاحنامهها، مدلهای مفهومی تا ساختارهای معنایی قوی همچون مدلهای منطقی، در تغییر است.
هستیشناسی در اصل یک نظام سازماندهی دانش[61] است که برای استخراج مدارک در عرصههایی که تداخلحوزه ای[62] وجود دارد به کار میرود و در این عرصه از مقبولیت سطح بالایی برخوردار شده است. بنا به نظر «استیم سون»[63] (2003) زبانهای مهارشده تنها برای دورههای زمانی محدودی کارایی مطلوب دارند و تنها راه حل کاربردپذیری معنایی[64]، روشن ساختن روابط بین واژههای به کار رفته در یک هستیشناسی به صورت قراردادی است. ضمن این که «گیل»[65] (2004) معتقد است استفاده از هستیشناسیها میتواند کاربردپذیری معنایی در مدارک رقومی نامتجانس روی شبکهها را بدون از دست دادن دقتمعنایی، یا با حفظ میزان دقت معنایی در سطح مورد قبول، تسهیل کند.
هستیشناسی، یک رویکرد دانشمبنا از اطلاعات دربارة مفاهیم متعلق به هر واژه و حوزه، خصوصیتهای واژگان و چگونگی ارتباط آنها با یکدیگر، در اختیار کاربر و نظام ذخیره و بازیابی قرارمیدهد. هستیشناسی با اصطلاحنامه متفاوت است، زیرا شامل اطلاعات مستقل زبان و بسیاری از خویشاوندیهای معنایی، همچون خویشاوندیهای ردهای است (کانگ[66]، کیم[67]، لی[68]، 2001، 1). میتوان ادعا کرد یک ساختار دادهای هستیشناسی چیزی بیش از یک مدل دانش در یک حوزة موضوعی خاص نیست. یک رویکرد قراردادی دانش مبنا، که واژگان با مفاهیم ابهامزدایی شده، تعاریف آنها، عملگرهای مجاز، روابط و همیاریها با دیگر مفاهیم در هر حوزه را توصیف میکند (بیترز، 2005، 3). «گروبر»[69] (1993) در عرصة فناوری اطلاعات هستیشناسی را بسیار متفاوت از فلاسفه، با این مضمون مطرح میکند: واژة هستیشناسی، بیان خصایص یک مفهوم است. توصیفی از مفاهیم و روابطی که میتواند برای یک عامل یا مجموعهای از عوامل به کار رود. بنابراین، میتوان گفت: هستیشناسی، بیان قراردادی (یا توافقی) و صریح خصیصهها[70] برای مفاهیم، با هدف ایجاد ادراک مشترک[71] برای کاربران نظام ذخیره و بازیابی اطلاعات است که به هستیشناسی مجهز است. نظر به این که هدف کلی همة هستیشناسیها یکسان است، وجود یک ساختار کلی را نیز برای آنها میتوان توقع داشت. ساختار کلی که توسط «میدچه»[72] برای هستیشناسی مطرح شده است، در پنج گزینة کلی زیر تعریف می شود.
بر این اساس، هر هستیشناسی دربرگیرندة یک پایگاه واژگان خواهد بود که همچون اصطلاحنامه، نوع خویشاوندی بین واژگان در آن تعیین شدهاست. به منظور به دست آوردن یک ساختار دانش در زبان، واژگان باید به صورتی نظاممند که اغلب به صورت سلسله مراتبی است، از سر واژه و اصطلاح رأس، تا اصطلاحهای انتهایی اخص، چیدمان یابد. تا این مرحله یک هستیشناسی با اصطلاحنامه تفاوت زیربنایی ندارد. افزوده شدن دو گزینة چهار و پنج به اصطلاحنامه، باعث میشود اصطلاحنامه، روی طیف هستیشناسی به مدلهای مفهومی فوقانی نزدیک شود. برای به دست آوردن چیدمان غیرطبقهای مفاهیم باید چگالی مفاهیم[81] تعیین شود. در این مرحله، به جای پرداختن به روابط میان واژگان، شناخت فضای مفهومی درونی واژه ضرورت مییابد. تعیین خصایص درونی واژگان و تنظیم دوباره آنها بر اساس وزن واژگان نسبت به یک خصیصه، نقشهای از پایگاه واژگان زبان نظام ایجاد خواهد کرد که دیگر ساختار سلسله مراتبی ندارد، بلکه بیشتر به بازنمون یک ماده روی کاغد کروماتوگرافی، که رنگها از غلیظ و پر وزن به رقیق و کم وزن چیدمان مییابد، شباهت دارد. به نظر «فلبر» (1982)، شناخت مختصات مفاهیم، به تبیین حد و مرز مفاهیم و دایرة مصادیق آنها تا حد امکان طبقهبندی آنها بنا نهادن نظامهای مفهومی گوناگون و بهرهگیری از نتایج این فرایند نظری در انتقال دانش و سازماندهی نظامهای اشاعة اطلاعات، کمک میکند (نقل در نشاط،1381، 213).
اصطلاحنامة سه بُعدی، مدلی مبتنی بر هستیشناسی
با توجه به ضرورتهای مطرح شده در خصوص وجود ساختارهای سازماندهی دانش و به کارگیری اصطلاحنامهها و همچنین نیاز به تعیین چگالی و مرز معنایی هریک از مفاهیم که در ساختار زبانی یک نظام ذخیره و بازیابی اطلاعات بهکار میرود، نگارنده با رویکرد هستیشناسانه، طرح مدلی را با عنوان «اصطلاحنامة سه بُعدی» پیشنهاد میدهد. ساخت چنین اصطلاحنامهای بر دیدگاههای اصطلاحنامهای و هستیشناسی، همراه با ترسیم روابط بین مقولهها و مفاهیم مبتنی خواهد بود. مزیت این اصطلاحنامه در تشکیل فضاهای مفهومی، حاصل از کنار هم قرار گرفتن اصطلاحهای اخص از دو مقولة موضوعی متفاوت خواهد بود که این اصطلاحهای اخص با یکدیگر شباهتهای معنایی دارند ولی در ساختار نظاممند اصطلاحنامههای امروزی در کنار یکدیگر قرار نمیگیرند. همچنین، فضای مفهومی حاصل از این مدل، توان نظام ذخیره و بازیابی اطلاعات را برای بازیابیهای فازی و برداری افزایش خواهد داد. مراحل ساخت یک اصطلاحنامة سه بُعدی، با رویکرد هستیشناسی، به شکل زیر خواهد بود:
مراحل ساخت اصطلاحنامة سه بُعدی را با ارائة یک مثال میتوان تبیین کرد. بدین منظور، مقولة منابع آب از ردة موضوعی جغرافیا در اصطلاحنامه فرهنگی فارسی (اصفا) انتخاب شده است.
منابع آب 5/7/3- جغ
در صورتی که توصیفگرهای اخص مربوط به توصیفگر عام «آبهای سطحی» متعلق به مقولة «منابع آب» را بر اساس خصیصة «آبهای موجود در فرورفتگیهای زمین» و «آبهای موجود در سطح زمین» تفکیک کنیم، شکل چیدمان این توصیفگرها به جای تنظیم الفبایی در یک سطح، تحت خصیصههای وارد شده به ساختار اصطلاحنامه، در دو سطح به شکل زیر به دست خواهد آمد:
منابع آب 5/7/3- جغ
آبهای موجود در فرورفتگیهای زمین |
|
آبهای موجود در سطح زمین |
|
همچنین در این مرحله مفهوم «آبهای موجود در فرورفتگیهای زمین» و «آبهای موجود در سطح زمین» را که به تفکیک دو گروه از توصیفگرهای اخص منجر شدهاند، در صورت لزوم میتوان به ساختار اصطلاحنامه افزود. ولی باید دقت داشت که این مفاهیم جزو شبکة مفاهیم اصطلاحنامه است و در فهرست توصیفگرها قرار نمیگیرد. این مفاهیم تنها به دایرة شناختی انسان برای تمیز بین مصادیق توصیفگرها در دنیای خارج مربوط میشود. در مرحلة بعد، توصیفگرهای تفکیک شده به دو گروه، نسبت به یک خصیصة انتخابی مناسب، به طور مثال «عمیق» برای فرورفتگیهای زمین، و «ثابت» و «دورهای» بودن برای آبهای موجود در سطح زمین، منظم میشود. در این مرحله، تا حد امکان باید چیدمان توصیفگرها به گونهای باشد که به صورت یک طیف از «پرشدت» تا «کم شدت» نسبت به خصیصة انتخابی جدید، تنظیم شوند.
منابع آب 5/7/3- جغ
آبهای موجود در فرورفتگیهای زمین |
|
آبهای موجود در سطح زمین |
|
در این مرحله، توصیفگرهای انتهایی یک مقولة موضوعی در اصطلاحنامه، طیفی را تشکیل میدهد که نسبت به خصیصة انتخابی از پرشدت به کم شدت تنظیم شدهاست. اکنون باید با استفاده از روش تداعی یا جستجوهای مروری در ساختار نظاممند الفبایی اصطلاحنامه، برای یافتن توصیفگرهای اخص نزدیک به توصیفگرهای اخص طیف شده، از دیگر مقولههای موضوعی اقدامگردد. این نزدیکیابی مفاهیم در ردیف مقولههای موضوعی که در سطوح بالاتری از توصیفگرهای اخص قرار می گیرند نیز، میتواند انجام شود. آنچه با استفاده از روش تداعی و مرور اصطلاحنامة اصفا، در مشاهدة توصیفگرهای طیف شده به ذهن نگارنده تداعی شد، به ترتیب زیر است:
ـ «فرورفتگیهای زمین» در سطح توصیفگر عام، همطراز با توصیفگر «آبهای سطحی»
ـ «سیل» متعلق به مقولة «بلایای طبیعی» در سطح توصیفگر خاص برای «سیلاب»
ـ همچنین «جریانهای اقیانوسی» متعلق به مقولة «اقیانوسشناسی» برای توصیفگر خاص «اقیانوسها» با نزدیکسازی این توصیفگرها از ردههای موضوعی دیگر به ناحیة توصیفگر مورد بررسی، فضای مفهومی هر یک از توصیفگرها به صورت زیر شکل میگیرد.
منابع آب 5/7/3- جغ
آبهای موجود در فرورفتگیهای زمین آبهای موجود در سطح زمین
|
دماغهها فیزیک اقیانوسی قحطی
فرورفتگیهای زمین 1-4/3- جغ
ارتفاعات
اقیانوسشناسی 8/3- جغ
این در حالی است که اگر توصیفگرهای اخص مربوط به اصطلاح «فیزیک اقیانوسی» بر اساس خصیصة «جریانهای عمودی آب» طیف شود، توصیفگر «جزر و مد» از اصطلاح عام «فیزیک اقیانوسی» با سه توصیفگر اخص «دریاچه»، «دریا» و «اقیانوس» متعلق به توصیفگر عام «آبهای سطحی» در یک فضای مفهومی قرار میگیرند و به همین ترتیب میتوان فضاهای مفهومی متفاوتی را از طریق طیف کردن اصطلاحهای اخص انتهایی یک مقولة موضوعی، براساس خصیصه های متفاوت به دست آورد.
منابع آب 5/7/3- جغ
آبهای موجود در فرورفتگیهای زمین آبهای موجود در سطح زمین
|
اقیانوسشناسی 8/3- جغ
در کنار هم قرار گرفتن توصیفگرهای اخص از دو مقولة موضوعی متفاوت، ساختار درختی و دو بُعدی اصطلاحنامه را با استفاده از مدلهای معناشناسی، به ساختار سه بُعدی تبدیل می کند.
توصیفگرهایی که براساس روش تداعی یا مرور اصطلاحنامه، از دو مقولة موضوعی متفاوت در کنار یکدیگر قرار میگیرند، یک فضای مفهومی تشکیل میدهند. هرچند این فضای مفهومی در برگیرندة توصیفگرهایی از مقولههای موضوعی مختلف است، اما این توصیفگرها در اصل به یک حوزة مفهومی تعلق دارند، زیرا نزدیکسازی آنها به یکدیگر براساس خصیصههای معنایی انجامگرفتهاست، که طیف توصیفگرها در ابتدا، بر مبنای آن خصیصهها چیدمان یافتهاست. در حقیقت، فضای مفهومی براساس خصیصههای معنایی که فصل مشترک توصیفگرها هستند، شکل گرفتهاست. همچنین، تغییر خصیصههای تنظیم کنندة طیف که چیدمان توصیفگرها را تغییر دهد، به تغییر فضای مفهومی مربوط به آن توصیفگر و امکان نزدیکی آن با توصیفگرهایی از مقولههای موضوعی دیگر منجر میشود.
مزیتهایی که بر ساخت اصطلاحنامة سه بُعدی میتوان برشمرد، عبارت است از: 1. تنظیم توصیفگرهای اخص در یک اصطلاحنامه بنا به خصیصههای مختلف و ساخت طیف توصیفگرها، امکان به کارگیری منطق فازی در بازیابی اطلاعات را مقدور میسازد. در چنین ساختاری، توصیفگرها در یک دستگاه مختصات بنا به نوع خصیصههای انتخابی همانند یک طیف تنظیم و از وضعیت نقاط منفک از هم خارج میشوند. این امر به کاربر اصطلاحنامه کمک میکند در گسترش جستجو، امکان وارد ساختن توصیفگرهای نزدیکتر به توصیفگر انتخابی اول را از یک مقولة موضوعی دیگر، براساس خصیصة مورد نظر خود داشته باشد 2. نزدیکسازی توصیفگرها از مقولههای موضوعی دیگر به توصیفگرهای ابتدایی و انتهایی یک طیف، ایجاد جامعیت در بازیابیها، بدون حرکت به توصیفگرهای عام ترِ یک توصیفگرِ اخص را امکان پذیر میسازد. با توجه به اینکه این جامعیت ناشی از گسترش پرسش در دایرة توصیفگرهای اخص است، میتوان توقع داشت افزایش تعداد مدارک بازیابی شده به اندازة افزایش تعداد مدارک بازیابی شده، ناشی از استفاده از توصیفگر عامتر نباشد 3. در چنین ساختاری، گسترش پرسش از طریق استفاده از فضای مفهومی توصیفگرها، حصول جامعیت همراه با حفظ دقت معنایی را امکانپذیر میسازد؛ بویژه که این دقت معنایی برخاسته از خصیصة انتخابی توسط کاربر در چیدمان توصیفگرها و ساخت طیف توصیفگرهاست 4. با به کارگیری اصطلاحنامه سه بُعدی از ابتدای تدوین فرمول جستجو، انتخاب خصیصهها و به دست آوردن طیف توصیفگرها و گزینش توصیفگرهای مقولههای موضوعی دیگر، همه بنا به نظر کاربر تعیین میشود. در چنین شرایطی، میتوان توقع داشت که در نتیجه نهایی بازیابی، ربط از دید کاربر نسبت به شرایطی که این امکان برای وی مهیا نیست، بیشتر تحقق یابد. 5. افزودن خصیصههای معنایی به ساختار اصطلاحنامه و چیدمان دوبارة توصیفگرهای انتهایی، همراه با نزدیکیابی توصیفگرها از مقولههای موضوعی دیگر به توصیفگر چیدمان یافته، علاوه بر ساختار سلسله مراتبی اصطلاحنامه، نقشه مقولهای[82] را به بدنة اصطلاحنامه میافزاید و این مزیتی است که با غنیسازی نظام مفهومی اصطلاحنامه، فاصلة آن را از نظامهای لغتمدار افزایش میدهد. 6. اصطلاحنامهای که از پایگاه موجودیتها (توصیفگرها) و روابط بین موجودیتها شکل گرفته است، با افزوده شدن خصیصهها در ساختار آن، به توانایی بیشتری در فایق آمدن بر ابهام واژگانی دست مییابد، و نظامِ ذخیره و بازیابی بهرهمند از چنین اصطلاحنامهای، نسبت به نظامهای فاقد آن، عملکرد بهینه و اثربخشی بیشتری را میتواند تضمین کند.
نتیجهگیری
در تعامل انسان ـ رایانه، ابزارهای ارتباطی متعددی وارد میشود تا فرایند تعامل شکل گیرد. زبان یکی از این ابزارهاست که بویژه در نظامهای ذخیره و بازیابی اطلاعات به عنوان ابزاری محوری باید مورد توجه قرارد گیرد. حجم عظیمی از اطلاعات بویژه اطلاعات علمی، در قالب زبان طبیعی[83] تدوین، ثبت و به رشتة تحریر درمیآید. این اطلاعات مکتوب با به کارگیری یکی از زبانهای آزاد، مهار شده یا اصطلاحنامهای، سازماندهی و در نظامهای ذخیره و بازیابی اطلاعات ذخیره میشود. در نهایت، نیاز اطلاعاتی کاربر در تعامل با نظام ذخیره و بازیابی اطلاعات، از طریق عبارت «جستجو»[84] که تلفیقی از زبان طبیعی و عوامل جستجوست، به صورت یک عبارت مطرح میشود. از آنجا که علم کتابداری و اطلاعرسانی به موضوع تولید، توزیع و مصرف اطلاعات میپردازد، نه تنها نمیتواند نسبت به موضوعِ شناخت زبان و تبدیل و تغییرات آن در طی فرایند تعامل انسان ـ رایانه در نظامهای ذخیره و بازیابی اطلاعات بی اعتنا باشد، بلکه با توجه به مداخلة زبان در تمام مراحل تولید تا مصرف اطلاعات، باید این موضوع را در زمرة موضوعهای اصلی خود قرار دهد. با چنین رویکردی، تلاش گردید در مقاله حاضر مدل تعامل بین زبان در نظام ذخیره و بازیابی اطلاعات ارائه شود. نگارنده امید دارد با تداوم این تلاش از سوی جامعه کتابداری و اطلاعرسانی، نواقص مدل حاضر مرتفع یا مدلهای دیگری در این زمینه ارائه شود.
برخی از نظامهای ذخیره و بازیابی اطلاعات مدعی به کارگیری زبان طبیعی در فرایند سازماندهی، ذخیرهسازی و بازیابی اطلاعات هستند، اما این مسئله باید بررسی شود که تا چه میزانی مفهوم واژه برای نظام، ابهامزدایی شده است و زبانی که برای نمایهسازی اطلاعات به کار میرود، در چه سطحی از طیف هستیشناسی قرار دارد. تعیین روابط میان اصطلاحها و سلسله مراتب میان آنها، چنانکه در اصطلاحنامه انجام میگیرد، مرحله نخست ابهامزدایی از مفهوم واژه است. وجود اصطلاحنامه در چنین نظامهایی برای شناخت زبان طبیعی و فایق آمدن بر پیچیدگیهای آن ضروری است، زیرا اصطلاحنامه به شناخت نوع روابط میان واژهها کمک میکند. اما آنچه در اصطلاحنامههای امروزی معطل میماند، روشن ساختن خصایص درونی واژه است. شناخت خصایص و ماهیت درونی واژهها در زبان طبیعی و انتقال آن به ساختار اصطلاحنامه، به تعریف روابط جدیدی در ساختار اصطلاحنامه، خواهد انجامید و این فرایندی است که برای افزایش فرایند ابهامزدایی از مفهوم واژه و ارتقای سطح زبان نظام ذخیره و بازیابی اطلاعات در طیف هستیشناسی مورد نیاز است. دست یافتن به ابعاد مختلف زبان طبیعی و تعریف این ابعاد مختلف تحت یک ساختار، فایق آمدن بر ساختارهای معنایی زبان و به کارگیری این ساختارها در نظامهای ذخیرهسازی و بازیابی اطلاعات، از جمله زمینههای بین رشتهای است که به رشته کتابداری و اطلاعرسانی مربوط میگردد. استفاده از ساختارهای مبتنی بر هستیشناسی با هدف شناخت و به کارگیری فضای مفهومی واژگان در نظامهای ذخیره و بازیابی اطلاعات، از جمله راهکارهایی است که امکان دسترسی یکپارچه، همراه با دقت معنایی را در محیطهای شبکهای تأمین میکند. زمینههای موضوعی جدید مطرح شده در مقالة حاضر، ضرورت انجام پژوهش در عرصههای زبانشناسی و معناشناسی با رویکرد به سازماندهی اطلاعات، بویژه در زبان فارسی را اجتنابناپذیر میسازد. این پژوهشها باید در راستای دست یافتن به راهکارهای نوین برای احاطه و تسلط بر دایرة مفهومی واژگان و ساخت الگوهای ادراکی در حوزة زبان طبیعی به صورتی قابل فهم برای رایانه و نظامهای ذخیره و بازیابی اطلاعات باشد.
[1]. Sapir-Whorf hypothesis.
[2]. Linguistic signs.
[3]. Free vocabulary.
[4]. Closed Vocabulary.
[5]. Thesaurus.
[6]. Nicholson, D.
[7]. Dunsire, G.
[8]. Neill, S.
[9]. Control.
[10]. Word Sense Disambiguation.
[11]. Grammar.
[12]. Stop List.
[13]. Word Taxonomies.
[14]. Frame-Based Formalisms.
[15]. Description Logic.
[16]. Argument.
[17]. Formal Concept Analysis (FCA).
[18]. Uniterm.
[19]. Compound term.
[20]. Phrase.
1. این مدل برای اولین بار توسط نگارنده ارائه شدهاست، بدین لحاظ میتواند خالی از نقص نباشد، اما نگارنده امیدوار است با دریافت نظرات خوانندگان، بتواند در جهت رفع نقص و تکمیل آن گام بردارد.
[37]. Karl Deutsch.
[38]. Search operators.
[40]. Syntax.
[41]. Operating rules.
[42]. Overlap.
[43]. Confusion.
[44]. Vanda Broughton.
[45]. Nicholson, D.
[46]. Bearman.
[47]. Trant.
[48]. Seamless access.
[49]. Knowledge model.
[50]. Sattar Chaudary, Abdus.
[51]. Pei Jiun, Tan.
[52]. Semantic Precision.
[53]. Peter Mark Roget.
[54]. Reference book thesaurus.
[55]. Information retrieval thesaurus.
[56]. Vanda Broughton.
[57]. Records Manager.
[58]. Item.
[59]. Imposed order.
[60]. Daconta, M. C.
[61]. Knowledge Organization System (KOS).
[62]. Cross-domain.
[63]. Steeamson.
[64]. Semantic interoperability.
[65]. Gill.
[66]. Kang, Sin-Jae.
[67]. Kim, Dong-II.
[68]. Lee, Jong-Hyeok.
[69]. Gruber.
[70]. Specification.
[71]. Shared Conceptualization.
[72]. Maedche, A.
[73]. Relations.
[74]. Concept Hierarchy.
[75]. Non Taxonomically.
[76]. Axiom.
[77]. Logical Language.
[78]. Yao, Haining.
[79]. Orme, Anthony Mark.
[80]. Ltzkorn, Letha.
[81]. Concept Intension.
[82]. Topic map.
[83]. Natural language.
[84]. ُSearch phrase.