نوع مقاله : مقاله پژوهشی
نویسنده
فارغ التحصیل دکترا
چکیده
کلیدواژهها
مقدمه
امروزه، گسترش فناوریهای اطلاعاتی و ارتباطی و افزایش حجم متون و مدارک تخصصی در رسانهها و قالبهای مختلف از یک سو و نیاز کاربران و متخصصان به بازیابی اطلاعات مرتبط در کمترین زمان از سوی دیگر، کتابخانههای دیجیتال را با چالشهایی در زمینة ذخیره، نگهداری، سازماندهی، بازیابی و مدیریت اطلاعات این مجموعهها روبه رو ساخته است. از آنجا که این کتابخانهها در محیط وب ارائه میشوند، مشکلات محیط وب نیز بر مسائل بالا افزوده است. ظهور وب معنایی در سالهای اخیر، امکانات و قابلیتهای فراوانی برای رفع مشکلات وب و افزایش دسترسی به اطلاعات در سیستمهای اطلاعاتی ایجاد کرده است. بنابراین، استفاده از ابزارها و فناوریهای معنایی مانند هستیشناسیها در کتابخانههای دیجیتال میتواند سبب رفع بسیاری از کاستیها و مشکلات این کتابخانهها و ایجاد «کتابخانههای دیجیتال معنایی» گردد. در این مقاله، برخی از کاربردهای هستیشناسی در طراحی کتابخانههای دیجیتال معنایی بررسی میشود.
هستیشناسی و کتابخانههای دیجیتال معنایی
هستیشناسی، مدلی واضح و صریح از یک حوزة دانش، شامل مجموعهای از مفاهیم، تعاریف آنها و روابط میان آنها در آن حوزه است (یو ، توم و تام ، 2007). «گروبر» (1993) هستیشناسی را مفهومی میداند که به ایجاد فهم مشترک از حوزهها اشاره دارد و شامل مجموعهای از مفاهیم، روابط، کارکردها، اصول بدیهی و نمونههاست. امروزه هستیشناسیها به عنوان ابزارهای معنایی، در حوزههای مختلف همچون سامانههای بازیابی اطلاعات معنایی، سامانههای مدیریت دانش معنایی، فهرستهای معنایی و... کاربرد دارند. ویژگیهای بارز هستیشناسیها همچون قابلیت استنتاج، ایجاد ارتباط و میانکنشپذیری بین سامانههای اطلاعاتی، حمایت از پردازش زبان طبیعی، فهم پرسش جستجو و...، توجه پژوهشگران را به استفاده از این ابزار در ایجاد کتابخانههای دیجیتال معنایی جلب نموده است.
در ساختار کتابخانههای دیجیتال معنایی از فناوریهای وب معنایی و سامانههای هوشمند مانند هستیشناسی استفاده شده است. هدف اصلی این نوع کتابخانهها، ایجاد امکانات و شرایط بازیابی بهتر از طریق افزایش تعامل انسان و سیستم و نیز ایجاد دقت بالاتر در جستجوهای پراکنده در میان شبکههای ناهمگون کتابخانههای دیجیتال است (کراک ، سایناک و زیمرمن ، 2005).
برخی ویژگیهای کتابخانههای دیجیتال معنایی به صورت زیر بیان شده است (کراک و دیگران، 2006):
- کتابخانههای دیجیتال معنایی، اطلاعات را بر مبنای انواع طرحهای فرادادهای و عناصری مانند منابع، پروندههای کاربران و طبقهبندیهای مختلف، به هم پیوند میدهند.
- این کتابخانهها امکان میانکنشپذیری با سایر سامانهها (نه فقط کتابخانههای دیجیتال) را بر مبنای فرادادهها و سطوح ارتباط، فراهم میسازند.
- کتابخانههای دیجیتال معنایی رابطههای کاربری معنایی منسجمتر، کاربرپسندتر و با امکانات جستجو و مرور بیشتر را ایجاد میکنند.
- در این نوع کتابخانهها، کاربران تنها به منزلة استفادهکنندگان و مشتریان کتابخانه نیستند، بلکه از طریق شبکههای اجتماعی در خلق محتوای کتابخانه دخالت دارند.
- کتابخانههای دیجیتال معنایی امکان انتقال از فضای اطلاعاتی ایستا به فضای دانشی پویا و مشترک را ایجاد میکنند.
استفاده از قابلیتهای وب معنایی، سبب افزایش کیفیت مدیریت محتوا، توسعة خدمات و بهبود جستجو و بازیابی اطلاعات در کتابخانههای دیجیتال میگردد. همزمان، ارائه توصیفهای معنایی منابع اطلاعاتی و پروندههای مربوط به مشخصات و نیازهای اطلاعاتی کاربران، میزان استفادهپذیری کتابخانههای دیجیتال را افزایش میدهد. کتابخانههای دیجیتال میتوانند با استفاده از فناوریهای معنایی همچون هستیشناسیها، با یکدیگر مرتبط شده و پایگاهی منسجم و یکپارچه را تشکیل دهند. هستیشناسیها با توصیف دقیق و روشن اجزا و عناصر موجود در کتابخانههای دیجیتال، کاربران را در جستجوی معنایی و بازیابی مؤثر اطلاعات در مجموعه این کتابخانهها و سایر سامانههای اطلاعاتی یاری میدهند و سبب ایجاد تحولات گستردهای در سیستمهای سنتی کتابخانههای دیجیتال میگردند. در ادامه، برخی از مهمترین کاربردهای هستیشناسی در طراحی کتابخانههای دیجیتال معنایی، به تفصیل بررسی شده است.
کاربردهای هستیشناسی در طراحی کتابخانههای دیجیتال معنایی
در این بخش، ضمن بررسی برخی از کاربردهای هستیشناسی در طراحی کتابخانههای دیجیتال معنایی، سعی شده به نمونههایی از این کتابخانهها و کاربرد هستیشناسی در آنها پرداخته شود.
1. ایجاد قابلیت استدلال و استنتاج در کتابخانههای دیجیتال
دقت تعریفهای ارائه شده در هستیشناسی، امکان استدلال و استنتاج گسترده را در کتابخانههای دیجیتال معنایی فراهم میکند. در این بخش، استفاده از منطق و استدلال در کتابخانههای دیجیتال، در چهار فرایند دسترسی، توصیف، حقوق و خدمات، بررسی شده است (وینستین و الووی ، 1997):
1. استفاده از منطق و استدلال در فرایند دسترسی: استنتاج و منطق در کتابخانههای دیجیتال برای بهبود عملیات جستجو و مرور، حتی زمانی که اطلاعات کمی از منبع مورد نظر در اختیار داریم، به کار میرود. برای نمونه، اگر بدانیم که اثر مورد نظر ما در قالب مقاله منتشر شده است، سامانة هوشمند معنایی، منابعی را به ما پیشنهاد میکند که در قالب مجلهها، روزنامهها و مجلههای تخصصی باشند و یا این منابع را نمایه کنند، زیرا این منابع مجموعههایی از مقالهها هستند.
2. استفاده از منطق و استدلال در فرایند توصیف: منطق در این فرایند برای ایجاد توصیف کاملتر منابع نسبت به توصیفهای ناقص، استفاده میشود. برای نمونه، اگر سیستم نام پدیدآور (A) یک رمان (N) را بداند و نیز بداند که برخی شکلهای رمان در قالب کتاب توسط ناشر (P) منتشر شدهاند، میتواند استنباط کند که اثر پدیدآور (A) توسط ناشر (P) منتشر شده و اینکه ناشر (P)، اثر پدیدآور (A) را منتشر کرده است.
3. استفاده از منطق و استدلال در مسائل مربوط به حقوق اثر: در اینجا، استدلال و منطق برای تعیین حقوق اثر و بخشهایی که مجوز استفاده برای کاربران دارند، به کار میرود. برای نمونه، اگر رمان (N) (در مثال بالا) توسط ناشر (P) در قالب کتاب منتشر شده باشد، میتوان با استفاده از منطق و استنتاج، به طور خودکار قوانین و حقوقی را برای این رمان در قالب کتاب، تعیین نمود. تعیین حقوق اثر ممکن است از مجوز استاندارد ناشر یا پدیدآور، استنتاج شود.
4. استفاده از منطق و استدلال در خدمات: استنتاج در این بخش برای پیشنهاد ردهها یا ابزارهای خاص به منظور انجام عملیاتی بر روی اثر توسط کاربران به کار میرود. برای نمونه، اگر ویرایشی از رمان (N) در قالب تصویر باشد و کاربر، مجوز چاپ یا تغییر رمان را نداشته باشد، بنابراین ابزارهایی که برای کاربر به منظور دسترسی به رمان فراهم است، ابزارهای «تنها تصویر را ببین » هستند. سایر ابزارهایی که امکان انتقال یا تغییر اثر را فراهم میکنند، در دسترس کاربر قرار نمیگیرند.
همچنین، به دلیل اینکه در هستیشناسی از موتور استنتاج برای ترکیب قواعد معنایی استفاده میشود، استفاده از این ابزار در کتابخانههای دیجیتال، امکان ترکیب قواعد منطقی در این کتابخانهها را فراهم میکند.
2. امکان تبادل اطلاعات میان کتابخانههای دیجیتال و سایر سامانههای اطلاعاتی
پاسخ به پرسشهای کاربران در کتابخانههای دیجیتال، مستلزم دسترسی به منابع اطلاعاتی موجود در سامانههای مختلف است. دسترسی یکپارچه به این منابع و مخازن پراکنده، سبب تسهیل و تسریع پاسخگویی به نیازهای اطلاعاتی کاربران میگردد. امروزه ایجاد امکان میانکنشپذیری میان کتابخانههای دیجیتال، چالش بزرگی را ایجاد کرده است. در دنیا، کتابخانههای دیجیتالی با مدیریت مستقل ایجاد میشوند. این کتابخانهها، سیاستهای مدیریتی و نیز نظامهای محاسبهای مختلفی دارند. همچنین، تفاوتهای بسیاری در ساختارهای دادهای، موتورهای جستجو، رابطههای کاربری، واژگان کنترل شده، قالبهای مدارک و... در کتابخانههای دیجیتال مختلف وجود دارد. به علت این تفاوتها، تحت کنترل واحد درآوردن کتابخانههای دیجیتالی در سطح ملی یا بینالمللی، تلاشی بیهوده و غیر ممکن است (نبوی، 1386). تولیدکنندگان کتابخانههای دیجیتال برای توصیف محتوای ذخیره شده از طبقهبندیها و طرحهای فرادادهای مختلف استفاده میکنند. این مسئله کاربران را ملزم میسازد تا بازنمونهای مختلف دانش را در سامانههای گوناگون، جستجو نمایند. چالش مهم در این زمینه، یکپارچه کردن منابع دانش ساختار یافته (مانند فراداده مدارک) و منابع فاقد ساختار (مانند مدارک تمام متن) است. کاربر باید به منابع دانش پراکنده از طریق یک رابط کاربری واحد که طرحهای فرادادهای و ساختارهای سلسله مراتبی موضوعی مختلف را یکپارچه میکند، دسترسی یابد (بلودورن و دیگران، 2007).
هستیشناسی، ابزاری معنایی است که مفاهیم مشترک و مورد اجماع متخصصان در یک حوزة موضوعی را در بر میگیرد و برای توصیف مفاهیم و روابط میان آنها، از قواعد و استانداردهایی استفاده میکند. ارائه مفاهیم مشترک و نیز قواعد و استانداردها در هستیشناسی، امکان تبادل اطلاعات میان کتابخانههای دیجیتال و یکپارچگی منابع دانش پراکنده در سامانههای اطلاعاتی مختلف را فراهم میکند. برای ایجاد ارتباط میان کتابخانههای دیجیتال و گردآوری اطلاعات از منابع پراکنده، میتوان از یک هستیشناسی هسته و مشترک برای یکپارچهسازی دادهها و فرادادههایی که اشیای کتابخانة دیجیتالی را توصیف میکنند، استفاده کرد. این هستیشناسی میتواند برای انواع منابع اطلاعاتی و به منظور ایجاد ارتباط میان حوزهای، به کار رود.
هستیشناسی هسته، یک هستیشناسی کامل و گسترشپذیر است که مفاهیم پایه و اصلیِ مشترک میان تعدادی از حوزهها را توصیف میکند و میتواند مبنایی برای تخصصگرایی در مفاهیم و واژگان حوزههای مختلف ایجاد کند. استفاده از هستیشناسی هسته برای نگاشت مطلوب میان بازنمونهای دانش حوزهای (یعنی واژگان فرادادهای) و ایجاد خدمات متنوع مانند جستجوی میان حوزهای، مرور، داده کاوی و استخراج دانش، ضروری است (دوئر ، هانتر و لاگز ، 2003).
در زمینة ایجاد امکان تبادل اطلاعات میان کتابخانههای دیجیتال، پروتکلهایی نیز ایجاد شده است. برای نمونه، کتابخانه دیجیتال JeromeDL از پروتکل گسترشپذیر کتابخانه استفاده کرده است. JeromeDL با ایجاد زیرساخت ارتباطی برای یک شبکة توزیع شده از کتابخانههای دیجیتال مستقل (L2L)، از ایجاد کتابخانههای دیجیتال یکپارچه و پیوسته حمایت میکند. هدف پروتکل گسترشپذیر کتابخانه، ایجاد ارتباط میان محیطهای ناهمگون کتابخانههای دیجیتال است. هر کتابخانه باید حداقل با یک کتابخانه دیجیتال دیگر مرتبط باشد. به این ترتیب، میتواند به شبکه L2L بپیوندد. هر پرسش در درخت شبکه L2L پردازش میشود. برای پیوستن به این شبکه، هر کتابخانه دیجیتال باید حداقل از فراداده دوبلین کور پشتیبانی کند. اگر دو کتابخانه دیجیتال، منابع را همراه با معانی توصیف کنند (مانند سامانة JeromeDL)، ارتباط بین آنها به طور خودکار تا سطح توصیف معنایی افزایش مییابد و امکان استفاده از الگوریتم جستجوی معنایی در ارتباط L2L ایجاد میشود (کراک، دکر و زیبوراک ، 2005).
یکی از روشهایی که امروزه برای گسترش و یکپارچهسازی مفاهیم و ایجاد ارتباط میان سامانهها استفاده میشود، ترکیب و نگاشت هستیشناسیها با یکدیگر است. دو هستیشناسی CIDOC/CRM و ABC نمونههایی از هستیشناسیهایی هستند که برای تبادل اطلاعات میان سیستمهایی همچون کتابخانههای دیجیتال استفاده میشوند. CIDOC/CRM یک هستیشناسی برای تبادل اطلاعات در زمینة میراث فرهنگی و موزههاست و هستیشناسی ABC نیز مدلی برای تبادل و یکپارچهسازی اطلاعات کتابخانههای دیجیتال میباشد. میان این دو پایگاه دانش مختلف میتوان هماهنگی ایجاد کرد و مبنایی برای یکپارچهسازی اطلاعات در دامنهای وسیعتر فراهم نمود. شکل 1 روابط موجود در هستیشناسیهای ABC و CIDOC CRM را پس از ترکیب نشان میدهد (دوئر، هانتر و لاگز، 2003). در این فرایند، مفاهیم دو هستیشناسی نیز ترکیب میشوند.
شکل 1. روابط موجود در هستیشناسیهای ABC و CIDOC CRM پس از ترکیب (دوئر، هانتر و لاگز، 2003)
3. توصیف معنایی منابع موجود در کتابخانههای دیجیتال از طریق ادغام فرادادههای کتابشناختی قالب مارک در هستیشناسی (نمونه: هستیشناسی MarcOnt)
حجم زیاد منابع اطلاعاتی در عصر حاضر، کتابخانههای دیجیتال را با چالشهایی در زمینة سازماندهی و اشاعة این منابع روبه رو ساخته است. فرادادهها به عنوان یکی از عناصر اصلی وب معنایی در طول زمان برای سازماندهی این مدارک استفاده شدهاند. فراداده، دادهای است که محتوا و ویژگیهای هر منبع را در کتابخانه دیجیتالی توصیف میکند و سبب سهولت جستجو، سازماندهی، بهینهسازی عملکرد متقابل اطلاعات و مدیریت آسانتر مجموعههای اطلاعاتی میگردد (نبوی، 1386). فراداده در کتابخانههای دیجیتال به روشهای کدگذاری اطلاعات مربوط به منابع در قالبهای ماشینخوان و بویژه با تکمیل مجموعهای استاندارد از فیلدهای کتابشناختی، اشاره دارد. نمونههای معروف قالبهای فرادادهای، شامل USMARC برای منابع کتابخانهای، DublinCore برای ایجاد یک طرح سطح بالای توصیفی برای منابع وب و IMS برای منابع آموزشی هستند (شام ، موتا و دومینگو ، 2000).
یکی از مشکلاتی که امروزه در جستجو و بازیابی رکوردهای کتابشناختی در کتابخانههای دیجیتال وجود دارد، ضعف و کاستیهای قالبهای توصیف کتابشناختی برای توصیف دقیق و مفصل منابع اطلاعاتی است. برای میانکنشپذیری کتابخانههای دیجیتال، تعدادی استانداردهای توصیف کتابشناختی ایجاد شدهاند. برخی از آنها مانند MARC21 در سیستمهای سنتی کتابخانه به کار رفتهاند، در حالی که کتابخانههای دیجیتالی جدید از قالبهای معنایی غنیتر مانند Dublin Core یا BibTeX استفاده میکنند. اگرچه ترجمه کردن این استانداردها امکانپذیر است، اطلاعات زیادی هنگام ترجمه MARC21 به سایر قالبها از بین میرود (کراک، سایناک و زیمرمن، 2005).
تنوع قالبهای توصیف کتابشناختی برای کتابخانههای دیجیتال، نشاندهندة تنوع در کاربران و مخاطبان این کتابخانههاست. کاربران این کتابخانهها به سه دسته تقسیم میشوند. نحوة توصیف آثار در کتابخانه دیجیتال برای هر گروه، متفاوت است:
- کتابداران و کاربران کتابخانه به توصیف مفصل منابع همراه با جزئیات دقیق در قالب MARC21 نیاز دارند. معمولاً کتابخانههای دیجیتال سنّتی از این قالب توصیف استفاده میکنند.
- پژوهشگران و اعضای هیئت علمی به توصیف روابط استنادی در BibTeX نیاز دارند. کتابخانههای دیجیتالی ناشران که دسترسی به انتشارات، خلاصه مقالهها همایشها و... را فراهم میکنند، از این قالب استفاده مینمایند.
- کاربران عمومی اینترنت به توصیفات فشرده مانند Dublin Core نیاز دارند. آن دسته از کتابخانههای دیجیتالی که انواع مختلف منابع را برای کاربران فراهم کردهاند، از این قالب توصیف استفاده میکنند (همان، 2005).
هر یک از طرحهای بالا، دارای عناصر و ویژگیهای متفاوت است و به همین دلیل تبادل اطلاعات میان این قالبها دشوار است. برای غلبه بر این طبقهبندیهای متفاوت، از هستیشناسیها برای توصیف کتابشناختی منابع در کتابخانههای دیجیتال معنایی استفاده میشود. در مقایسه با سایر سامانههای توصیفی مربوط به کتابخانه، هستیشناسیها معنادارتر، دقیقتر و قویتر هستند (وینستین و الووی، 1997). در هستیشناسیها هر واژه در رابطه با سایر واژهها به صورت منطقی و دقیق توصیف شده است.
امروزه هستیشناسیهایی با عنوان هستیشناسی کتابشناختی ایجاد شده که به توصیف روابط میان آثار به طور واضح و دقیق میپردازند. یکی از معروفترین این هستیشناسیها، MarcOnt است. MarcOnt یک هستیشناسی است که مبتنی بر MARC21،BibTeX و Dublin Coreایجاد شده است. توصیفات کتابشناختی قالبهای مختلف در MarcOnt ارائه میشوند و کاربران میتوانند از ویژگیهای توصیف فرادادههای مختلف در طول ساخت پرسش استفاده کنند.
قالبهای کتابشناختی، مانند MARC21، Dublin Core یا BibTeX ممکن است شکلی از فایل متنی با فرمتبندی خاص یا فایل XML یا RDF را دربر گیرند. برای استفاده از اطلاعات آنها، باید چارچوبی برای پشتیبانی از ورود اطلاعات از یک قالب به توصیف معنایی MarcOnt و خروج اطلاعات به قالب دیگر به وجود آید. شکل 2 معماری کلی ابزارهای تبدیل قالبها در MarcOnt را نمایش میدهد (کراک، سایناک و زیمرمن، 2005):
شکل 2. ساختار خدمات واسطه MarcOnt برای تبدیل قالبها (کراک، سایناک و زیمرمن، 2005)
برای تبدیل قالب توصیف MARC21 به توصیف معنایی MarcOnt از روش زیر استفاده میشود. گفتنی است، تبدیل توصیفات معنایی قالب MarcOnt به MARC21 نیز با همین فرایند به طور معکوس، انجام میشود:
1. تجزیه کردن فایل MARC21 دودویی و ایجاد فایل MARC-XML
2. تبدیل فایل MARC-XML به فایل MARC-RDF با استفاده از XSLT
3. تبدیل گراف RDF به توصیف معنایی MarcOnt با استفاده از استنتاج یا ابزارهای دیگر.
گام اول نسبتاً ساده است، زیرا فرمت MARC-XML در متون به خوبی توصیف شده است و تنها نیاز به استفاده از کتابخانه تجزیهگر وجود دارد. در گام دوم، قالبی جدید به نام MARC-RDF ایجاد میشود تا دادههای XML را از فایل MARC-XML به گراف MARC-RDF ترجمه کند. MARC-RDF اطلاعات معنایی ارائه نمیکند و تنها از طبقهبندیهای مختلف (واژگان مختلف)، برای نمایش فیلدها و مقادیر MARC-XML، استفاده میکند. عمل تبدیل، به راحتی با استفاده از یک تبدیلکننده XSLT انجام میشود. گام سوم، مشکلترین گام است. در این مرحله، ترجمه یک گراف RDF به گراف دیگر با استفاده از مجموعهای از قواعد صورت میگیرد (همان، 2005).
4. ارتقای سیستم پرسش و پاسخ در کتابخانههای دیجیتال و بهبود جستجو و بازیابی مدارک
برخی کتابخانههای دیجیتال از هستیشناسی در سیستم پرسش و پاسخ خود استفاده کردهاند. در این بخش ساختار کتابخانه دیجیتال BT که از هستیشناسی در سیستم پرسش و پاسخ خود استفاده نموده، توصیف میشود. شکل 3 ساختار این کتابخانه را نمایش میدهد:
شکل 3. معماری سیستم کتابخانه دیجیتالی BT (ساختار مفهومی عملکرد) (بلودورن و دیگران، 2007)
این سیستم از فناوریهای مختلف معنایی مانند مدیریت هستیشناسی، یادگیری و استنتاج هستیشناسی، جستجوی کلیدواژهای و ردهبندی متن استفاده نموده تا پاسخهای مناسب برای پرسشهای زبان طبیعی در کتابخانه دیجیتال فراهم نماید. ساختار این کتابخانه، مطابق شکل از اجزای اصلی زیر تشکیل شده است:
پورتال دانش : این بخش، رابط کاربری کتابخانه دیجیتال و واسطه تعامل کاربر و سیستم است. کاربر با پورتال از طریق طرح پرسشهایی به زبان طبیعی در تعامل است. فرایند انجام شده در پاسخگویی به پرسش، برای کاربر کاملاً روشن است.
ترجمه پرسش : این بخش، پرسشهای زبان طبیعی را با استفاده از هستیشناسی، به پرسشهای منطقی ساختار یافته ترجمه میکند. این ترجمه بر مبنای تجزیة عمیق پرسشها، با استفاده از یک واژهنامه که واژگان مجاز برای عناصر هستیشناسی را توصیف میکند، انجام میشود. پرسشهای منطقی در قالب SPARQL که یک زبان پرسش استاندارد طراحی شده توسط W3C برای وب معنایی است، بیان میشوند. ORAKEL یک رابط کاربری زبان طبیعی است که در این بخش پرسشهای زبان طبیعی را بر اساس یک هستیشناسی، به پرسشهای ساختار یافته ترجمه میکند و به نحوی طراحی شده که میتواند پرسشهای SPARQL تولید کند. به این ترتیب کاربران قادرند با دسترسی به دادههای کتابخانه دیجیتال، از طریق پرسشهای زبان طبیعی که توسط سیستم ORAKEL به پرسشهای SPARQL ترجمه شدهاند، به طور مستقیم با پورتال کتابخانه دیجیتال BT تعامل داشته باشند. کاربران پرسش خود را به صورت طبیعی وارد میکنند و نتایج را از طریق پورتال به دست میآورند.
پاسخگویی به پرسش : در این بخش، یکپارچهسازی هستیشناسیها توسط سیستم مدیریت هستیشناسی KAON2 مدیریت میشود و به عنوان بخش اصلی پاسخگویی به پرسشهای SPARQL بر مبنای منابع دانش عمل میکند. فرایند پاسخگویی به پرسش، به یک پردازش منطقی بر روی منابع دانش مطابق با معانی زبان هستیشناسی OWL نیاز دارد. بسط پرسش میتواند سبب گسترش عملیات جستجو گردد. پاسخها هم به صورت دستههایی از اطلاعات متنوع و پیوسته ارائه میشوند.
پایگاه دانش : پایگاه دانش کتابخانه دیجیتال، شامل منابع دانش مختلف و ناهمگون است که برخی در قالب فراداده، ساختار بندی شده و برخی نیز در قالب مدارک تمام متن و فاقد ساختار ارائه گردیدهاند. همه این منابع داده با استفاده از یک هستیشناسی به نام PROTON به هم پیوستهاند. بخش یادگیری هستیشناسی برای استخراج خودکار هستیشناسیهای ساختار یافته از مدارک متنی فاقد ساختار و نیز استخراج موضوعات و مفاهیم و روابط جدید از مجموعه مدارک، استفاده میشود. برای این هدف، از Text2Onto که قالبی برای یادگیری هستیشناسی و ارزیابی آن بر مبنای استخراج داده است، استفاده شده است. این ابزار بر مبنای ترکیب پردازش زبان طبیعی و فنون یادگیری ماشینی، برای استخراج هستیشناسیها از منابع متنی فاقد ساختار به کار میرود. این بخش امکان پیوند مدارک متنی با سایر منابع داده را فراهم میکند تا این منابع به شیوهای یکپارچه، برای پاسخگویی به پرسشها استفاده شوند.
گویایی، معناداری و دقت هستیشناسیها در سامانة کتابخانه دیجیتال BT، امکاناتی برای جستجو فراهم نموده که اغلب سامانههای اطلاعاتی کنونی فاقد آن هستند. در این سامانه این امکان وجود دارد که محتوا به جای ترکیب کلیدواژهها با استفاده از پرسشهایی معنادار که معادل جملههای زبان طبیعی است، جستجو شود. به طور کلی، مزایای کاربرد فناوریهای معنایی در فرایند جستجو و بازیابی کتابخانههای دیجیتال، عبارتند از:
1. پرسشهای زبان طبیعی میتوانند به طور دقیق بر مبنای فنون پرسشگری منطقی استاندارد پاسخ داده شوند.
2. موضوعات میتوانند به طور خودکار در طول زمان کشف شوند و به سامانه بپیوندند.
3. مدارک متنی میتوانند بر مبنای پرسش کاربر، طبقهبندی شوند (بلودورن و دیگران، 2007).
5. ایجاد محیط رابط کاربرپسند (نمونه: هستیشناسی ScholOnto)
ارتباط بین کاربران و رایانهها، موضوع تحقیق عمیقی است که در حوزههای متنوعی مانند علوم شناختی، طراحی گرافیک و مدلسازی ریاضی سامانههای رایانهای مورد بحث قرار گرفته است. رابط کاربری در کتابخانههای دیجیتال و سامانههای اطلاعاتی بخشی از پایگاه است که امکان تعامل و ارتباط کاربر با سیستم را فراهم میکند.
کاربران کتابخانههای دیجیتال از نظر استفاده از رایانه و بهرهمندی از امکانات رابط کاربری، دارای مهارتها و توانمندیهای متفاوت هستند. به همین دلیل، این کتابخانهها باید علاوه بر متخصصان، برای افرادی که از حداقل آموزش در زمینة استفاده از این کتابخانهها برخوردارند، نیز قابل استفاده باشند و امکانات لازم برای دسترسی و بازیابی اطلاعات مرتبط را در اختیار کاربران قرار دهند. رابطهای کاربری دارای امکاناتی مانند فونتها، رنگها، علایم، کنترلهای صفحه کلید، فهرستهای انتخاب و منوها هستند که بر روی صفحه نمایش ظاهر میشوند و کاربر را برای جستجو و بازیابی بهتر راهنمایی میکنند. رابطها همچنین عملکردهای خاصی مانند انتخاب بخشهایی از یک شیء دیجیتال، جستجوی فهرست، ذخیره نتایج و... را برای جستجو و بازیابی اطلاعات در اختیار کاربر قرار میدهند (آرمز ، 1381). استفاده از هستیشناسی در طراحی رابطهای کاربری کتابخانههای دیجیتال میتواند امکانات بیشتری را برای جستجو و بازیابی منابع مرتبط فراهم کند.
ScholOnto یک سرویسدهندة کتابخانة دیجیتال مبتنی بر هستیشناسی است که از متون علمی و نیز بحث و تبادل نظر پژوهشگران با یکدیگر حمایت میکند. این بحثها میتوانند از یادداشتهای شخصی محققان در مورد مدرک تا ایمیل شخصی و گروههای مباحثه و نقدهای رسمی همکاران از مقالههای کنفرانس، مجله و نقدهای منتشر شده از متون و کتابها را دربر گیرند. در ادامه، چند رابط کاربری که توسط ScholOnto برای جستجو در کتابخانه دیجیتال و ثبت نظرهای محققان در مورد مدارک ارائه شده، در شکلهای 4، 5 و 6 نمایش داده شده است. همه شکلها، توصیف مقالهای با نام «مدل مرجع فرامتن دکستر » نوشته «هالاز» و «شوارتز» را نمایش میدهد. در شکل 4، بخش بالایی، فرادادههای استاندارد کتابشناختی کتابخانه دیجیتال را نشان میدهد. بخش میانی برای افزودن نظرهای جدید در مورد مدارک و تبادل نظر پژوهشگران استفاده میشود و پایینترین بخش، روابط اصلی میان متون موجود را نمایش میدهد (شام، موتا و دومینگو، 2000).
شکل 4. رابط کاربری برای ثبت نظرهای پژوهشگران در مورد مدارک توسط ScholOnto (شام، موتا و دومینگو، 2000)
شکل 5، نمونة دیگری از رابط کاربری ایجاد شده توسط ScholOnto را نشان میدهد. در این شکل، مدرک با استفاده از مفاهیم ScholOnto یادداشتگذاری شده است. ابزار یادداشتگذاری توسط پروژه Enrich ایجاد شده است. این رابط کاربری، امکان ایجاد پیوند به بخشهای مختلف مدرک را فراهم میکند.
شکل 5. رابط کاربری دارای ابزار یادداشت گذاری مدارک با استفاده از مفاهیم ScholOnto (شام، موتا و دومینگو، 2000)
شکل 6 نیز نمونهای دیگر از رابط کاربری است که توصیف تصویری مقالة دکستر را توسط یک ابزار نگاشت فرا رسانهای نشان میدهد. این تصویر نشان میدهد شبکة معنایی، بهترین مدل مفهومی برای سیستم است و به کاربران امکان میدهد با ترسیم نقشه و به صورت گرافیکی، به بیان نظرهای خود بپردازند.
شکل 6. رابط کاربری با امکان ترسیم مفاهیم برای بیان معانی مدرک (شام، موتا و دومینگو، 2000)
در حال حاضر تلاش میشود رابطهای کاربری متفاوتی ایجاد شود که با سرویس دهنده ScholOnto تعامل داشته باشد.
4- نتیجهگیری
مباحثی که در مقالة حاضر مطرح شد، اهمیت فناوریهای معنایی و بویژه هستیشناسیها را در طراحی کتابخانههای دیجیتال معنایی روشن میسازد. نرمافزارهایی که هم اکنون برای طراحی کتابخانههای دیجیتال به کار میروند، برای توصیف، سازماندهی، نمایش، جستجو و بازیابی اطلاعات موجود در کتابخانههای دیجیتال، کاستیهایی دارند. هستیشناسیها با تعریف دقیق عناصر کتابشناختی موجود در کتابخانههای دیجیتال، قادرند امکانات مختلفی را به نرمافزارهای کنونی بیفزایند. در این مقاله، برخی از این امکانات شامل ایجاد قابلیت استدلال و استنتاج، امکان تبادل اطلاعات میان کتابخانههای دیجیتال و سایر سامانههای اطلاعاتی، توصیف معنایی منابع موجود در کتابخانههای دیجیتال، ارتقای سیستم پرسش و پاسخ در کتابخانههای دیجیتال، ایجاد محیط رابط کاربرپسند و امکان مرور و جستجوی آسان و سریع مدارک، بررسی گردید. به هر حال، استفاده از هستیشناسیها در بافت کتابخانههای دیجیتال آغاز شده است و کتابخانههای دیجیتال در حال گذر به سامانههای هوشمند معنایی هستند که امکانات بیشتری به منظور مدیریت محتوا، ارائه خدمات و دسترسی کاربران به منابع فراهم میکنند. هر چند بسیاری از کتابخانههای کنونی، تا تحقق این امر فاصله زیادی دارند، پیشرفت سریع فناوریهای اطلاعاتی و ارتباطی و تنوع نیازهای کاربران، بروز تحولاتی در کتابخانههای دیجیتال و تلاش در طراحی کتابخانههای دیجیتال معنایی را اجتناب ناپذیر میسازد.