نگاهی نو به طراحی کتابخانه های دیجیتال: کاربرد هستی شناسی در طراحی کتابخانه های دیجیتال معنایی

نوع مقاله: مقاله پژوهشی

نویسنده

فارغ التحصیل دکترا

چکیده

هدف / زمینه: کتابخانة‎ دیجیتال، مجموعه‎ای یکپارچه از منابع و خدمات الکترونیکی برای گردآوری، سازماندهی، حفاظت و بازیابی اطلاعات به شکل دیجیتال است. ظهور وب معنایی و هستی‎شناسی در عصر حاضر، سبب ایجاد تحول در کتابخانه‎های دیجیتال و طراحی کتابخانه‎های دیجیتال معنایی شده است. در این راستا، مقالة حاضر در نظر دارد به بررسی کاربردهای هستی‎شناسی در طراحی کتابخانه‎های دیجیتال معنایی بپردازد.
روش: هستی‎شناسی، بازنمونی صریح، دقیق و گویا از نمونه‎ها، مفاهیم و روابط در یک حوزه موضوعی است که با توجه به ویژگیهایی همچون قابلیت استنتاج، ایجاد ارتباط و میانکنش پذیری بین سامانه‎های اطلاعاتی، حمایت از پردازش زبان طبیعی، فهم پرسش جستجو و...، می‎تواند برای تبدیل کتابخانه‎های دیجیتال به سامانه‎های اطلاعاتی هوشمند و در نتیجه طراحی کتابخانه‎های دیجیتال معنایی، مورد استفاده قرار گیرد.
یافته‎ها: ایجاد قابلیتهای گوناگون در معماری کتابخانه‎های دیجیتال بویژه قابلیت استدلال، امکان تبادل اطلاعات میان کتابخانه‎های دیجیتال و سایر سامانه‎های اطلاعاتی، توصیف معنایی منابع موجود در کتابخانه‎های دیجیتال از طریق ادغام فراداده‎های کتابشناختی قالب مارک در هستی‎شناسی (مانند هستی‎شناسی MarcOnt)، ارتقای سیستم پرسش و پاسخ در کتابخانه‎های دیجیتال (مانند BT Digital Library)، ایجاد محیط رابط کاربرپسند و امکان مرور و جستجوی آسان و سریع مدارک، برخی از کاربردهای هستی‎شناسی در کتابخانه‎های دیجیتال هستند که در این مقاله بررسی می‎شوند.

کلیدواژه‌ها


مقدمه
امروزه، گسترش فناوریهای اطلاعاتی و ارتباطی و افزایش حجم متون و مدارک تخصصی در رسانه‎ها و قالبهای مختلف از یک سو و نیاز کاربران و متخصصان به بازیابی اطلاعات مرتبط در کمترین زمان از سوی دیگر، کتابخانه‎های دیجیتال را با چالشهایی در زمینة ذخیره، نگهداری، سازماندهی، بازیابی و مدیریت اطلاعات این مجموعه‎ها روبه رو ساخته است. از آنجا که این کتابخانه‎ها در محیط وب ارائه می‎شوند، مشکلات محیط وب نیز بر مسائل بالا افزوده است. ظهور وب معنایی در سالهای اخیر، امکانات و قابلیتهای فراوانی برای رفع مشکلات وب و افزایش دسترسی به اطلاعات در سیستمهای اطلاعاتی ایجاد کرده است. بنابراین، استفاده از ابزارها و فناوریهای معنایی مانند هستی‌شناسی‌ها در کتابخانه‎های دیجیتال می‎تواند سبب رفع بسیاری از کاستیها و مشکلات این کتابخانه‎ها و ایجاد «کتابخانه‎های دیجیتال معنایی» گردد. در این مقاله، برخی از کاربردهای هستی‎شناسی در طراحی کتابخانه‎های دیجیتال معنایی بررسی می‎شود.
هستی‎شناسی و کتابخانه‎های دیجیتال معنایی
هستی‎شناسی، مدلی واضح و صریح از یک حوزة دانش، شامل مجموعه‎ای از مفاهیم، تعاریف آنها و روابط میان آنها در آن حوزه است (یو ، توم و تام ، 2007). «گروبر» (1993) هستی‎شناسی را مفهومی می‎داند که به ایجاد فهم مشترک از حوزه‎ها اشاره دارد و شامل مجموعه‎ای از مفاهیم، روابط، کارکردها، اصول بدیهی و نمونه‎هاست. امروزه هستی‎شناسیها به عنوان ابزارهای معنایی، در حوزه‎های مختلف همچون سامانه‎های بازیابی اطلاعات معنایی، سامانه‎های مدیریت دانش معنایی، فهرستهای معنایی و... کاربرد دارند. ویژگیهای بارز هستی‎شناسی‌ها همچون قابلیت استنتاج، ایجاد ارتباط و میانکنش‎پذیری بین سامانه‎های اطلاعاتی، حمایت از پردازش زبان طبیعی، فهم پرسش جستجو و...، توجه پژوهشگران را به استفاده از این ابزار در ایجاد کتابخانه‎های دیجیتال معنایی جلب نموده است.
در ساختار کتابخانه‎های دیجیتال معنایی از فناوریهای وب معنایی و سامانه‎های هوشمند مانند هستی‎شناسی استفاده شده است. هدف اصلی این نوع کتابخانه‎ها، ایجاد امکانات و شرایط بازیابی بهتر از طریق افزایش تعامل انسان و سیستم و نیز ایجاد دقت بالاتر در جستجوهای پراکنده در میان شبکه‎های ناهمگون کتابخانه‎های دیجیتال است (کراک ، سایناک و زیمرمن ، 2005).
برخی ویژگیهای کتابخانه‎های دیجیتال معنایی به صورت زیر بیان شده است (کراک و دیگران، 2006):
- کتابخانه‎های دیجیتال معنایی، اطلاعات را بر مبنای انواع طرحهای فراداده‎ای و عناصری مانند منابع، پرونده‎های کاربران و طبقه‎بندیهای مختلف، به هم پیوند می‎دهند.
- این کتابخانه‎ها امکان میانکنش‌پذیری با سایر سامانه‎ها (نه فقط کتابخانه‎های دیجیتال) را بر مبنای فراداده‎ها و سطوح ارتباط، فراهم می‎سازند.
- کتابخانه‎های دیجیتال معنایی رابطه‌های کاربری معنایی منسجم‌تر، کاربرپسندتر و با امکانات جستجو و مرور بیشتر را ایجاد می‎کنند.
- در این نوع کتابخانه‌ها، کاربران تنها به منزلة استفاده‎کنندگان و مشتریان کتابخانه نیستند، بلکه از طریق شبکه‎های اجتماعی در خلق محتوای کتابخانه دخالت دارند.
- کتابخانه‎های دیجیتال معنایی امکان انتقال از فضای اطلاعاتی ایستا به فضای دانشی پویا و مشترک را ایجاد می‎کنند.
استفاده از قابلیتهای وب معنایی، سبب افزایش کیفیت مدیریت محتوا، توسعة خدمات و بهبود جستجو و بازیابی اطلاعات در کتابخانه‎های دیجیتال می‎گردد. همزمان، ارائه توصیفهای معنایی منابع اطلاعاتی و پرونده‎های مربوط به مشخصات و نیازهای اطلاعاتی کاربران، میزان استفاده‌پذیری کتابخانه‎های دیجیتال را افزایش می‎دهد. کتابخانه‎های دیجیتال می‎توانند با استفاده از فناوریهای معنایی همچون هستی‌شناسی‎ها، با یکدیگر مرتبط شده و پایگاهی منسجم و یکپارچه را تشکیل دهند. هستی‌شناسی‎ها با توصیف دقیق و روشن اجزا و عناصر موجود در کتابخانه‎های دیجیتال، کاربران را در جستجوی معنایی و بازیابی مؤثر اطلاعات در مجموعه این کتابخانه‎ها و سایر سامانه‎های اطلاعاتی یاری می‎دهند و سبب ایجاد تحولات گسترده‎ای در سیستمهای سنتی کتابخانه‎های دیجیتال می‎گردند. در ادامه، برخی از مهم‌ترین کاربردهای هستی‌شناسی در طراحی کتابخانه‎های دیجیتال معنایی، به تفصیل بررسی شده است.
کاربردهای هستی‎شناسی در طراحی کتابخانه‎های دیجیتال معنایی
در این بخش، ضمن بررسی برخی از کاربردهای هستی‎شناسی در طراحی کتابخانه‎های دیجیتال معنایی، سعی شده به نمونه‎هایی از این کتابخانه‎ها و کاربرد هستی‎شناسی در آنها پرداخته شود.
1. ایجاد قابلیت استدلال و استنتاج در کتابخانه‎های دیجیتال
دقت تعریفهای ارائه شده در هستی‌شناسی، امکان استدلال و استنتاج گسترده را در کتابخانه‎های دیجیتال معنایی فراهم می‎کند. در این بخش، استفاده از منطق و استدلال در کتابخانه‎های دیجیتال، در چهار فرایند دسترسی، توصیف، حقوق و خدمات، بررسی شده است (وینستین و الووی ، 1997):
1. استفاده از منطق و استدلال در فرایند دسترسی: استنتاج و منطق در کتابخانه‎های دیجیتال برای بهبود عملیات جستجو و مرور، حتی زمانی که اطلاعات کمی از منبع مورد نظر در اختیار داریم، به کار می‎رود. برای نمونه، اگر بدانیم که اثر مورد نظر ما در قالب مقاله منتشر شده است، سامانة هوشمند معنایی، منابعی را به ما پیشنهاد می‎کند که در قالب مجله‎ها، روزنامه‎ها و مجله‎های تخصصی باشند و یا این منابع را نمایه کنند، زیرا این منابع مجموعه‎هایی از مقاله‎ها هستند.
2. استفاده از منطق و استدلال در فرایند توصیف: منطق در این فرایند برای ایجاد توصیف کامل‌تر منابع نسبت به توصیفهای ناقص، استفاده می‎شود. برای نمونه، اگر سیستم نام پدیدآور (A) یک رمان (N) را بداند و نیز بداند که برخی شکلهای رمان در قالب کتاب توسط ناشر (P) منتشر شده‌اند، می‎تواند استنباط کند که اثر پدیدآور (A) توسط ناشر (P) منتشر شده و اینکه ناشر (P)، اثر پدیدآور (A) را منتشر کرده است.
3. استفاده از منطق و استدلال در مسائل مربوط به حقوق اثر: در اینجا، استدلال و منطق برای تعیین حقوق اثر و بخشهایی که مجوز استفاده برای کاربران دارند، به کار می‎رود. برای نمونه، اگر رمان (N) (در مثال بالا) توسط ناشر (P) در قالب کتاب منتشر شده باشد، می‎توان با استفاده از منطق و استنتاج، به طور خودکار قوانین و حقوقی را برای این رمان در قالب کتاب، تعیین نمود. تعیین حقوق اثر ممکن است از مجوز استاندارد ناشر یا پدیدآور، استنتاج شود.
4. استفاده از منطق و استدلال در خدمات: استنتاج در این بخش برای پیشنهاد رده‎ها یا ابزارهای خاص به منظور انجام عملیاتی بر روی اثر توسط کاربران به کار می‎رود. برای نمونه، اگر ویرایشی از رمان (N) در قالب تصویر باشد و کاربر، مجوز چاپ یا تغییر رمان را نداشته باشد، بنابراین ابزارهایی که برای کاربر به منظور دسترسی به رمان فراهم است، ابزارهای «تنها تصویر را ببین » هستند. سایر ابزارهایی که امکان انتقال یا تغییر اثر را فراهم می‎کنند، در دسترس کاربر قرار نمی‎گیرند.
همچنین، به دلیل اینکه در هستی‌شناسی از موتور استنتاج برای ترکیب قواعد معنایی استفاده می‎شود، استفاده از این ابزار در کتابخانه‎های دیجیتال، امکان ترکیب قواعد منطقی در این کتابخانه‎ها را فراهم می‎کند.
2. امکان تبادل اطلاعات میان کتابخانه‎های دیجیتال و سایر سامانه‎های اطلاعاتی
پاسخ به پرسشهای کاربران در کتابخانه‎های دیجیتال، مستلزم دسترسی به منابع اطلاعاتی موجود در سامانه‎های مختلف است. دسترسی یکپارچه به این منابع و مخازن پراکنده، سبب تسهیل و تسریع پاسخگویی به نیازهای اطلاعاتی کاربران می‎گردد. امروزه ایجاد امکان میانکنش‌پذیری میان کتابخانه‎های دیجیتال، چالش بزرگی را ایجاد کرده است. در دنیا، کتابخانه‎های دیجیتالی با مدیریت مستقل ایجاد می‎شوند. این کتابخانه‌ها، سیاستهای مدیریتی و نیز نظامهای محاسبه‎ای مختلفی دارند. همچنین، تفاوتهای بسیاری در ساختارهای داده‌ای، موتورهای جستجو، رابطه‌های کاربری، واژگان کنترل شده، قالبهای مدارک و... در کتابخانه‎های دیجیتال مختلف وجود دارد. به علت این تفاوتها، تحت کنترل واحد درآوردن کتابخانه‎های دیجیتالی در سطح ملی یا بین‎المللی، تلاشی بیهوده و غیر ممکن است (نبوی، 1386). تولیدکنندگان کتابخانه‎های دیجیتال برای توصیف محتوای ذخیره شده از طبقه‎بندیها و طرحهای فراداده‎ای مختلف استفاده می‎کنند. این مسئله کاربران را ملزم می‎سازد تا بازنمونهای مختلف دانش را در سامانه‎های گوناگون، جستجو نمایند. چالش مهم در این زمینه، یکپارچه کردن منابع دانش ساختار یافته (مانند فراداده مدارک) و منابع فاقد ساختار (مانند مدارک تمام متن) است. کاربر باید به منابع دانش پراکنده از طریق یک رابط کاربری واحد که طرحهای فراداده‎ای و ساختارهای سلسله مراتبی موضوعی مختلف را یکپارچه می‎کند، دسترسی یابد (بلودورن و دیگران، 2007).
هستی‎شناسی، ابزاری معنایی است که مفاهیم مشترک و مورد اجماع متخصصان در یک حوزة موضوعی را در بر می‎گیرد و برای توصیف مفاهیم و روابط میان آنها، از قواعد و استانداردهایی استفاده می‎کند. ارائه مفاهیم مشترک و نیز قواعد و استانداردها در هستی‎شناسی، امکان تبادل اطلاعات میان کتابخانه‎های دیجیتال و یکپارچگی منابع دانش پراکنده در سامانه‎های اطلاعاتی مختلف را فراهم می‎کند. برای ایجاد ارتباط میان کتابخانه‎های دیجیتال و گردآوری اطلاعات از منابع پراکنده، می‎توان از یک هستی‎شناسی هسته و مشترک برای یکپارچه‌سازی داده‎ها و فراداده‌هایی که اشیای کتابخانة دیجیتالی را توصیف می‎کنند، استفاده کرد. این هستی‎شناسی می‎تواند برای انواع منابع اطلاعاتی و به منظور ایجاد ارتباط میان حوزه‎ای، به کار رود.
هستی‎شناسی هسته، یک هستی‎شناسی کامل و گسترش‌پذیر است که مفاهیم پایه و اصلیِ مشترک میان تعدادی از حوزه‎ها را توصیف می‎کند و می‎تواند مبنایی برای تخصص‌گرایی در مفاهیم و واژگان حوزه‎های مختلف ایجاد کند. استفاده از هستی‎شناسی هسته برای نگاشت مطلوب میان بازنمونهای دانش حوزه‎ای (یعنی واژگان فراداده‌ای) و ایجاد خدمات متنوع مانند جستجوی میان حوزه‌ای، مرور،‎ داده کاوی و استخراج دانش، ضروری است (دوئر ، هانتر و لاگز ، 2003).
در زمینة ایجاد امکان تبادل اطلاعات میان کتابخانه‎های دیجیتال، پروتکلهایی نیز ایجاد شده است. برای نمونه، کتابخانه دیجیتال JeromeDL از پروتکل گسترش‎پذیر کتابخانه استفاده کرده است. JeromeDL با ایجاد زیرساخت ارتباطی برای یک شبکة توزیع شده از کتابخانه‎های دیجیتال مستقل (L2L)، از ایجاد کتابخانه‎های دیجیتال یکپارچه و پیوسته حمایت می‎کند. هدف پروتکل گسترش‌پذیر کتابخانه، ایجاد ارتباط میان محیطهای ناهمگون کتابخانه‎های دیجیتال است. هر کتابخانه باید حداقل با یک کتابخانه دیجیتال دیگر مرتبط باشد. به این ترتیب، می‎تواند به شبکه L2L بپیوندد. هر پرسش در درخت شبکه L2L پردازش می‎شود. برای پیوستن به این شبکه، هر کتابخانه دیجیتال باید حداقل از فراداده دوبلین کور پشتیبانی کند. اگر دو کتابخانه دیجیتال، منابع را همراه با معانی توصیف کنند (مانند سامانة JeromeDL)، ارتباط بین آنها به طور خودکار تا سطح توصیف معنایی افزایش می‎یابد و امکان استفاده از الگوریتم جستجوی معنایی در ارتباط L2L ایجاد می‎شود (کراک، دکر و زیبوراک ، 2005).
یکی از روشهایی که امروزه برای گسترش و یکپارچه‎سازی مفاهیم و ایجاد ارتباط میان سامانه‎ها استفاده می‎شود، ترکیب و نگاشت هستی‎شناسی‌ها با یکدیگر است. دو هستی‌شناسی CIDOC/CRM و ABC نمونه‌هایی از هستی‎شناسی‎هایی هستند که برای تبادل اطلاعات میان سیستمهایی همچون کتابخانه‎های دیجیتال استفاده می‎شوند. CIDOC/CRM یک هستی‎شناسی برای تبادل اطلاعات در زمینة میراث فرهنگی و موزه‎هاست و هستی‎شناسی ABC نیز مدلی برای تبادل و یکپارچه‎سازی اطلاعات کتابخانه‎های دیجیتال می‎باشد. میان این دو پایگاه دانش مختلف می‎توان هماهنگی ایجاد کرد و مبنایی برای یکپارچه‎سازی اطلاعات در دامنه‎ای وسیع‎تر فراهم نمود. شکل 1 روابط موجود در هستی‎شناسی‌های ABC و CIDOC CRM را پس از ترکیب نشان می‎دهد (دوئر، هانتر و لاگز، 2003). در این فرایند، مفاهیم دو هستی‎شناسی نیز ترکیب می‎شوند.

شکل 1. روابط موجود در هستی‎شناسی‎های ABC و CIDOC CRM پس از ترکیب (دوئر، هانتر و لاگز، 2003)
3. توصیف معنایی منابع موجود در کتابخانه‎های دیجیتال از طریق ادغام فراداده‎های کتابشناختی قالب مارک در هستی‎شناسی (نمونه: هستی‎شناسی MarcOnt)
حجم زیاد منابع اطلاعاتی در عصر حاضر، کتابخانه‎های دیجیتال را با چالشهایی در زمینة سازماندهی و اشاعة این منابع روبه رو ساخته است. فراداده‎ها به عنوان یکی از عناصر اصلی وب معنایی در طول زمان برای سازماندهی این مدارک استفاده شده‌اند. فراداده، داده‎ای است که محتوا و ویژگیهای هر منبع را در کتابخانه دیجیتالی توصیف می‎کند و سبب سهولت جستجو، سازماندهی، بهینه‎سازی عملکرد متقابل اطلاعات و مدیریت آسان‎تر مجموعه‎های اطلاعاتی می‎گردد (نبوی، 1386). فراداده در کتابخانه‎های دیجیتال به روشهای کدگذاری اطلاعات مربوط به منابع در قالبهای ماشین‌خوان و بویژه با تکمیل مجموعه‎ای استاندارد از فیلدهای کتابشناختی، اشاره دارد. نمونه‎های معروف قالبهای فراداده‎ای، شامل USMARC برای منابع کتابخانه‎ای، DublinCore برای ایجاد یک طرح سطح بالای توصیفی برای منابع وب و IMS برای منابع آموزشی هستند (شام ، موتا و دومینگو ، 2000).
یکی از مشکلاتی که امروزه در جستجو و بازیابی رکوردهای کتابشناختی در کتابخانه‎های دیجیتال وجود دارد، ضعف و کاستیهای قالبهای توصیف کتابشناختی برای توصیف دقیق و مفصل منابع اطلاعاتی است. برای میانکنش‌پذیری کتابخانه‎های دیجیتال، تعدادی استانداردهای توصیف کتابشناختی ایجاد شده‌اند. برخی از آنها مانند MARC21 در سیستمهای سنتی کتابخانه به کار رفته‎اند، در حالی که کتابخانه‎های دیجیتالی جدید از قالبهای معنایی غنی‌تر مانند Dublin Core یا BibTeX استفاده می‎کنند. اگرچه ترجمه کردن این استانداردها امکان‎پذیر است، اطلاعات زیادی هنگام ترجمه MARC21 به سایر قالبها از بین می‎رود (کراک، سایناک و زیمرمن، 2005).
تنوع قالبهای توصیف کتابشناختی برای کتابخانه‎های دیجیتال، نشان‎دهندة تنوع در کاربران و مخاطبان این کتابخانه‎هاست. کاربران این کتابخانه‎ها به سه دسته تقسیم می‎شوند. نحوة توصیف آثار در کتابخانه دیجیتال برای هر گروه، متفاوت است:
- کتابداران و کاربران کتابخانه به توصیف مفصل منابع همراه با جزئیات دقیق در قالب MARC21 نیاز دارند. معمولاً کتابخانه‎های دیجیتال سنّتی از این قالب توصیف استفاده می‎کنند.
- پژوهشگران و اعضای هیئت علمی به توصیف روابط استنادی در BibTeX نیاز دارند. کتابخانه‎های دیجیتالی ناشران که دسترسی به انتشارات، خلاصه مقاله‎ها همایشها و... را فراهم می‎کنند، از این قالب استفاده می‎نمایند.
- کاربران عمومی اینترنت به توصیفات فشرده مانند Dublin Core نیاز دارند. آن دسته از کتابخانه‎های دیجیتالی که انواع مختلف منابع را برای کاربران فراهم کرده‌اند، از این قالب توصیف استفاده می‎کنند (همان، 2005).
هر یک از طرحهای بالا، دارای عناصر و ویژگیهای متفاوت است و به همین دلیل تبادل اطلاعات میان این قالبها دشوار است. برای غلبه بر این طبقه‎بندیهای متفاوت، از هستی‎شناسی‌ها برای توصیف کتابشناختی منابع در کتابخانه‎های دیجیتال معنایی استفاده می‎شود. در مقایسه با سایر سامانه‎های توصیفی مربوط به کتابخانه، هستی‎شناسی‌ها معنادارتر، دقیق‎تر و قوی‎تر هستند (وینستین و الووی، 1997). در هستی‎شناسی‌ها هر واژه در رابطه با سایر واژه‎ها به صورت منطقی و دقیق توصیف شده است.
امروزه هستی‎شناسی‌هایی با عنوان هستی‌شناسی کتابشناختی ایجاد شده که به توصیف روابط میان آثار به طور واضح و دقیق می‎پردازند. یکی از معروف‌ترین این هستی‌شناسی‌ها، MarcOnt است. MarcOnt یک هستی‌شناسی است که مبتنی بر MARC21،BibTeX و Dublin Coreایجاد شده است. توصیفات کتابشناختی قالبهای مختلف در MarcOnt ارائه می‎شوند و کاربران می‎توانند از ویژگیهای توصیف فراداده‎های مختلف در طول ساخت پرسش استفاده کنند.
قالبهای کتابشناختی، مانند MARC21، Dublin Core یا BibTeX ممکن است شکلی از فایل متنی با فرمت‌بندی خاص یا فایل XML یا RDF را دربر گیرند. برای استفاده از اطلاعات آنها، باید چارچوبی برای پشتیبانی از ورود اطلاعات از یک قالب به توصیف معنایی MarcOnt و خروج اطلاعات به قالب دیگر به وجود آید. شکل 2 معماری کلی ابزارهای تبدیل قالبها در MarcOnt را نمایش می‎دهد (کراک، سایناک و زیمرمن، 2005):

شکل 2. ساختار خدمات واسطه MarcOnt برای تبدیل قالبها (کراک، سایناک و زیمرمن، 2005)

برای تبدیل قالب توصیف MARC21 به توصیف معنایی MarcOnt از روش زیر استفاده می‎شود. گفتنی است، تبدیل توصیفات معنایی قالب MarcOnt به MARC21 نیز با همین فرایند به طور معکوس، انجام می‎شود:
1. تجزیه کردن فایل MARC21 دودویی و ایجاد فایل MARC-XML
2. تبدیل فایل MARC-XML به فایل MARC-RDF با استفاده از XSLT
3. تبدیل گراف RDF به توصیف معنایی MarcOnt با استفاده از استنتاج یا ابزارهای دیگر.
گام اول نسبتاً ساده است، زیرا فرمت MARC-XML در متون به خوبی توصیف شده است و تنها نیاز به استفاده از کتابخانه تجزیه‌گر وجود دارد. در گام دوم، قالبی جدید به نام MARC-RDF ایجاد می‎شود تا داده‎های XML را از فایل MARC-XML به گراف MARC-RDF ترجمه کند. MARC-RDF اطلاعات معنایی ارائه نمی‎کند و تنها از طبقه‎بندیهای مختلف (واژگان مختلف)، برای نمایش فیلدها و مقادیر MARC-XML، استفاده می‎کند. عمل تبدیل، به راحتی با استفاده از یک تبدیل‎کننده XSLT انجام می‎شود. گام سوم، مشکل‎ترین گام است. در این مرحله، ترجمه یک گراف RDF به گراف دیگر با استفاده از مجموعه‎ای از قواعد صورت می‎گیرد (همان، 2005).
4. ارتقای سیستم پرسش و پاسخ در کتابخانه‎های دیجیتال و بهبود جستجو و بازیابی مدارک
برخی کتابخانه‎های دیجیتال از هستی‎شناسی در سیستم پرسش و پاسخ خود استفاده کرده‎اند. در این بخش ساختار کتابخانه دیجیتال BT که از هستی‎شناسی در سیستم پرسش و پاسخ خود استفاده نموده، توصیف می‎شود. شکل 3 ساختار این کتابخانه را نمایش می‎دهد:


شکل 3. معماری سیستم کتابخانه دیجیتالی BT (ساختار مفهومی عملکرد) (بلودورن و دیگران، 2007)

این سیستم از فناوریهای مختلف معنایی مانند مدیریت هستی‎شناسی، یادگیری و استنتاج هستی‎شناسی، جستجوی کلیدواژه‎ای و رده‎بندی متن استفاده نموده تا پاسخهای مناسب برای پرسشهای زبان طبیعی در کتابخانه دیجیتال فراهم نماید. ساختار این کتابخانه، مطابق شکل از اجزای اصلی زیر تشکیل شده است:
پورتال دانش : این بخش، رابط کاربری کتابخانه دیجیتال و واسطه تعامل کاربر و سیستم است. کاربر با پورتال از طریق طرح پرسشهایی به زبان طبیعی در تعامل است. فرایند انجام شده در پاسخگویی به پرسش، برای کاربر کاملاً روشن است.
ترجمه پرسش : این بخش، پرسشهای زبان طبیعی را با استفاده از هستی‎شناسی، به پرسشهای منطقی ساختار یافته ترجمه می‎کند. این ترجمه بر مبنای تجزیة عمیق پرسشها، با استفاده از یک واژه‎نامه که واژگان مجاز برای عناصر هستی‎شناسی را توصیف می‎کند، انجام می‎شود. پرسشهای منطقی در قالب SPARQL که یک زبان پرسش استاندارد طراحی شده توسط W3C برای وب معنایی است، بیان می‎شوند. ORAKEL یک رابط کاربری زبان طبیعی است که در این بخش پرسشهای زبان طبیعی را بر اساس یک هستی‎شناسی، به پرسشهای ساختار یافته ترجمه می‎کند و به نحوی طراحی شده که می‎تواند پرسشهای SPARQL تولید کند. به این ترتیب کاربران قادرند با دسترسی به داده‎های کتابخانه دیجیتال، از طریق پرسشهای زبان طبیعی که توسط سیستم ORAKEL به پرسشهای SPARQL ترجمه شده‎اند، به طور مستقیم با پورتال کتابخانه دیجیتال BT تعامل داشته باشند. کاربران پرسش خود را به صورت طبیعی وارد می‎کنند و نتایج را از طریق پورتال به دست می‎آورند.
پاسخگویی به پرسش : در این بخش، یکپارچه‎سازی هستی‎شناسی‎ها توسط سیستم مدیریت هستی‎شناسی KAON2 مدیریت می‎شود و به عنوان بخش اصلی پاسخگویی به پرسشهای SPARQL بر مبنای منابع دانش عمل می‎کند. فرایند پاسخگویی به پرسش، به یک پردازش منطقی بر روی منابع دانش مطابق با معانی زبان هستی‎شناسی OWL نیاز دارد. بسط پرسش می‎تواند سبب گسترش عملیات جستجو گردد. پاسخها هم به صورت دسته‌هایی از اطلاعات متنوع و پیوسته ارائه می‎شوند.
پایگاه دانش : پایگاه دانش کتابخانه دیجیتال، شامل منابع دانش مختلف و ناهمگون است که برخی در قالب فراداده، ساختار بندی شده و برخی نیز در قالب مدارک تمام متن و فاقد ساختار ارائه گردیده‎اند. همه این منابع داده با استفاده از یک هستی‎شناسی به نام PROTON به هم پیوسته‌اند. بخش یادگیری هستی‎شناسی برای استخراج خودکار هستی‎شناسی‌های ساختار یافته از مدارک متنی فاقد ساختار و نیز استخراج موضوعات و مفاهیم و روابط جدید از مجموعه مدارک، استفاده می‎شود. برای این هدف، از Text2Onto که قالبی برای یادگیری هستی‎شناسی و ارزیابی آن بر مبنای استخراج داده است، استفاده شده است. این ابزار بر مبنای ترکیب پردازش زبان طبیعی و فنون یادگیری ماشینی، برای استخراج هستی‎شناسی‌ها از منابع متنی فاقد ساختار به کار می‎رود. این بخش امکان پیوند مدارک متنی با سایر منابع داده را فراهم می‎کند تا این منابع به شیوه‎ای یکپارچه، برای پاسخگویی به پرسشها استفاده شوند.
گویایی، معناداری و دقت هستی‎شناسی‌ها در سامانة کتابخانه دیجیتال BT، امکاناتی برای جستجو فراهم نموده که اغلب سامانه‎های اطلاعاتی کنونی فاقد آن هستند. در این سامانه این امکان وجود دارد که محتوا به جای ترکیب کلیدواژه‎ها با استفاده از پرسشهایی معنادار که معادل جمله‎های زبان طبیعی است، جستجو شود. به طور کلی، مزایای کاربرد فناوریهای معنایی در فرایند جستجو و بازیابی کتابخانه‎های دیجیتال، عبارتند از:
1. پرسشهای زبان طبیعی می‎توانند به طور دقیق بر مبنای فنون پرسشگری منطقی استاندارد پاسخ داده شوند.
2. موضوعات می‎توانند به طور خودکار در طول زمان کشف شوند و به سامانه بپیوندند.
3. مدارک متنی می‎توانند بر مبنای پرسش کاربر، طبقه‌بندی شوند (بلودورن و دیگران، 2007).
5. ایجاد محیط رابط کاربرپسند (نمونه: هستی‎شناسی ScholOnto)
ارتباط بین کاربران و رایانه‌ها، موضوع تحقیق عمیقی است که در حوزه‎های متنوعی مانند علوم شناختی، طراحی گرافیک و مدل‎سازی ریاضی سامانه‎های رایانه‎ای مورد بحث قرار گرفته است. رابط کاربری در کتابخانه‎های دیجیتال و سامانه‎های اطلاعاتی بخشی از پایگاه است که امکان تعامل و ارتباط کاربر با سیستم را فراهم می‎کند.
کاربران کتابخانه‎های دیجیتال از نظر استفاده از رایانه و بهره‌مندی از امکانات رابط کاربری، دارای مهارتها و توانمندیهای متفاوت هستند. به همین دلیل، این کتابخانه‎ها باید علاوه بر متخصصان، برای افرادی که از حداقل آموزش در زمینة استفاده از این کتابخانه‎ها برخوردارند، نیز قابل استفاده باشند و امکانات لازم برای دسترسی و بازیابی اطلاعات مرتبط را در اختیار کاربران قرار دهند. رابطهای کاربری دارای امکاناتی مانند فونتها، رنگها، علایم، کنترلهای صفحه کلید، فهرستهای انتخاب و منوها هستند که بر روی صفحه نمایش ظاهر می‎شوند و کاربر را برای جستجو و بازیابی بهتر راهنمایی می‎کنند. رابطها همچنین عملکردهای خاصی مانند انتخاب بخشهایی از یک شیء دیجیتال، جستجوی فهرست، ذخیره نتایج و... را برای جستجو و بازیابی اطلاعات در اختیار کاربر قرار می‎دهند (آرمز ، 1381). استفاده از هستی‎شناسی در طراحی رابطهای کاربری کتابخانه‎های دیجیتال می‎تواند امکانات بیشتری را برای جستجو و بازیابی منابع مرتبط فراهم کند.
ScholOnto یک سرویس‎دهندة کتابخانة دیجیتال مبتنی بر هستی‎شناسی است که از متون علمی و نیز بحث و تبادل نظر پژوهشگران با یکدیگر حمایت می‎کند. این بحثها می‎توانند از یادداشتهای شخصی محققان در مورد مدرک تا ایمیل شخصی و گروه‎های مباحثه و نقدهای رسمی همکاران از مقاله‎های کنفرانس، مجله و نقدهای منتشر شده از متون و کتابها را دربر گیرند. در ادامه، چند رابط کاربری که توسط ScholOnto برای جستجو در کتابخانه دیجیتال و ثبت نظرهای محققان در مورد مدارک ارائه شده، در شکلهای 4، 5 و 6 نمایش داده شده است. همه شکلها، توصیف مقاله‎ای با نام «مدل مرجع فرامتن دکستر » نوشته «هالاز» و «شوارتز» را نمایش می‎دهد. در شکل 4، بخش بالایی، فراداده‎های استاندارد کتابشناختی کتابخانه دیجیتال را نشان می‎دهد. بخش میانی برای افزودن نظرهای جدید در مورد مدارک و تبادل نظر پژوهشگران استفاده می‎شود و پایین‎ترین بخش، روابط اصلی میان متون موجود را نمایش می‎دهد (شام، موتا و دومینگو، 2000).

شکل 4. رابط کاربری برای ثبت نظرهای پژوهشگران در مورد مدارک توسط ScholOnto (شام، موتا و دومینگو، 2000)
شکل 5، نمونة دیگری از رابط کاربری ایجاد شده توسط ScholOnto را نشان می‎دهد. در این شکل، مدرک با استفاده از مفاهیم ScholOnto یادداشت‎گذاری شده است. ابزار یادداشت‎گذاری توسط پروژه Enrich ایجاد شده است. این رابط کاربری، امکان ایجاد پیوند به بخشهای مختلف مدرک را فراهم می‎کند.

شکل 5. رابط کاربری دارای ابزار یادداشت گذاری مدارک با استفاده از مفاهیم ScholOnto (شام، موتا و دومینگو، 2000)

شکل 6 نیز نمونه‎ای دیگر از رابط کاربری است که توصیف تصویری مقالة دکستر را توسط یک ابزار نگاشت فرا رسانه‎ای نشان می‎دهد. این تصویر نشان می‎دهد شبکة معنایی، بهترین مدل مفهومی برای سیستم است و به کاربران امکان می‎دهد با ترسیم نقشه و به صورت گرافیکی، به بیان نظرهای خود بپردازند.


شکل 6. رابط کاربری با امکان ترسیم مفاهیم برای بیان معانی مدرک (شام، موتا و دومینگو، 2000)

در حال حاضر تلاش می‎شود رابطهای کاربری متفاوتی ایجاد شود که با سرویس دهنده ScholOnto تعامل داشته باشد.
4- نتیجه‎گیری
مباحثی که در مقالة حاضر مطرح شد، اهمیت فناوریهای معنایی و بویژه هستی‎شناسی‌ها را در طراحی کتابخانه‎های دیجیتال معنایی روشن می‎سازد. نرم‎افزارهایی که هم اکنون برای طراحی کتابخانه‎های دیجیتال به کار می‎روند، برای توصیف، سازماندهی، نمایش، جستجو و بازیابی اطلاعات موجود در کتابخانه‎های دیجیتال، کاستیهایی دارند. هستی‎شناسی‌ها با تعریف دقیق عناصر کتابشناختی موجود در کتابخانه‎های دیجیتال، قادرند امکانات مختلفی را به نرم‎افزارهای کنونی بیفزایند. در این مقاله، برخی از این امکانات شامل ایجاد قابلیت استدلال و استنتاج، امکان تبادل اطلاعات میان کتابخانه‎های دیجیتال و سایر سامانه‎های اطلاعاتی، توصیف معنایی منابع موجود در کتابخانه‎های دیجیتال، ارتقای سیستم پرسش و پاسخ در کتابخانه‎های دیجیتال، ایجاد محیط رابط کاربرپسند و امکان مرور و جستجوی آسان و سریع مدارک، بررسی گردید. به هر حال، استفاده از هستی‎شناسی‌ها در بافت کتابخانه‎های دیجیتال آغاز شده است و کتابخانه‎های دیجیتال در حال گذر به سامانه‌های هوشمند معنایی هستند که امکانات بیشتری به منظور مدیریت محتوا، ارائه خدمات و دسترسی کاربران به منابع فراهم می‎کنند. هر چند بسیاری از کتابخانه‎های کنونی، تا تحقق این امر فاصله زیادی دارند، پیشرفت سریع فناوریهای اطلاعاتی و ارتباطی و تنوع نیازهای کاربران، بروز تحولاتی در کتابخانه‎های دیجیتال و تلاش در طراحی کتابخانه‎های دیجیتال معنایی را اجتناب ناپذیر می‎سازد.


 آرمز، ویلیام وای (1381). کتابخانه‎های دیجیتالی (فرزانه شکوری و دیگران، مترجم). تهران: نشر قو.
 نبوی، فاطمه و رحمت‎الله فتاحی (1386). کتابخانه دیجیتالی: مبانی نظری، محتوا، ساختار، سازماندهی، استانداردها و هزینه‎ها (همراه با نگاهی به برخی کتابخانه‎های دیجیتالی خارجی و داخلی). مشهد: سازمان کتابخانه ها، موزه‎ها و مرکز اسناد آستان قدس رضوی.
 Bloehdorn, S. et al (2007). Ontology- based Question Answering for Digital Libraries. In Proceedings of the 11th European Conference on Research and Advaced Technologies for Digital Libraries (ECDL 2007), September 16-21. Budapest, Hungary. Retrieved April 21, 2012 from
http://citeseerx.ist.psu.edu/viewdoc/download?doi=10.1.1.167.1228&rep=rep1&type=pdf
 Doerr, M.; Hunter, J.; Lagoze, C. (2003). Towards a Core Ontology for Information Integration. Journal of Digital Information, 4 (1). Retrieved April 21, 2012 from
http://www.cs.cornell.edu/lagoze/papers/core_ontology.pdf
 Gruber, T. R. (1993). A Translation approach to portable ontology specification. Knowledge Acquisition , 5, 199- 220.
 Kruk, S. R.; Decker, S.; Zieborak, L. (2005). JeromeDL- Adding Semantic Web Technologies to Digital Libraries. In International conference on database and expert systems applications (DEXA 2005), August 22-26. Copenhagen, DANEMARK.
 Kruk, S. R.; Haslhofer B.; Piotrowski, P.; Westerski, A.; Woroniecki, T. (2006). Role of Ontologies in Semantic Digital Libraries. In NKOS Workshop, September 21. Alicante, Spain. Retrieved April 21, 2012 from
http://www.ukoln.ac.uk/nkos/nkos2006/presentations/kruk.pdf
 Kruk, S. R.; Synak, M.; Zimmermann, K. (2005). MarcOnt - Integration Ontology for Bibliographic Description Formats. In Proceedings of the 2005 International Conference on Dublin Core and Metadata Applications: vocabularies in practice. Madrid, Spain. Retrieved April 21, 2012 from
http://dcpapers.dublincore.org/index.php/pubs/article/download/829/825
 Shum, S. B.; Motta, E.; Domingue, J. (2000). ScholOnto: an ontology-based digital library server for research documents and discourse. International Journal on Digital Libraries, 3 (4), 237–248. Retrieved April 21, 2012 from
http://citeseerx.ist.psu.edu/viewdoc/download?doi=10.1.1.36.3835&rep=rep1&type=pdf
 Soergel, D.; Lauser, B.; Liang, A.; Fisseha, F.; Keizer, J.; Katz, S. (2004). Reengineering Thesauri for New Applications: the AGROVOC Example. Journal of Digital Information, 4 (4). Retrieved April 21, 2012 from
ftp://ftp.fao.org/docrep/fao/008/af234e/af234e00.pdf
 Weinstein, P.; Alloway, G. (1997). Seed Ontologies: growing digital libraries as distributed, intelligent systems. In Proceedings of the Second ACM International conference on Digital Libraries, July. Philadelphia, Pennsylvania, United States. Retrieved April 21, 2012 from
http://citeseerx.ist.psu.edu/viewdoc/download;jsessionid=534C9BDCEF864B944B518E2C5F49BDBE?doi=10.1.1.44.3756&rep=rep1&type=pdf
 Yu, J.; Thom, J. A.; Tam, A. (2007). Ontology evaluation using Wikipedia categories for browsing. In Proceedings of the sixteenth ACM conference on Conference on information and knowledge management, November 6-10. Lisbon, Portugal.