نوع مقاله : مقاله پژوهشی
نویسندگان
1 کارشناسی ارشد، کتابداری و اطلاعرسانی پزشکی، دانشگاه علوم پزشکی تهران
2 عضو هیئت علمی، گروه فارماکوگنوزی، دانشکده داروسازی، دانشگاه علوم پزشکی تهران
3 دستیار تخصصی طب سنتی، دانشکده طب سنتی، دانشگاه علوم پزشکی تهران
4 عضو هیئت علمی، گروه کتابداری و اطلاعرسانی پزشکی، دانشگاه علوم پزشکی تهران
چکیده
کلیدواژهها
محیط وب با ساختار گسترده، امکان دسترسی به اطلاعات وسیعی را برای کاربران خود فراهم آورده است. اهمیت توجه به امر سازماندهی و بازیابی اطلاعات در محیط وب و تغییر انتظارهای کاربران از این شبکة جهانگستر، تلاش برای ارتقای آن را ضروری ساخته است، زیرا از یک سو، سهولت دسترسی به منابع وبی، همگان را به استفاده از آن فرا میخواند و از سوی دیگر حجم وسیع، متنوع و غیرقابل مدیریت آن مسائلی را در خصوص بازیابی مؤثر اطلاعات در این محیط مطرح میسازد (لنکستر[5]، 2003). وب معنایی که حاصل تلاش کنسرسیوم جهانی وب است، به منظور اشتراکِاطلاعاتدروب و جستجوبراساسموضوعوارتباطمیاندادهها ایجاد شده استونهتنهابرایانسانقابلفهماست، بلکه ماشینهانیزتواناییفهمآنرادارند (آلاحمد، 1385؛ جمالی مهمویی، 1382). اما برای توسعة مطلوب وب معنایی و افزایش کیفیت سازماندهی و در نتیجه بازیابی اطلاعات در این محیط، طراحی ابزارهای مناسب از جمله هستیشناسیها، ضروری است. در این میان، کمبود هستیشناسیهای غنی، مشکلی است که پیش روی وب معنایی قرار دارد (نا[6] و نئو[7]، 2008).
هستیشناسی مدلی انتزاعی از جهان واقع است که مفاهیم و روابط قلمروی مورد بحث را به نمایش میگذارد. هستیشناسیها در محدودة وسیعی کاربرد دارند. برای نمونه، میتوان به شبکههای جهانگستر معنایی، موتورهای جستجو، تجارت الکترونیکی، پردازش زبان طبیعی، مهندسی دانش، استخراج و بازیابی اطلاعات، سیستمهای چند عامل، مدلسازی کیفی از سیستمهای فیزیکی، طراحی پایگاههای داده، سیستمهای اطلاعات جغرافیایی و کتابخانههای رقمی اشاره کرد (شمسفرد و عبداللهزاده بارفروش، 2002).
در این میان، سازماندهی دانش پزشکی با پیچیدگیها و ویژگیهای خاص خود، همواره مورد توجه بوده است. تلاش کتابخانه ملی پزشکی آمریکا در طراحی سرعنوانهای موضوعی پزشکی )مش([8]، طرح ردهبندی کتابخانه ملی پزشکی[9]، نظام زبان واحد پزشکی(یو.ام.ال.اس)[10] و متامپ[11]، گوشهای از این خدمات و شاهدی بر این مدعاست. نظام زبان واحد پزشکی، پایگاه دانشی در حوزة پزشکی است که به طور گسترده در نظامهای اطلاعات پزشکی که به پردازش، بازیابی و یکپارچهسازی اطلاعات میپردازند، مورد استفاده قرار میگیرد (نا و نئو، 2008). این نظام که طرح آن از سال 1986 توسط کتابخانه ملی پزشکی ایالات متحده آمریکا شروع شده، تلاشی در راستای یکپارچهسازی نظامهای واژگانی مختلف و متمایز زیست پزشکی، جهت ایجاد یک هستیشناسی است. این نظام ازسهمنبعدانش اصلی یعنی ابراصطلاحنامه[12]،شبکةمعنایی[13]وواژهنامة تخصصی و ابزارهای واژگانی[14]تشکیل شدهاست.ابراصطلاحنامه نظام زبان واحد پزشکی، یک پایگاه اطلاعاتی بسیار جامع و چند زبانه از واژگان کنترل شده است که از نسخة الکترونیکی اصطلاحنامههای متعدد، انواع طرحهای ردهبندی، مجموعههای کدها، سیاهههای کنترل واژگان مورد استفاده در مراقبتهای درمانی و ... تشکیل شده است. تمامی مفاهیم درون ابراصطلاحنامه حداقل به یک گونة معناییدرون شبکه معنایی اختصاص یافتهاند. شبکه معنایی نظام زبان واحد پزشکی نیز شامل گونههای معنایی و روابط معنایی[15] است. گونههای معنایی، مفاهیم درون ابر اصطلاحنامه را به یکدیگر مرتبط و روابط معنایی، میان گونههای معنایی رابطه برقرار میکند. بدین ترتیب، تمامی مفاهیم درون اصطلاحنامه مطابق با سطح کلی خویشاوندی یا نَسبی خود در شبکه معنایی مقولهبندی میشوند (ولینژادی، 1387؛ ولینژادی و همکاران، 1389؛ محمداسماعیل و صمدی، 1389).
از سوی دیگر، سیستمهای بالینی، سیستمهای عمومی اطلاعات پزشکی، سیستمهای خبرة پزشکی، سیستمهای بیمارستانی، سیستمهای پشتیبان تصمیم[16]، نظامهای کشف دانش[17]، سیستمهای مدارک پزشکی بیماران و پایگاههای اطلاعاتی متون زیست پزشکی، هرکدام به نحوی به منابع واژگانی کنترل شدة حوزه زیست پزشکی، متکّی و نیازمندند (ولینژادی، 1387؛ سیمینو[18] و همکاران، 1994؛ جیمنزروئیز[19] و همکاران، 2007).در زبان فارسی، تدوین سرعنوانهای موضوعی پزشکی فارسی (رهادوست، 1376)، مهمترین تلاش صورت گرفته در زمینة واژگان کنترل شدة پزشکی به شمار میرود. با این حال، پس از تدوین سرعنوانهای موضوعی پزشکی فارسی، تلاش درخوری در زمینة تدوین و طراحی واژگان کنترلشدة پزشکی فارسی صورت نگرفته است. همچنین، با وجود تعدد پژوهشهای انجام شده در خصوص هستیشناسیها در خارج از کشور، بررسی متون حاکی از آن است که پژوهشهای صورت گرفته در داخل کشور محدود است (شمسفرد، 1381؛ خسروی و وظیفهدوست، 2007؛ فتحیان، 1388؛ شریف، 1388؛ شمسفرد و همکاران، 2010)، ضمن اینکه در حوزة موضوعی پزشکی، تاکنون هیچ هستیشناسی به زبان فارسی تدوین نشده است.
یکی از حوزههای پزشکی مورد توجه متخصصان و حتی عموم مردم، حوزة گیاهان دارویی است. در کشور ما استفاده از گیاهان برای درمان افزایش یافته و شاهد رونق دوباره عطاریها هستیم. ایران با بهرهمندی از پوشش گیاهی متنوع و شگفتانگیز و همچنین وجود فرهنگ و علاقة باطنی مردم به کاربرد گیاهان دارویی، از توانمندی بالقوهای در این حیطه برخوردار است و تاکنون گونههای گیاهی متعدد و متنوعی در کشور شناسایی شده است (مازندرانی و همکاران، 1383). بنابراین، مبحث گیاهان دارویی ایران، موضوعی گسترده و مورد توجه در کشور است که سازماندهی و بازیابی اطلاعات آن نیز اهمیت خاصی دارد.
با توجه به موارد پیشگفته، در پژوهشی به ایجاد نمونة اولیه از هستیشناسی گیاهان دارویی ایران بر پایه نظام زبان واحد پزشکی پرداخته شد. در این مقاله، روش به کار رفته برای ساخت این هستیشناسی شرح داده میشود. هدف پژوهش، ارائه روششناسی برای طراحی هستیشناسیهای حوزة پزشکی در زبان فارسی است.
تاکنون پژوهشهای زیادی در حوزة هستیشناسیها انجام شده است. روششناسی ساخت، ابزارهای ساخت، ساخت خودکار و یادگیری هستیشناسیها، عناوین مورد بحث در این حوزه هستند. با توجه به تمرکز خاص این پژوهش بر روش ساخت هستیشناسیها، در این قسمت ضمن مرور پژوهشهای مرتبط، نگاهی ویژه به روششناسی ساخت آنها خواهیم داشت. در بررسی مطالعات خارج از کشور نیز، به پژوهشهایی که از نظام زبان واحد پزشکی و یا سایر هستیشناسیها به عنوان هستیشناسی پایه برای ساخت هستیشناسی استفاده کردهاند، خواهیم پرداخت.
«آچور[20] و همکاران» (1999) در پژوهشی به بهرهگیری و گسترش روابط و مداخل نظام زبان واحد پزشکی برای ایجاد هستیشناسی حوزة انتقال خون برای طراحی سیستم پشتیبان تصمیم در این حوزه پرداختند. استخراج واژگان، تعیین مفاهیم معادل، ایجاد فهرست مفهومی و تعیین گونههای معنایی مربوط در یو.ام.ال.اس، و استخراج روابط؛ چهار مرحلهای است که برای ساخت این هستیشناسی به کار رفته است. نتایج این پژوهش بر سودمندی نظام زبان واحد پزشکی جهت طراحی واژگان کنترلشده در یک حوزة خاص تأکید دارد.
«نوی و مکگینس» (2001) نیز در پژوهشی دستورالعملی برای ساخت هستیشناسی ارائه دادند. مراحل هفتگانة «نوی و مکگینس» عبارتند از: مشخص ساختن حوزه و پوشش هستیشناسی، استفادة دوباره از هستیشناسیهای موجود، شمارش واژگان مهم در هستیشناسی، تعیین ردهها و سلسله مراتب بین آنها، توصیف ویژگیهای[21] ردهها، تعریف چهریزههای ویژگیها[22]، و ایجاد نمونهها. این روش در پژوهش «نا و نئو» (2008)نیز مورد استفاده قرار گرفته است. در این پژوهش که به منظور ارزیابی سودمندی شبکه معنایی نظام زبان واحد پزشکی جهت ایجاد هستیشناسیها در حوزههای مرتبط با پزشکی انجام شد، از این روش برای ایجاد هستیشناسی در حوزة سرطان کولون بر اساس تحلیل چکیدة 109 مقالة مرتبط با این موضوع در پایگاه پابمد[23] استفاده شده است.
«دامونتیر و ویلانیواروسالس» (2009) نیز در پژوهشی برای ساخت هستیشناسی حوزة فارماکوژنتیک به کمک نسخة 4 نرمافزار پروتژه[24]، از پنج مرحله به شرح زیر بهره بردند: مشخص ساختن حوزه و ملزومات هستیشناسی، ایجاد مدلی ابتدایی از هستیشناسی بر اساس مفاهیم ضروری، ترسیم مفاهیم در یک هستیشناسی سطح بالا(که در این پژوهش مفاهیم در هستیشناسی بی.اف.ا[25]ُ ترسیم شدند)، تشخیص روابط بین مفاهیم، افزودن هستیشناسیهای دیگر و توصیفات پیچیدهتر به هستیشناسی. آنان در نهایت، استفاده از هستیشناسیها و وب معنایی را راهکاری مناسب برای بازنمایی و بازیابی اطلاعات حوزة فارماکوژنتیک دانستند.
«رئیزمارتینز[26] و همکاران» (2011) نیز در پژوهش خود روشی برای ایجاد هستیشناسیهای حوزة زیستپزشکی برگرفته از متون معرفی کردند. این شیوه بر پایه پردازش زبان طبیعی و تکنیکهای توسعهای فراهمآوری دانش استوار است. همچنین، الگوریتمی برای مرتبط کردن مفاهیم منفرد موجود در هستیشناسی با استفاده از نظام زبان واحد پزشکی فراهم آمده است. آنان در انتها استفاده از گونههای معنایی نظام زبان واحد پزشکی را در مقایسه با استفاده از کلمات برای نمایش ویژگیهای متون بالینی، مفیدتر و اثرگذارتر میدانند.
در دیگر پژوهشهای این حوزه نیز، روندی مشابه برای طراحی و ایجاد هستیشناسیها استفاده شده است. «برایت[27] و همکاران» (2012) در پژوهشی که به منظور ایجاد هستیشناسی برای راهنمایی در تجویز آنتیبیوتیک مناسب انجام شد، به توسعه و به کارگیری روشهای ایجاد هستیشناسی در حوزة تجویزهای آنتیمیکروبیال با استفاده از نرمافزار protégé-owl پرداختند. مراحل ساخت این هستیشناسی شامل شش مرحله و بدین ترتیب است: تعیین پوشش هستیشناسی، مرور هستیشناسیهای موجود، تعیین ردهها و ویژگیها، ایجاد یک مدل مفهومی، به کارگیری یک هستیشناسی سطح بالا و بازنمون هستیشناسی در یک زبان رسمی. صحت هستیشناسی نیز با استفاده از اصول طراحی هستیشناسی و نقد صاحبنظران ارزیابی شد. ارزیابی هستیشناسی بر صحت آن، مفید بودن هستیشناسی در نمایش دادن و نگهداری قواعد درمان آنتی میکروبیال، و مفید بودن آن در هشدار دادن به عنوان بازخوردی به تجویز آنتیبیوتیک پزشک صحه گذاشته است.
در نزدیکترین پژوهش داخلی انجام شده مرتبط با این مقاله، «فتحیان» (1389) به مقایسه کارآمدی اصطلاحنامه و هستیشناسی در بازنمون دانش پرداخت. وی ابتدا با روش تحلیل حوزه، به ساخت نمونه اولیهای از هستیشناسی در قلمرو «نمایهسازی» با عنوان ASFAOnt در نرمافزار پروتژه نسخة 3.4.4 پرداخت. این هستیشناسی حاصل تبدیل مفاهیم حوزة نمایهسازی اصطلاحنامه اصفا به هستیشناسی است که بر مبنای روشی تلفیقی گسترش یافته از روشهای ارائه شده «آچولد و گرونینگر» و نیز «نوی و مک گینس» و به روش نیمه خودکار در چهار مرحله شامل گردآوری مفاهیم، کشف و تعیین روابط میان مفاهیم، ایجاد کاربرگه برای هر مفهوم و پیادهسازی هستیشناسی در محیط نرمافزار Protege اجرا شده است. سپس به منظور ارزیابی کارآمدی ساختار هستیشناسی طراحی شده با روش تحلیل حوزه در بازنمون دانش، در یک مطالعة کاربردپذیری به سنجش هستیشناسی در مقایسه با اصطلاحنامه پرداخت. بر اساس یافتههای این پژوهش، میزان کارآمدی هستیشناسی در بازنمون دانش، از کارآمدی اصطلاحنامه اصفا بیشتر است(صنعتجو و فتحیان؛ 1390؛ صنعتجو و فتحیان؛ 1391). مهمترین تفاوت پژوهش حاضر با پژوهش «صنعتجو و فتحیان»، در استفاده از نظام زبان واحد پزشکی به عنوان هستیشناسی پایه برای طراحی و ایجاد هستیشناسی است. بر همین اساس، مراحل پیموده شده در ساخت هستیشناسی نیز در مواردی با یکدیگر متفاوت است. به عبارتی، در این پژوهش، یو.ام.ال.اس مبنای ایجاد هستیشناسی قرار گرفت؛ در حالی که اساس کار پژوهش پیش گفته، تبدیل اصلاحنامه به هستیشناسی بوده است. تفاوت دیگر در روش استخراج دادههاست که در این پژوهش راهکار مهندسی دانش و در پژوهش «صنعتجو و فتحیان» تحلیل حوزه است. همچنین، پژوهش مذکور به ارزیابی و تحلیل نظرهای کاربران در مورد کارآمدی هستیشناسی و اصطلاحنامه نیز پرداخته است، حال اینکه تأکید اصلی این پژوهش بر طراحی هستیشناسی بوده و ارزیابی نظرهای کاربران مدنظر نیست.
در دیگر پژوهش داخلی انجام شده، «شمسفرد و بارفروش» (بیتا) به معرفی راهکاری خودکار در اکتساب دانش مفهومی و ساخت هستیشناسی از پایه بر اساس متون زبان طبیعی پرداختند. این روش از یک هستة کوچک هستیشناسی که حاوی فرادانش لازم برای یادگیری است شروع و با تکنیکهای پردازش زبان طبیعی، مفاهیم و رابط طبقهای و غیرطبقهای را استخراج میکند. ورودی این سیستم متون زبان فارسی و خروجی آن واژگان و هستیشناسی بسط یافته و یادگرفته شده از متن است.
از آنجا که این پژوهش به ایجاد نمونة اولیه از هستیشناسی گیاهان دارویی ایران میپردازد، از نوع توسعهای است. برای ایجاد هستیشناسی مذکور، هشت گیاه به عنوان نمونه انتخاب و با روش مهندسی دانش[28]، مفاهیم و روابط مربوط به آنها از متون و منابع استخراج شد. روش مهندسی دانش، روشی است که در استخراج اطلاعات از متون به کار گرفته میشود (نا و نئو، 2008). بر اساس این روش، متون مربوط مطالعه و مفاهیم و روابط مرتبط با «گیاهان دارویی ایران» استخراج شد. مفاهیم به شکل جفت معنایی استخراج شد و معیار انتخاب دو مفهوم برای تشکیل جفت معنایی، وجود هر دو واژه در یک جمله بود. برای انتخاب این هشت گیاه، از روش نمونهگیری مبتنی بر هدف، از نوع نمونهگیری بر مبنای تئوری، استفاده شد. در نمونهگیری مبتنی بر هدف، پژوهشگر میکوشد تا به صورت هدفدار، بر مبنای اینکه چه نوع اطلاعات خاصی مورد نیاز است، نمونههایی را انتخاب کند. لذا اینکه چه نمونههای انتخاب شوند، تحت تأثیر این است که قبلاً چه نمونههایی انتخاب شدهاند. در نمونهگیری بر مبنای تئوری نیز که نوعی از نمونهگیری مبتنی بر هدف است، انتخاب نمونهها بر مبنای اینکه نمایندة سازههای مهم مطرح در یک تئوری باشند، انجام میشود (صانعی و نیکبخت نصرآبادی، 1383؛ حاجباقری و همکاران، 1386). بر همین اساس، در این پژوهش ابتدا گیاه خاکشیر، با نظر صاحبنظران حوزة گیاهان دارویی و با توجه به این مطلب که این گیاه بومی ایران است و میزان استفاده از آن در کشور بالا بوده و خاصیت درمانی قابل توجهی دارد، انتخاب شد. سایر گیاهان نیز، با در نظر گرفتن این سه معیار، توجه به دادههای جمعآوری شده از گیاه خاکشیر و اشباع مفهومی به لحاظ نوع گونههای معنایی شکل گرفته در حین پیشرفت مطالعه مشخص شدند. این گیاهان شامل آویشن شیرازی، بابونه شیرازی، اسپند، آنغوزه (حلتیت)، باریجه، گل گاوزبان و ترنجبین هستند.
همچنین، نظام زبان واحد پزشکی به عنوان هستیشناسی پایه انتخاب و با مفاهیم و روابط مستخرج از متون گسترش داده شد. این کار بر اساس روشهای مورد استفاده در پژوهشهای «نوی»[29] و «مکگینس»[30] (2001) و «دامونتیر»[31] و «ویلانیواروسالس»[32](2009) و به کمک نرمافزار پروتژه[33] نسخة 4.2-beta انجام شد. در خصوص نرمافزار مورد استفاده در این پژوهش نیز باید به این مطلب اشاره کرد که تاکنون چندین ابزار برای کمک به ساخت هستیشناسیها طراحی شده است. «متازکا»[34]، «دوتس»[35]، «سیس»[36]، «آنتوبیلدر»[37]، و «پروتژه» (اریکسون[38] و همکاران، 1999) نمونهای از این ابزارها هستند. پروتژه، نرمافزاری برای ایجاد و ویرایش هستیشناسیها و پایگاههای دانش است. این نرمافزار جایگاه خاصی در ایجاد هستیشناسیهای حوزة پزشکی دارد و کتابخانه ملی پزشکی آمریکا، آژانس طرحهای پژوهشی پیشرفته دفاعی، مؤسسه ملی سرطان، مؤسسه ملی استاندارد و فناوری نیز از آن حمایت میکنند. این نرمافزار واسط کاربری فراهم میآورد که در آن امکان تعریف مفاهیم، نمونهها، ویژگیها و محدودیتهای مفاهیم و همچنین روابط، وجود دارد. مزیت استفاده از این ابزار آن است که در صورت وجود، میتوان از مفاهیم و روابط موجود در سایر هستیشناسیها به منظور ساخت و توسعة هستیشناسی جدید استفاده کرد(شریف، 1388). به همین سبب، با توجه به جایگاه پروتژه در ایجاد هستیشناسیهای حوزة پزشکی و نیز استفاده از نظام زبان واحد پزشکی به عنوان هستیشناسی پایه در ایجاد هستیشناسی گیاهان دارویی ایران، در این پژوهش از این ابزار استفاده شد.
در این قسمت به شرح مراحل پیموده شده در استخراج دانش مفهومی و ایجاد هستیشناسی IranMedPlantsOntمیپردازیم. همانطور که اشاره شد، مبنای روش به کار گرفته شده در استخراج مفاهیم و روابط معنایی، راهکار مهندسی دانش(نا و نئو، 2008) و مبنای روش به کار رفته در ایجاد هستیشناسی، روشهای مورد استفاده در پژوهشهای «نوی و مکگینس» و «دامونتیر و ویلانیواروسالس» است. گفتنی است، با وجود جدا بودن دو مرحلة اصلی استخراج دانش و ایجاد هستیشناسی در پژوهشهای مورد بررسی، در این پژوهش این دو مرحله به شکل در هم تنیده و همزمان پیش رفت. در ادامه شرح این مراحل ارائه میشود:
1. مشخص ساختن حوزه و پوشش هستیشناسی: حوزه موضوعی این پژوهش هشت گیاه داروییایران است و مبنای آن، مفاهیم و روابط معنایی است که از متون بومی موجود استخراج شدهاند. این متون شامل کتابهای قانون فیالطب (ابنسینا، 1425 ﻫ.ق.)، مخزن الادویه (عقیلی خراسانی، 1380)، الحاوی (رازی، 1384)، الاغراض الطبیه و المباحث العلائیه (اسماعیل جرجانی،1384)، تذکره اولی الالباب و الجامع للعجب العجاب (انطاکی، 1971 م)، الابنیه عن حقایقالادویه (هروی، 1371)، تحفة المؤمنین (مازندرانی، 1389) و الشامل فی الصناعة الطبیه (ابن نفیس، 1387) میباشد. همچنین، برای دور نماندن از مباحث نوین در این حوزه، کتاب متداولترین گیاهان دارویی سنتی ایران (امین، 1387)، و مقالههای مرتبط با هشت گیاه منتخب در سه مجلة فصلنامه گیاهان دارویی، فصلنامه طب سنتی اسلام و ایران و فصلنامه گیاهان دارویی و معطر ایران، مورد بررسی قرار گرفت.
2. استفادة دوباره از هستیشناسیهای موجود: در این پژوهش از نظام زبان واحد پزشکی به عنوان هستیشناسی پایه در ایجاد هستیشناسی گیاهان دارویی ایران استفاده شد. در ابتدا با بهرهگیری از شبکه معنایی نظام زبان واحد پزشکی، گونهها و روابط معنایی مرتبط با گیاهان دارویی ایران، به شکل خودکار وارد نرمافزار پروتژه شد. گونههای معنایی این نظام در جایگاه ردهها و روابط معنایی در جایگاه ویژگیها قرار گرفت. همچنین، از ابراصلاحنامة این نظام برای تعیین جایگاه سلسله مراتبی مفاهیم مستخرج از متون و تعریفهای آنها استفاده شد. گفتنی است، در تمامی این مراحل، نیاز به ترجمة گونهها، روابط، مفاهیم و تعریفهای مستخرج از یو.ام.ال.اس بود. این کار با نظارت متخصصان موضوعی انجام شد.
3. تعیین جفتهای مفهومی و روابط آنها و ترسیم آنها در ساختار یو.ام.ال.اس: در این مرحله، با استفاده از راهکار مهندسی دانش، متون مورد بررسی قرار گرفت. بدین ترتیب، جفتهای مفهومی و روابط آنها شناسایی شد. برای ترسیم مفاهیم و روابط در ساختار یو.ام.ال.اس نیز، مفاهیم و روابط برگرفته از متون با یو.ام.ال.اس تطبیق داده شد و با شناسایی گونهها و روابط معنایی مربوط در یو.ام.ال.اس، در جایگاه سلسله مراتبی و معنایی مناسب ترسیم گردید. در صورت نبود گونة معنایی، مفهوم یا رابطه در یو.ام.ال.اس، عبارت مورد نظر با نظر متخصصان موضوعی به هستیشناسی اضافه شد. جدول (1) مثالی از جفت مفهومی شکل گرفته در خصوص گیاه خاکشیر و بیماری مخملک، رابطة شکل گرفته بین آنها و مفاهیم، رابطه و گونة معادل در نظام زبان واحد پزشکی را نشان میدهد.
جدول1. شکلگیری جفت معنایی بر اساس مفاهیم، رابطة معنایی و گونههای معنایی گیاه خاکشیر
مفهوم یا رابطه مشاهده شده در متون |
مفهوم یا رابطه برگزیده شده |
مفهوم یا رابطه معادل در یو.ام.ال.اس |
گونه معنایی معادل در یو.ام.ال.اس |
گونه معنایی مرتبط |
گونه معنایی اضافه شده به یو.ام.ال.اس |
جفت معنایی شکل گرفته |
خبه (مفهوم) |
خاکشیر
|
Descurainia Sophia |
plant
|
گیاه
|
گیاهان دارویی |
گیاهان دارویی تأثیر میگذارد بر بیماری یا نشانگان |
جهت (رابطه) |
تأثیر میگذارد بر |
Affects
|
|
|
|
|
شری (مفهوم) |
مخملک
|
Scarlet fever; rash |
Disease or Syndrome |
بیماری یا نشانگان |
|
چنان که در جدول1 نشان داده شده است (از راست به چپ)، ابتدا مفاهیم و روابط مشاهده شده در متون، استخراج و با نظر متخصصان این حوزه و در نظر گرفتن مفهوم یا رابطه متداول، واژههای ارجح انتخاب شد. سپس متناظر این عبارتها در نظام زبان واحد پزشکی شناسایی، و با استفاده از بخش شبکه معنایی این نظام، گونة معنایی مربوط نیز مشخص گردید. در نهایت اگر مفهوم، رابطه یا گونهای در یو.ام.ال.اس موجود نبود، در صورتی که افزودن آن به هستیشناسی، از نظر متخصصان موضوعی و با توجه به دفعات تکرار در متون لازم بود، آن واژه اضافه شد. همچنین، با تشکیل جفت معنایی، علاوه بر مشخص شدن خلأهای نظام زبان واحد پزشکی در مورد گیاهان دارویی ایران، چهریزههای لازم برای مرحلة شش نیز شناسایی گردید.
4. تعیین ردهها و سلسله مراتب بین آنها[39]: تعیین ردهها و روابط سلسله مراتبی بین آنها تا حد زیادی به نوع استفاده از هستیشناسی، سطح جزئینگری مورد انتظار و ملزومات سازگاری با سایر مدلها بستگی دارد. در این پژوهش، با توجه به انتخاب نظام زبان واحد پزشکی به عنوان هستیشناسی پایه، گونههای معنایی نظام زبان واحد پزشکی به عنوان ردهها انتخاب شدند. با این حال، با در نظر گرفتن مضامین موجود در متون بومی و با توجه به تعدد سلسله مراتب در مورد برخی از واژگان، برخی از مفاهیم یو.ام.ال.اس هم وارد بخش کلاس شدند(مانند مفاهیم «ضماد» و «شیاف»). همچنین، سلسله مراتب بین ردهها هم طبق سلسله مراتب این نظام تعیین شد. سپس این ردهها در قسمت کلاسها در نرمافزار پروتژه وارد شد. در نهایت، 28 گونه معنایی شکل گرفته در شکل 1، قسمتی از این ردهها قابل مشاهده است.
شکل1. بخش ردهها و نمونهها در هستیشناسی IranMedPlantsOnt
5. توصیف ویژگیهای ردهها و روابط[40]: اطلاعات ارائه شده در ردهها به هیچ عنوان کافی نیست. به همین منظور، قسمت ویژگیها به روابط مورد نیاز در هستیشناسی اختصاص مییابد و ارتباط بین ردهها از این طریق ایجاد میشود. در این پژوهش، قسمت ویژگیها و روابط در نرمافزار پروتژه با روابط معنایی شبکه معنایی نظام زبان واحد پزشکی و روابط معنایی مستخرج از متون تکمیل شد. روابط به طور کلی به سه دسته روابط شیء[41]، روابط نوع داده[42] و روابط تفسیری[43] تقسیم میشوند(صنعتجو و فتحیان، 1391). شکل 2، قسمتی از این روابط را نشان میدهد. در این شکل، روابط شیء نشان داده شده است. رابطه «مفهوم معادل در یو.ام.ال.اس» نوعی رابطه نوع داده و رابطة «نیز ببینید» مثالی از روابط تفسیری است. از این روابط برای توصیف ردهها و نمونهها استفاده شد.در کل 21 رابطه معنایی در این پژوهش شکل گرفت.
شکل2. بخش ویژگیها و روابط در هستیشناسی IranMedPlantsOnt
6. تعریف چهریزههای ویژگیها[44] : ویژگیها میتوانند چهریزههای مختلفی داشته باشند. جنبه یا چهریزههای ویژگیها، نوع مقادیر، مقادیر مجاز و تعداد آنها را مشخص میسازد. چهریزهها در عمل برای تعریف حدود و نوع روابط بین نمونهها به کار میروند. به عنوان مثال، ویژگی «درمان میکند» میتواند با نمونههای مشخصی به کار رود. بدین ترتیب، باید فهرستی از ردههای مجاز که میتوانند رابطههای «درمان میکند» و «درمان میشود با» را داشته باشند، مشخص شوند. به عنوان مثال، در این پژوهش، دو گونة معنایی «گیاهان دارویی ایران» و «نشانه یا علامت» با این روابط به یکدیگر مرتبط شدهاند. بنابراین، نمونههای مربوط به آنها (به عنوان مثال و به ترتیب «خاکشیر» و «اسهال») نیز مجاز به داشتن این رابطه هستند. شکل 3، ردههای مجاز برای دریافت روابط معنایی مختلف با «گیاهان دارویی ایران» را نشان میدهد.
شکل 3. چهریزههای مشخص شده مربوط به گونه معنایی «گیاهان دارویی ایران»
7. ایجاد نمونهها: آخرین گام، ایجاد نمونههای مربوط به هر رده است. تعریف نمونههای یک رده در نرمافزار پروتژه مستلزم انتخاب آن رده، ایجاد یک نمونه منفرد، و پرکردن ویژگیها[45] با مقادیر تعیین شده و مجاز است. در این پژوهش، جفتهای مفهومی شکل گرفته در مرحلة سه، در جایگاه نمونهها قرار گرفتند و بر مبنای چهریزههای تعیین شده در مرحلة شش، ارتباط بین آنها برقرار شد. ویژگیهایی که برای توصیف نمونهها به کار میروند، عمدتاً شامل نام نمونه، مفهوم معادل در نظام زبان واحد پزشکی (در صورت وجود)، مترادفها، و روابط معنایی بین نمونهها (مانند «درمان میکند») است. تصویر 1، قسمتی از نمونة خاکشیر را نشان میدهد. در مجموع، 259 مفهوم وارد این قسمت شدند.
در این مقاله، با مرور پژوهشهای پیشین و با ایجاد نمونهای اولیه از هستیشناسی گیاهان دارویی ایران، روشی برای ایجاد هستیشناسیهای حوزة پزشکی در زبان فارسی ارائه شد. این روش، ترکیبی از روشهای ارائه شده در پژوهشهای «نوی و مکگینس» و «دامونتیر و ویلانیواروسالس» است که در مواردی تغییر یا گسترش یافت. تعیین دامنه و پوشش هستیشناسی، استفاده از نظام زبان واحد پزشکی به عنوان هستیشناسی پایه، تعیین جفتهای مفهومی و ترسیم آنها در ساختار یو.ام.ال.اس، تعیین ردهها و سلسله مراتب بین آنها، توصیف ویژگیها، تعریف چهریزهها و ایجاد نمونهها، مراحل هفتگانة پیشنهادی برای ایجاد هستیشناسیهای پزشکی فارسی هستند.
در نهایت، با بررسی متون و مطالعة موردی انجام شده بر روی گیاهان دارویی ایران، پژوهشگران روش ارائه شده در این مقاله را روشی مناسب برای ایجاد هستیشناسیهای حوزة پزشکی در زبان فارسی میدانند. با این حال، مهمترین مشکل این روش را میتوان زمانبر بودن آن دانست. با توجه به اهمیت زمان در ساخت هستیشناسیها، پیشنهاد میشود در پژوهشی فرایند ساخت هستیشناسی گیاهان دارویی ایران بر اساس روشهای خودکار مانند سیستم یادگیر پیشنهادی در پژوهش «شمسفرد و بارفروش»، انجام و نتایج حاصل با یافتههای این پژوهش مقایسه شود. بدین ترتیب، میتوان به شکل عینی مزایا و معایب هر روش از لحاظ زمان، هزینه، دقت و کیفیت ابزار، دیدگاه کاربر و قابلیت پیادهسازی و کاربرد آن در پایگاههای دانش را بررسی و با یکدیگر مقایسه کرد. در این صورت، میتوان چارچوبی واحد برای ایجاد هستیشناسیهای حوزة پزشکی در زبان فارسی ارائه داد. نظر به وجود هستیشناسیهای غنی در حوزة پزشکی مانند نظام زبان واحد پزشکی و اثبات سودمندی آنها برای ساخت هستیشناسیها در پژوهشهای پیشین (آچور و همکاران، 1999؛ یو[46] و همکاران، 1999؛ مریل[47] و همکاران، 2008)، به نظر میرسد بهرهگیری از این ابزارها میتواند موجب تسهیل فرایند ساخت هستیشناسی شده و بر دقت، صحت و سرعت کار بیفزاید. این پژوهش با بهرهگیری از نظام زبان واحد پزشکی به عنوان هستیشناسی پایه در ایجاد هستیشناسی گیاهان دارویی ایران، نقطه شروعی برای ایجاد هستیشناسی بر اساس سایر هستیشناسیها، در زبان فارسی است.