روش شناسی ایجاد هستی شناسی مبتنی بر نظام زبان واحد پزشکی: مطالعه موردی هستی شناسی گیاهان دارویی ایران

نوع مقاله : مقاله پژوهشی

نویسندگان

1 کارشناسی ارشد، کتابداری و اطلاع‌رسانی پزشکی، دانشگاه علوم پزشکی تهران

2 عضو هیئت علمی، گروه فارماکوگنوزی، دانشکده داروسازی، دانشگاه علوم پزشکی تهران

3 دستیار تخصصی طب سنتی، دانشکده طب سنتی، دانشگاه علوم پزشکی تهران

4 عضو هیئت علمی، گروه کتابداری و اطلاع‌رسانی پزشکی، دانشگاه علوم پزشکی تهران

چکیده

هدف: هستی‌شناسی ابزاری برای نمایش رسمی و به اشتراک‌گذاری دانش حوزه‌ای خاص از طریق مدل‌سازی و ایجاد چارچوبی از مفاهیم و روابط معنایی بین آنهاست. هستی‌شناسی‌ها در حوزة پزشکی کاربرد زیادی دارند و سیستمهای بالینی پشتیبانی تصمیم، سیستمهای خبره پزشکی و پایگاه‌های اطلاعاتی متون زیست پزشکی هر کدام به نوعی به هستی‌شناسی‌ها وابسته‌اند. در این پژوهش، به منظور پیشنهاد روشی برای ساخت هستی‌شناسی‌های پزشکی فارسی، به ایجاد نمونة اولیه از هستی‌شناسی گیاهان دارویی ایران بر مبنای نظام زبان واحد پزشکی اقدام شد.
روش‌شناسی: این پژوهش، توصیفی است. جامعة پژوهش، گیاهان دارویی ایران و نمونه شامل هشت گیاه آنقوزه، آویشن شیرازی، اسپند، بابونه شیرازی، ترنجبین، خاکشیر و گل‌گاوزبان است. انتخاب نمونه‌ها به روش نمونه‌گیری تئوریک انجام شد. برای استخراج مفاهیم و روابط نیز از 8 کتاب از متون بومی گیاهان دارویی استفاده شد. همچنین، مبنای روش به کار گرفته شده در استخراج مفاهیم و روابط معنایی، راهکار مهندسی دانش و مبنای روش به کار رفته در ایجاد هستی‌شناسی، روشهای مورد استفاده در پژوهشهای «نوی و مک‌گینس» و «دامونتیر و ویلانیواروسالس» بود. همچنین، از نرم‌افزار پروتژه نسخه 4.2.beta برای ساخت هستی‌شناسی استفاده شد.
یافته‌ها: در این پژوهش هفت مرحله برای ایجاد هستی‌شناسی‌های پزشکی فارسی بر اساس نظام زبان واحد پزشکی پیشنهاد شد. تعیین دامنه و پوشش هستی‌شناسی، استفاده از یو.ام.ال.اس به عنوان هستی‌شناسی پایه، تعیین جفت‌های مفهومی و ترسیم آنها در ساختار یو.ام.ال.اس، تعیین رده‌ها، توصیف ویژگیها، تعریف چهریزه‌ها و ایجاد نمونه‌ها؛ این مراحل را تشکیل می‌دهند.
نتایج: با توجه به یافته‌های این پژوهش، روش ارائه شده در این پژوهش می‌تواند در ایجاد سایر هستی‌شناسی‌های حوزةپزشکی در زبان فارسی نیز مفید واقع شود. 
 

کلیدواژه‌ها


مقدمه

محیط وب با ساختار گسترده، امکان دسترسی به اطلاعات وسیعی را برای کاربران خود فراهم آورده است. اهمیت توجه به امر سازماندهی و بازیابی اطلاعات در محیط وب و تغییر انتظارهای کاربران از این شبکة جهان‌گستر، تلاش برای ارتقای آن را ضروری ساخته است، زیرا از یک سو، سهولت دسترسی به منابع وبی، همگان را به استفاده از آن فرا می‌خواند و از سوی دیگر حجم وسیع، متنوع و غیرقابل مدیریت آن مسائلی را در خصوص بازیابی مؤثر اطلاعات در این محیط مطرح می‌سازد (لنکستر[5]، 2003). وب معنایی که حاصل تلاش کنسرسیوم جهانی وب است، به منظور اشتراکِاطلاعاتدروب و جستجوبراساسموضوعوارتباطمیانداده‌ها ایجاد شده استونهتنهابرایانسانقابلفهماست، بلکه ماشینهانیزتواناییفهمآنرادارند (آل‌احمد، 1385؛ جمالی مهمویی، 1382). اما برای توسعة مطلوب وب معنایی و افزایش کیفیت سازماندهی و در نتیجه بازیابی اطلاعات در این محیط، طراحی ابزارهای مناسب از جمله هستی‌شناسی‌ها، ضروری است. در این میان، کمبود هستی‌شناسی‌های غنی، مشکلی است که پیش روی وب معنایی قرار دارد (نا[6] و نئو[7]، 2008).

هستی‌شناسی مدلی انتزاعی از جهان واقع است که مفاهیم و روابط قلمروی مورد بحث را به نمایش می‌‌گذارد. هستی‌شناسی‌ها در محدودة وسیعی کاربرد دارند. برای نمونه، می‌توان به شبکه‌های جهان‌گستر معنایی، موتورهای‌ جستجو، تجارت الکترونیکی، پردازش زبان طبیعی، مهندسی دانش، استخراج و بازیابی اطلاعات، سیستمهای چند عامل، مدل‌سازی کیفی از سیستمهای فیزیکی، طراحی پایگاه‌های داده، سیستمهای اطلاعات جغرافیایی و کتابخانه‌های رقمی اشاره کرد (شمس‌فرد و عبدالله‌زاده بارفروش، 2002).

در این میان، سازماندهی دانش پزشکی با پیچیدگیها و ویژگیهای خاص خود، همواره مورد توجه بوده است. تلاش کتابخانه ملی پزشکی آمریکا در طراحی سرعنوانهای موضوعی پزشکی )مش([8]، طرح رده‌بندی کتابخانه ملی پزشکی[9]، نظام زبان واحد پزشکی(یو.ام.ال.اس)[10] و متامپ[11]، گوشه‌ای از این خدمات و شاهدی بر این مدعاست. نظام زبان واحد پزشکی، پایگاه دانشی در حوزة پزشکی است که به طور گسترده در نظامهای اطلاعات پزشکی که به پردازش، بازیابی و یکپارچه‌سازی اطلاعات می‌پردازند، مورد استفاده قرار می‌گیرد (نا و نئو، 2008). این نظام که طرح آن از سال 1986 توسط کتابخانه ملی پزشکی ایالات متحده آمریکا شروع شده، تلاشی در راستای یکپارچه‌سازی نظام‌های واژگانی مختلف و متمایز زیست پزشکی، جهت ایجاد یک هستی‌شناسی است. این نظام ازسهمنبعدانش اصلی یعنی ابراصطلاحنامه[12]،شبکةمعنایی[13]وواژه‌نامة تخصصی و ابزارهای واژگانی[14]تشکیل شدهاست.ابراصطلاحنامه نظام زبان واحد پزشکی، یک پایگاه اطلاعاتی بسیار جامع و چند زبانه از واژگان کنترل شده است که از نسخة الکترونیکی اصطلاحنامه‌های متعدد، انواع طرحهای رده‌بندی، مجموعه‌های کدها، سیاهه‌های کنترل واژگان مورد استفاده در مراقبتهای درمانی و ... تشکیل شده است. تمامی مفاهیم درون ابراصطلاحنامه حداقل به یک گونة معناییدرون شبکه معنایی اختصاص یافته‌اند. شبکه معنایی نظام زبان واحد پزشکی نیز شامل گونه‌های معنایی و روابط معنایی[15] است. گونه‌های معنایی، مفاهیم درون ابر اصطلاحنامه را به یکدیگر مرتبط و روابط معنایی، میان گونه‌های معنایی رابطه برقرار می‌‌کند. بدین ترتیب، تمامی مفاهیم درون اصطلاحنامه مطابق با سطح کلی خویشاوندی یا نَسبی خود در شبکه معنایی مقوله‌بندی می‌شوند (ولی‌نژادی، 1387؛ ولی‌نژادی و همکاران، 1389؛ محمداسماعیل و صمدی، 1389).

از سوی دیگر، سیستمهای بالینی، سیستمهای عمومی اطلاعات پزشکی، سیستمهای خبرة پزشکی، سیستمهای بیمارستانی، سیستمهای پشتیبان تصمیم[16]، نظامهای کشف دانش[17]، سیستمهای مدارک پزشکی بیماران و پایگاه‌های اطلاعاتی متون زیست پزشکی، هرکدام به نحوی به منابع واژگانی کنترل شدة حوزه زیست پزشکی، متکّی و نیازمندند (ولی‌نژادی، 1387؛ سیمینو[18] و همکاران، 1994؛ جیمنزروئیز[19] و همکاران، 2007).در زبان فارسی، تدوین سرعنوانهای موضوعی پزشکی فارسی (رهادوست، 1376)، مهم‌ترین تلاش صورت گرفته در زمینة واژگان کنترل شدة پزشکی به شمار می‌رود. با این حال، پس از تدوین سرعنوانهای موضوعی پزشکی فارسی، تلاش درخوری در زمینة تدوین و طراحی واژگان کنترل‌شدة پزشکی فارسی صورت نگرفته است. همچنین، با وجود تعدد پژوهشهای انجام شده در خصوص هستی‌شناسی‌ها در خارج از کشور، بررسی متون حاکی از آن است که پژوهشهای صورت گرفته در داخل کشور محدود است (شمس‌فرد، 1381؛ خسروی و وظیفه‌دوست، 2007؛ فتحیان، 1388؛ شریف، 1388؛ شمس‌فرد و همکاران، 2010)، ضمن اینکه در حوزة موضوعی پزشکی، تاکنون هیچ هستی‌شناسی به زبان فارسی تدوین نشده است.

یکی از حوزه‌های پزشکی مورد توجه متخصصان و حتی عموم مردم، حوزة گیاهان دارویی است. در کشور ما استفاده از گیاهان برای درمان افزایش یافته و شاهد رونق دوباره عطاری‌ها هستیم. ایران با بهره‌مندی از پوشش گیاهی متنوع و شگفت‌انگیز و همچنین وجود فرهنگ و علاقة باطنی مردم به کاربرد گیاهان دارویی، از توانمندی بالقوه‌ای در این حیطه برخوردار است و تاکنون گونه‌های گیاهی متعدد و متنوعی در کشور شناسایی شده است (مازندرانی و همکاران، 1383). بنابراین، مبحث گیاهان دارویی ایران، موضوعی گسترده و مورد توجه در کشور است که سازماندهی و بازیابی اطلاعات آن نیز اهمیت خاصی دارد.  

با توجه به موارد پیش‌گفته، در پژوهشی به ایجاد نمونة اولیه از هستی‌شناسی گیاهان دارویی ایران بر پایه نظام زبان واحد پزشکی پرداخته شد. در این مقاله، روش به کار رفته برای ساخت این هستی‌شناسی شرح داده می‌شود. هدف پژوهش، ارائه روش‌شناسی برای طراحی هستی‌شناسی‌های حوزة پزشکی در زبان فارسی است.

 
مروری بر مطالعات انجام شده

تاکنون پژوهشهای زیادی در حوزة هستی‌شناسی‌ها انجام شده است. روش‌شناسی ساخت، ابزارهای ساخت، ساخت خودکار و یادگیری هستی‌شناسی‌ها، عناوین مورد بحث در این حوزه هستند. با توجه به تمرکز خاص این پژوهش بر روش ساخت هستی‌شناسی‌ها، در این قسمت ضمن مرور پژوهشهای مرتبط، نگاهی ویژه به روش‌شناسی ساخت آنها خواهیم داشت. در بررسی مطالعات خارج از کشور نیز، به پژوهشهایی که از نظام زبان واحد پزشکی و یا سایر هستی‌شناسی‌ها به عنوان هستی‌شناسی پایه برای ساخت هستی‌شناسی استفاده کرده‌اند، خواهیم پرداخت.

«آچور[20] و همکاران» (1999) در پژوهشی به بهره‌گیری و گسترش روابط و مداخل نظام زبان واحد پزشکی برای ایجاد هستی‌شناسی حوزة انتقال خون برای طراحی سیستم پشتیبان تصمیم در این حوزه پرداختند. استخراج واژگان، تعیین مفاهیم معادل، ایجاد فهرست مفهومی و تعیین گونه‌های معنایی مربوط در یو.ام.ال.اس، و استخراج روابط؛ چهار مرحله‌ای است که برای ساخت این هستی‌شناسی به کار رفته است. نتایج این پژوهش بر سودمندی نظام زبان واحد پزشکی جهت طراحی واژگان کنترل‌شده در یک حوزة خاص تأکید دارد.

«نوی و مک‌گینس» (2001) نیز در پژوهشی دستورالعملی برای ساخت هستی‌شناسی ارائه دادند. مراحل هفتگانة «نوی و مک‌گینس» عبارتند از: مشخص ساختن حوزه و پوشش هستی‌شناسی، استفادة دوباره از هستی‌شناسی‌های موجود، شمارش واژگان مهم در هستی‌شناسی، تعیین رده‌ها و سلسله مراتب بین آنها، توصیف ویژگیهای[21]‌ رده‌ها، تعریف چهریزه‌های ویژگیها[22]، و ایجاد نمونه‌ها. این روش در پژوهش «نا و نئو» (2008)نیز مورد استفاده قرار گرفته است. در این پژوهش که به منظور ارزیابی سودمندی شبکه معنایی نظام زبان واحد پزشکی جهت ایجاد هستی‌شناسی‌ها در حوزه‌های مرتبط با پزشکی انجام شد، از این روش برای ایجاد هستی‌شناسی در حوزة سرطان کولون بر اساس تحلیل چکیدة 109 مقالة مرتبط با این موضوع در پایگاه پابمد[23] استفاده شده است.

«دامونتیر و ویلانیواروسالس» (2009) نیز در پژوهشی برای ساخت هستی‌شناسی حوزة فارماکوژنتیک به کمک نسخة 4 نرم‌افزار پروتژه[24]، از پنج مرحله به شرح زیر بهره بردند: مشخص ساختن حوزه و ملزومات هستی‌شناسی، ایجاد مدلی ابتدایی از هستی‌شناسی بر اساس مفاهیم ضروری، ترسیم مفاهیم در یک هستی‌شناسی سطح بالا(که در این پژوهش مفاهیم در هستی‌شناسی بی.اف.ا[25]ُ ترسیم شدند)، تشخیص روابط بین مفاهیم، افزودن هستی‌شناسی‌های دیگر و توصیفات پیچیده‌تر به هستی‌شناسی. آنان در نهایت، استفاده از هستی‌شناسی‌ها و وب معنایی را راهکاری مناسب برای بازنمایی و بازیابی اطلاعات حوزة فارماکوژنتیک دانستند.

«رئیزمارتینز[26] و همکاران» (2011) نیز در پژوهش خود روشی برای ایجاد هستی‌شناسی‌های حوزة زیست‌پزشکی برگرفته از متون معرفی کردند. این شیوه بر پایه پردازش زبان طبیعی و تکنیکهای توسعه‌ای فراهم‌آوری دانش استوار است. همچنین، الگوریتمی برای مرتبط کردن مفاهیم منفرد موجود در هستی‌شناسی با استفاده از نظام زبان واحد پزشکی فراهم آمده است. آنان در انتها استفاده از گونه‌های معنایی نظام زبان واحد پزشکی را در مقایسه با استفاده از کلمات برای نمایش ویژگیهای متون بالینی، مفیدتر و اثرگذارتر می‌دانند.

در دیگر پژوهشهای این حوزه نیز، روندی مشابه برای طراحی و ایجاد هستی‌شناسی‌ها استفاده شده است. «برایت[27] و همکاران» (2012) در پژوهشی که به منظور ایجاد هستی‌شناسی برای راهنمایی در تجویز آنتی‌بیوتیک مناسب انجام شد، به توسعه و به کارگیری روشهای ایجاد هستی‌شناسی در حوزة تجویزهای آنتی‌میکروبیال با استفاده از نرم‌افزار protégé-owl پرداختند. مراحل ساخت این هستی‌شناسی شامل شش مرحله و بدین ترتیب است: تعیین پوشش هستی‌شناسی، مرور هستی‌شناسی‌های موجود، تعیین رده‌ها و ویژگیها، ایجاد یک مدل مفهومی، به کارگیری یک هستی‌شناسی سطح بالا و بازنمون هستی‌شناسی در یک زبان رسمی. صحت هستی‌شناسی نیز با استفاده از اصول طراحی هستی‌شناسی و نقد صاحب‌نظران ارزیابی شد. ارزیابی هستی‌شناسی بر صحت آن، مفید بودن هستی‌شناسی در نمایش دادن و نگهداری قواعد درمان آنتی میکروبیال، و مفید بودن آن در هشدار دادن به عنوان بازخوردی به تجویز آنتی‌بیوتیک پزشک صحه گذاشته است. 

در نزدیکترین پژوهش داخلی انجام شده مرتبط با این مقاله، «فتحیان» (1389) به مقایسه کارآمدی اصطلاحنامه و هستی‌شناسی در بازنمون دانش پرداخت. وی ابتدا با روش تحلیل حوزه، به ساخت نمونه اولیه‌ای از هستی‌شناسی در قلمرو «نمایه‌سازی» با عنوان ASFAOnt در نرم‌افزار پروتژه نسخة 3.4.4 پرداخت. این هستی‌شناسی حاصل تبدیل مفاهیم حوزة نمایه‌سازی اصطلاحنامه اصفا به هستی‌شناسی است که بر مبنای روشی تلفیقی گسترش یافته از روشهای ارائه شده «آچولد و گرونینگر» و نیز «نوی و مک گینس» و به روش نیمه خودکار در چهار مرحله شامل گردآوری مفاهیم، کشف و تعیین روابط میان مفاهیم، ایجاد کاربرگه برای هر مفهوم و پیاده‌سازی هستی‌شناسی در محیط نرم‌افزار Protege اجرا شده است. سپس به منظور ارزیابی کارآمدی ساختار هستی‌شناسی طراحی شده با روش تحلیل حوزه در بازنمون دانش، در یک مطالعة کاربردپذیری به سنجش هستی‌شناسی در مقایسه با اصطلاحنامه پرداخت. بر اساس یافته‌های این پژوهش، میزان کارآمدی هستی‌شناسی در بازنمون دانش، از کارآمدی اصطلاحنامه اصفا بیشتر است(صنعت‌جو و فتحیان؛ 1390؛ صنعت‌جو و فتحیان؛ 1391). مهم‌ترین تفاوت پژوهش حاضر با پژوهش «صنعت‌جو و فتحیان»، در استفاده از نظام زبان واحد پزشکی به عنوان هستی‌شناسی پایه برای طراحی و ایجاد هستی‌شناسی است. بر همین اساس، مراحل پیموده شده در ساخت هستی‌شناسی نیز در مواردی با یکدیگر متفاوت است. به عبارتی، در این پژوهش، یو.ام.ال.اس مبنای ایجاد هستی‌شناسی قرار گرفت؛ در حالی که اساس کار پژوهش پیش گفته، تبدیل اصلاحنامه به هستی‌شناسی بوده است. تفاوت دیگر در روش استخراج داده‌هاست که در این پژوهش راهکار مهندسی دانش و در پژوهش «صنعت‌جو و فتحیان» تحلیل حوزه است. همچنین، پژوهش مذکور به ارزیابی و تحلیل نظرهای کاربران در مورد کارآمدی هستی‌شناسی و اصطلاحنامه نیز پرداخته است، حال اینکه تأکید اصلی این پژوهش بر طراحی هستی‌شناسی بوده و ارزیابی نظرهای کاربران مدنظر نیست.

در دیگر پژوهش داخلی انجام شده، «شمس‌فرد و بارفروش» (بی‌تا) به معرفی راهکاری خودکار در اکتساب دانش مفهومی و ساخت هستی‌شناسی از پایه بر اساس متون زبان طبیعی پرداختند. این روش از یک هستة کوچک هستی‌شناسی که حاوی فرادانش لازم برای یادگیری است شروع و با تکنیکهای پردازش زبان طبیعی، مفاهیم و رابط طبقه‌ای و غیرطبقه‌ای را استخراج می‌کند. ورودی این سیستم متون زبان فارسی و خروجی آن واژگان و هستی‌شناسی بسط یافته و یادگرفته شده از متن است.

 
 
روش کار

از آنجا که این پژوهش به ایجاد نمونة اولیه از هستی‌شناسی گیاهان دارویی ایران می‌پردازد، از نوع توسعه‌ای است. برای ایجاد هستی‌شناسی مذکور، هشت گیاه به عنوان نمونه انتخاب و با روش مهندسی دانش[28]، مفاهیم و روابط مربوط به آنها از متون و منابع استخراج شد. روش مهندسی دانش، روشی است که در استخراج اطلاعات از متون به کار گرفته می‌شود (نا و نئو، 2008). بر اساس این روش، متون مربوط مطالعه و مفاهیم و روابط مرتبط با «گیاهان دارویی ایران» استخراج شد. مفاهیم به شکل جفت معنایی استخراج شد و معیار انتخاب دو مفهوم برای تشکیل جفت معنایی، وجود هر دو واژه در یک جمله بود. برای انتخاب این هشت گیاه، از روش نمونه‌گیری مبتنی بر هدف، از نوع نمونه‌گیری بر مبنای تئوری، استفاده شد. در نمونه‌گیری مبتنی بر هدف، پژوهشگر می‌کوشد تا به صورت هدفدار، بر مبنای اینکه چه نوع اطلاعات خاصی مورد نیاز است، نمونه‌هایی را انتخاب کند. لذا اینکه چه نمونه‌های انتخاب شوند، تحت تأثیر این است که قبلاً چه نمونه‌هایی انتخاب شده‌اند. در نمونه‌گیری بر مبنای تئوری نیز که نوعی از نمونه‌گیری مبتنی بر هدف است، انتخاب نمونه‌ها بر مبنای اینکه نمایندة سازه‌های مهم مطرح در یک تئوری باشند، انجام می‌شود (صانعی و نیکبخت نصرآبادی، 1383؛ حاج‌باقری و همکاران، 1386). بر همین اساس، در این پژوهش ابتدا گیاه خاکشیر، با نظر صاحب‌نظران حوزة گیاهان دارویی و با توجه به این مطلب که این گیاه بومی ایران است و میزان استفاده از آن در کشور بالا بوده و خاصیت درمانی قابل توجهی دارد، انتخاب شد. سایر گیاهان نیز، با در نظر گرفتن این سه معیار، توجه به داده‌های جمع‌آوری شده از گیاه خاکشیر و اشباع مفهومی به لحاظ نوع گونه‌های معنایی شکل گرفته در حین پیشرفت مطالعه مشخص شدند. این گیاهان شامل آویشن شیرازی، بابونه شیرازی، اسپند، آنغوزه (حلتیت)، باریجه، گل گاوزبان و ترنجبین هستند.

همچنین، نظام زبان واحد پزشکی به عنوان هستی‌شناسی پایه انتخاب و با مفاهیم و روابط مستخرج از متون گسترش داده شد. این کار بر اساس روشهای مورد استفاده در پژوهشهای «نوی»[29] و «مک‌گینس»[30] (2001) و «دامونتیر»[31] و «ویلانیواروسالس»[32](2009) و به کمک نرم‌افزار پروتژه[33] نسخة 4.2-beta انجام شد. در خصوص نرم‌افزار مورد استفاده در این پژوهش نیز باید به این مطلب اشاره کرد که تاکنون چندین ابزار برای کمک به ساخت هستی‌شناسی‌ها طراحی شده است. «متازکا»[34]، «دوتس»[35]، «سیس»[36]، «آنتوبیلدر»[37]، و «پروتژه» (اریکسون[38] و همکاران، 1999) نمونه‌ای از این ابزارها هستند. پروتژه، نرم‌افزاری برای ایجاد و ویرایش هستی‌شناسی‌ها و پایگاه‌های دانش است. این نرم‌افزار جایگاه خاصی در ایجاد هستی‌شناسی‌های حوزة پزشکی دارد و کتابخانه ملی پزشکی آمریکا، آژانس طرحهای پژوهشی پیشرفته دفاعی، مؤسسه ملی سرطان، مؤسسه ملی استاندارد و فناوری نیز از آن حمایت می‌کنند. این نرم‌افزار واسط کاربری فراهم می‌آورد که در آن امکان تعریف مفاهیم، نمونه‌ها، ویژگیها و محدودیتهای مفاهیم و همچنین روابط، وجود دارد. مزیت استفاده از این ابزار آن است که در صورت وجود، می‌توان از مفاهیم و روابط موجود در سایر هستی‌شناسی‌ها به منظور ساخت و توسعة هستی‌شناسی جدید استفاده کرد(شریف، 1388). به همین سبب، با توجه به جایگاه پروتژه در ایجاد هستی‌شناسی‌های حوزة پزشکی و نیز استفاده از نظام زبان واحد پزشکی به عنوان هستی‌شناسی پایه در ایجاد هستی‌شناسی گیاهان دارویی ایران، در این پژوهش از این ابزار استفاده شد.

فرایند ساخت هستی‌شناسی

در این قسمت به شرح مراحل پیموده شده در استخراج دانش مفهومی و ایجاد هستی‌شناسی IranMedPlantsOntمی‌پردازیم. همان‌طور که اشاره شد، مبنای روش به کار گرفته شده در استخراج مفاهیم و روابط معنایی، راهکار مهندسی دانش(نا و نئو، 2008) و مبنای روش به کار رفته در ایجاد هستی‌شناسی، روشهای مورد استفاده در پژوهشهای «نوی و مک‌گینس» و «دامونتیر و ویلانیواروسالس» است. گفتنی است، با وجود جدا بودن دو مرحلة اصلی استخراج دانش و ایجاد هستی‌شناسی در پژوهشهای مورد بررسی، در این پژوهش این دو مرحله به شکل در هم تنیده و همزمان پیش رفت. در ادامه شرح این مراحل ارائه می‌شود:

1.    مشخص ساختن حوزه و پوشش هستی‌شناسی: حوزه موضوعی این پژوهش هشت گیاه داروییایران است و مبنای آن، مفاهیم و روابط معنایی است که از متون بومی موجود استخراج شده‌اند. این متون شامل کتابهای قانون فی‌الطب (ابن‌سینا، 1425 ﻫ.ق.)، مخزن الادویه (عقیلی خراسانی، 1380)، الحاوی (رازی، 1384)، الاغراض الطبیه و المباحث العلائیه (اس‍م‍اعیل‌ ج‍رج‍انی،1384)، تذکره اولی الالباب و الجامع للعجب العجاب (انطاکی، 1971 م)، الابنیه عن حقایق‌الادویه (هروی، 1371)، تحفة المؤمنین (مازندرانی، 1389) و الشامل فی الصناعة الطبیه (ابن نفیس، 1387) می‌باشد. همچنین، برای دور نماندن از مباحث نوین در این حوزه، کتاب متداول‌ترین گیاهان دارویی سنتی ایران (امین، 1387)، و مقاله‌های مرتبط با هشت گیاه منتخب در سه مجلة فصلنامه گیاهان دارویی، فصلنامه طب سنتی اسلام و ایران و فصلنامه گیاهان دارویی و معطر ایران، مورد بررسی قرار گرفت.

2.    استفادة دوباره از هستی‌شناسی‌های موجود: در این پژوهش از نظام زبان واحد پزشکی به عنوان هستی‌شناسی پایه در ایجاد هستی‌شناسی گیاهان دارویی ایران استفاده شد. در ابتدا با بهره‌گیری از شبکه معنایی نظام زبان واحد پزشکی، گونه‌ها و روابط معنایی مرتبط با گیاهان دارویی ایران، به شکل خودکار وارد نرم‌افزار پروتژه شد. گونه‌های معنایی این نظام در جایگاه رده‌ها و روابط معنایی در جایگاه ویژگیها قرار گرفت. همچنین، از ابراصلاحنامة این نظام برای تعیین جایگاه سلسله مراتبی مفاهیم مستخرج از متون و تعریفهای آنها استفاده شد. گفتنی است، در تمامی این مراحل، نیاز به ترجمة گونه‌ها، روابط، مفاهیم و تعریفهای مستخرج از یو.ام.ال.اس بود. این کار با نظارت متخصصان موضوعی انجام شد.

3.    تعیین جفت‌های مفهومی و روابط آنها و ترسیم آنها در ساختار یو.ام.ال.اس: در این مرحله، با استفاده از راهکار مهندسی دانش، متون مورد بررسی قرار گرفت. بدین ترتیب، جفت‌های مفهومی و روابط آنها شناسایی شد. برای ترسیم مفاهیم و روابط در ساختار یو.ام.ال.اس نیز، مفاهیم و روابط برگرفته از متون با یو.ام.ال.اس تطبیق داده شد و با شناسایی گونه‌ها و روابط معنایی مربوط در یو.ام.ال.اس، در جایگاه سلسله مراتبی و معنایی مناسب ترسیم گردید. در صورت نبود گونة معنایی، مفهوم یا رابطه در یو.ام.ال.اس، عبارت مورد نظر با نظر متخصصان موضوعی به هستی‌شناسی اضافه شد. جدول (1) مثالی از جفت مفهومی شکل گرفته در خصوص گیاه خاکشیر و بیماری مخملک، رابطة شکل گرفته بین آنها و مفاهیم، رابطه و گونة معادل در نظام زبان واحد پزشکی را نشان می‌دهد.

 

جدول1. شکل‌گیری جفت معنایی بر اساس مفاهیم، رابطة معنایی و گونه‌های معنایی گیاه خاکشیر

مفهوم یا رابطه مشاهده شده در متون

مفهوم یا رابطه برگزیده شده

مفهوم یا رابطه معادل در یو.ام.ال.اس

گونه معنایی معادل در یو.ام.ال.اس

گونه معنایی مرتبط

گونه معنایی اضافه شده به یو.ام.ال.اس

جفت معنایی شکل گرفته

خبه (مفهوم)

خاکشیر

Descurainia Sophia

plant
گیاه

گیاهان دارویی

گیاهان دارویی تأثیر می‌گذارد بر بیماری یا نشانگان

جهت (رابطه)

تأثیر می‌گذارد بر

Affects
 
 
 

شری (مفهوم)

مخملک

Scarlet fever; rash

Disease or Syndrome

بیماری یا نشانگان

 
 

چنان که در جدول1 نشان داده شده است (از راست به چپ)، ابتدا مفاهیم و روابط مشاهده شده در متون، استخراج و با نظر متخصصان این حوزه و در نظر گرفتن مفهوم یا رابطه متداول، واژه‌های ارجح انتخاب شد. سپس متناظر این عبارتها در نظام زبان واحد پزشکی شناسایی، و با استفاده از بخش شبکه معنایی این نظام، گونة معنایی مربوط نیز مشخص گردید. در نهایت اگر مفهوم، رابطه یا گونه‌ای در یو.ام.ال.اس موجود نبود، در صورتی که افزودن آن به هستی‌شناسی، از نظر متخصصان موضوعی و با توجه به دفعات تکرار در متون لازم بود، آن واژه اضافه شد. همچنین، با تشکیل جفت معنایی، علاوه بر مشخص شدن خلأهای نظام زبان واحد پزشکی در مورد گیاهان دارویی ایران، چهریزه‌های لازم برای مرحلة شش نیز شناسایی گردید.

4.    تعیین رده‌ها و سلسله مراتب بین آنها[39]: تعیین رده‌ها و روابط سلسله مراتبی بین آنها تا حد زیادی به نوع استفاده از هستی‌شناسی، سطح جزئی‌نگری مورد انتظار و ملزومات سازگاری با سایر مدلها بستگی دارد. در این پژوهش، با توجه به انتخاب نظام زبان واحد پزشکی به عنوان هستی‌شناسی پایه، گونه‌های معنایی نظام زبان واحد پزشکی به عنوان رده‌ها انتخاب شدند. با این حال، با در نظر گرفتن مضامین موجود در متون بومی و با توجه به تعدد سلسله مراتب در مورد برخی از واژگان، برخی از مفاهیم یو.ام.ال.اس هم وارد بخش کلاس شدند(مانند مفاهیم «ضماد» و «شیاف»). همچنین، سلسله مراتب بین رده‌ها هم طبق سلسله مراتب این نظام تعیین شد. سپس این رده‌ها در قسمت کلاسها در نرم‌افزار پروتژه وارد شد. در نهایت، 28 گونه معنایی شکل گرفته در شکل 1، قسمتی از این رده‌ها قابل مشاهده است. 

 

 

شکل1. بخش رده‌ها و نمونه‌ها در هستی‌شناسی IranMedPlantsOnt

 

5.       توصیف ویژگیهای رده‌ها و روابط[40]‌: اطلاعات ارائه شده در رده‌ها به هیچ عنوان کافی نیست. به همین منظور، قسمت ویژگیها به روابط مورد نیاز در هستی‌شناسی اختصاص می‌یابد و ارتباط بین رده‌ها از این طریق ایجاد می‌شود. در این پژوهش، قسمت ویژگیها و روابط در نرم‌افزار پروتژه با روابط معنایی شبکه معنایی نظام زبان واحد پزشکی و روابط معنایی مستخرج از متون تکمیل شد. روابط به طور کلی به سه دسته روابط شیء[41]، روابط نوع داده[42] و روابط تفسیری[43] تقسیم می‌شوند(صنعت‌جو و فتحیان، 1391). شکل 2، قسمتی از این روابط را نشان می‌دهد. در این شکل، روابط شی‌ء نشان داده شده است. رابطه «مفهوم معادل در یو.ام.ال.اس» نوعی رابطه نوع داده و رابطة «نیز ببینید» مثالی از روابط تفسیری است. از این روابط برای توصیف رده‌ها و نمونه‌ها استفاده شد.در کل 21 رابطه معنایی در این پژوهش شکل گرفت.

 

 

 

شکل2. بخش ویژگیها و روابط در هستی‌شناسی IranMedPlantsOnt

 

6.    تعریف چهریزه‌های ویژگیها[44] : ویژگیها می‌توانند چهریزه‌های مختلفی داشته باشند. جنبه یا چهریزه‌های ویژگیها، نوع مقادیر، مقادیر مجاز و تعداد آنها را مشخص می‌سازد. چهریزه‌ها در عمل برای تعریف حدود و نوع روابط بین نمونه‌ها به کار می‌روند. به عنوان مثال، ویژگی «درمان می‌کند» می‌تواند با نمونه‌های مشخصی به کار رود. بدین ترتیب، باید فهرستی از رده‌های مجاز که می‌توانند رابطه‌های «درمان می‌کند» و «درمان می‌شود با» را داشته باشند، مشخص شوند. به عنوان مثال، در این پژوهش، دو گونة معنایی «گیاهان دارویی ایران» و «نشانه یا علامت» با این روابط به یکدیگر مرتبط شده‌اند. بنابراین، نمونه‌های مربوط به آنها (به عنوان مثال و به ترتیب «خاکشیر» و «اسهال») نیز مجاز به داشتن این رابطه هستند. شکل 3، رده‌های مجاز برای دریافت روابط معنایی مختلف با «گیاهان دارویی ایران» را نشان می‌دهد.

 

 

 

شکل 3. چهریزه‌های مشخص شده مربوط به گونه معنایی «گیاهان دارویی ایران»

 

7.    ایجاد نمونه‌ها: آخرین گام، ایجاد نمونه‌های مربوط به هر رده است. تعریف نمونه‌های یک رده در نرم‌افزار پروتژه مستلزم انتخاب آن رده، ایجاد یک نمونه منفرد، و پرکردن ویژگیها[45] با مقادیر تعیین شده و مجاز است. در این پژوهش، جفتهای مفهومی شکل گرفته در مرحلة سه، در جایگاه نمونه‌ها قرار گرفتند و بر مبنای چهریزه‌های تعیین شده در مرحلة شش، ارتباط بین آنها برقرار شد. ویژگیهایی که برای توصیف نمونه‌ها به کار می‌روند، عمدتاً شامل نام نمونه، مفهوم معادل در نظام زبان واحد پزشکی (در صورت وجود)، مترادفها، و روابط معنایی بین نمونه‌ها (مانند «درمان می‌کند») است. تصویر 1، قسمتی از نمونة خاکشیر را نشان می‌دهد. در مجموع، 259 مفهوم وارد این قسمت شدند.

 
بحث و نتیجه‌گیری

در این مقاله، با مرور پژوهشهای پیشین و با ایجاد نمونه‌ای اولیه از هستی‌شناسی گیاهان دارویی ایران، روشی برای ایجاد هستی‌شناسی‌های حوزة پزشکی در زبان فارسی ارائه شد. این روش، ترکیبی از روشهای ارائه شده در پژوهشهای «نوی و مک‌گینس» و «دامونتیر و ویلانیواروسالس» است که در مواردی تغییر یا گسترش یافت. تعیین دامنه و پوشش هستی‌شناسی، استفاده از نظام زبان واحد پزشکی به عنوان هستی‌شناسی پایه، تعیین جفتهای مفهومی و ترسیم آنها در ساختار یو.ام.ال.اس، تعیین رده‌ها و سلسله مراتب بین آنها، توصیف ویژگیها، تعریف چهریزه‌ها و ایجاد نمونه‌ها، مراحل هفتگانة پیشنهادی برای ایجاد هستی‌شناسی‌های پزشکی فارسی هستند.

در نهایت، با بررسی متون و مطالعة موردی انجام شده بر روی گیاهان دارویی ایران، پژوهشگران روش ارائه شده در این مقاله را روشی مناسب برای ایجاد هستی‌شناسی‌های حوزة پزشکی در زبان فارسی می‌دانند. با این حال، مهم‌ترین مشکل این روش را می‌توان زمان‌بر بودن آن دانست. با توجه به اهمیت زمان در ساخت هستی‌شناسی‌ها، پیشنهاد می‌شود در پژوهشی فرایند ساخت هستی‌شناسی گیاهان دارویی ایران بر اساس روشهای خودکار مانند سیستم یادگیر پیشنهادی در پژوهش «شمس‌فرد و بارفروش»، انجام و نتایج حاصل با یافته‌های این پژوهش مقایسه شود. بدین ترتیب، می‌توان به شکل عینی مزایا و معایب هر روش از لحاظ زمان، هزینه، دقت و کیفیت ابزار، دیدگاه کاربر و قابلیت پیاده‌سازی و کاربرد آن در پایگاه‌های دانش را بررسی و با یکدیگر مقایسه کرد. در این صورت، می‌توان چارچوبی واحد برای ایجاد هستی‌شناسی‌های حوزة پزشکی در زبان فارسی ارائه داد. نظر به وجود هستی‌شناسی‌های غنی در حوزة پزشکی مانند نظام زبان واحد پزشکی و اثبات سودمندی آنها برای ساخت هستی‌شناسی‌ها در پژوهشهای پیشین (آچور و همکاران، 1999؛ یو[46] و همکاران، 1999؛ مریل[47] و همکاران، 2008)، به نظر می‌رسد بهره‌گیری از این ابزارها می‌تواند موجب تسهیل فرایند ساخت هستی‌شناسی شده و بر دقت، صحت و سرعت کار بیفزاید. این پژوهش با بهره‌گیری از نظام زبان واحد پزشکی به عنوان هستی‌شناسی پایه در ایجاد هستی‌شناسی گیاهان دارویی ایران، نقطه شروعی برای ایجاد هستی‌شناسی بر اساس سایر هستی‌شناسی‌ها، در زبان فارسی است.

-آل‌احمد، ابوالفضل (1385). مقدمه‌ای بر وب معنایی.بازیابی10 مهر، 1391.
-امین، غلامرضا (1387). متداولترین گیاهان دارویی سنتی ایران. تهران: انتشارات دانشگاه علوم پزشکی و خدمات بهداشتی درمانی تهران، مرکز تحقیقات اخلاق و تاریخ پزشکی.
-ابن سینا، حسین بن عبدالله (1425 ﻫ. ق). القانون فی الطب. وضع حواشیه محمد امین الضناوی. بیروت: دارالکتب العلمیه.
-ابن نفیس، ع‍ل‍ی‌ ب‍ن‌ اب‍ی‌ ال‍ح‍زم‌. (1387). ال‍ش‍ام‍ل‌ فی‌ ال‍ص‍ن‍اع‍ه‌ ال‍طب‍ی‍ه‌ الادویه و الاغذیه. تهران: م‍وس‍س‍ه‌ م‍طال‍ع‍ات‌ ت‍اری‍خ‌ پزشکی، طب‌ اس‍لام‍ی و م‍ک‍م‍ل‌ دان‍ش‍گ‍اه‌ ع‍ل‍وم‌ پ‍زش‍ک‍ی‌ ای‍ران.
-انطاکی، داودبن عمر (1971 م). تذکره اولی الالباب و الجامع للعجب العجاب. بیروت: دارالکتب العلمیه.
-ج‍رج‍انی، اسماعیل بن حسن (1384). الاغ‍راض‌ الطبی‍ه و ال‍م‍ب‍اح‍ث‌ ال‍ع‍لائ‍ی‍ه‌. تهران: م‍ؤس‍س‍ه‌ ان‍ت‍ش‍ارات‌ و چ‍اپ‌ دانشگاه تهران با همکاری فرهنگستان علوم.
-جمالیمهمویی، حمید. (1382). «وب معنایی: شیوه‌ای رو به تکامل برای ذخیره و بازیابی کارآمدتر اطلاعات روی اینترنت». اطلاع‌‌شناسی؛ 1(2): 49-65.
-حاج‌باقری، محسن؛ سرور پرویزی، و مهوش؛ صلصالی (1386). روش تحقیق کیفی. تهران: بشرا.
-حسینی تنکابنی، میرمحمد مومن (1389). تحفة المؤمنین. تهران: نشر شهر.
-رازی، محمدبن زکریا (1384). الحاوی فی الطب. تهران: فرهنگستان علوم پزشکی جمهوری اسلامی ایران.
-رهادوست، فاطمه (1376). اصلاحنامه پزشکی فارسی. تهران: کتابخانه ملی ایران.
-شریف، عاطفه (1388). مهندسی خودکار هستی شناسی: امکان‌سنجی استخراج روابط معنایی از متون فارسی و تعیین میزان پیدایی آنها. کتابداری و اطلاع‌رسانی؛ 12(2):243-263.
-شمس‌فرد، مهرنوش و احمد عبدالله‌زاده‌بارفروش (1381). استخراج دانش مفهومی از متن با استفاده از الگوهای زبانی و معنایی. تازه‌های علوم شناختی؛ 4(1):48-66.
-شمس‌فرد، مهرنوش و احمد عبدالله‌زاده‌بارفروش (1389). ساخت هستی‌شناسی از روی متون زبان طبیعی. بازیابی 8 آذر، 1391.
-شمس‌فرد، مهرنوش (1381). طراحی مدل یادگیر هستی‌شناسی:  نمونه‌سازی در یک سیستم درک متن فارسی. پایان‌نامة دکتری. تهران: دانشگاه صنعتی امیرکبیر.
-صانعی، اشرف و علیرضا نیکبخت نصرآبادی (1383). روش‌شناسی تحقیقات کیفی در علوم پزشکی. تهران: برای فردا.
-صنعت‌جو، اعظم و اکرم فتحیان (1391). روش‌شناسی طراحی، ساخت و پیاده‌سازی هستی شناسی: رویکردها، زبان ها و ابزارها (مطالعه موردی طراحی هستی‌شناسی Asfaont در حوزه کتابداری و اطلاع‌رسانی. فصلنامه کتابداری و اطلاع‌رسانی؛ 15(57).
-صنعت‌جو، اعظم؛ فتحیان، اکرم(1390). مقایسه کارآمدی اصطلاحنامه و هستی‌شناسی در بازنمون دانش (طراحی و ساخت نمونه هستی‌شناسی اصفا). پژوهشنامه کتابداری و اطلاع‌رسانی؛ 1(1):219-40. فتحیان دستگردی، اکرم (1389). مقایسه کارآمدی اصطلاحنامه و هستی‌شناسی در بازنمون دانش و بازیابی مفاهیم، ‌پایان‌نامه کارشناسی ارشد رشته کتابداری و اطلاع‌رسانی، به راهنمایی اعظم صنعت‌جو، دانشگاه فردوسی مشهد.
-عقیلی خراسانی، محمدحسین (1380). مخزن الادویه. تهران: باورداران.
-لنکستر، اف. دبلیو. (1382). نمایه‌سازی و چکیده‌نویسی، مبانی نظری و عملی. ترجمه عباس گیلوری. تهران: چاپار.
-مازندرانی، معصومه؛ مهرداد کسایی و محمدباقر رضایی (1383). معرفی گیاهان دارویی کوهستان زیارت گرگان. فصلنامه پژوهشی تحقیقات گیاهان دارویی و معطر ایران؛ 20(1):39-58.
-محمداسماعیل، صدیقه و لاله صمدی (1389). بررسی هستی‌شناختی فرا اصطلاح‌نامه نظام زبان پزشکی واحد. مدیریت اطلاعات سلامت؛ 7(2): 160-147.
-ولی‌نژادی، علی و دیگران (1389). امکان‌سنجی انعکاس پتانسیل مفاهیم طب سنتی ایران در پارادایم بین المللی نظام زبان واحد پزشکی. فصلنامه طب سنتی اسلام و ایران؛ 1(3): 225-237.
-ولی‌نژادی، علی (1387). طرح ترسیم جایگاه مفاهیم طب سنتی ایران در ساختار زبان مشترک ابَراصطلاحنامه و شبکه معنایی نظام زبان واحد پزشکی (یو ام ال اس). پایان‌نامه­ی کارشناسی ارشد. تهران: دانشگاه علوم پزشکی تهران.
-ه‍روی‌، م‍وف‍ق‌ب‍ن‌ ع‍ل‍ی‌ (1371). الابنیه عن حقایق الادویه یا روضة الانس و منفعة النفس. به تصحیح احمد بهمن­یار. به کوشش حسین محبوبی اردکانی. تهران: انتشارات دانشگاه تهران.
-   Achour, S.; Dojat, M.; Brethon, J.-M.; Blain, G.; & Lepage, E. (1999, 6-10 Nov). The use of the UMLS Knowledge Sources for the Design of a Domain Specific Ontology : a Practical Experience in Blood Transfusion. Paper presented at the American Medical Informatics Association Annual Symposium, Washington, DC.
-   Bright, T. J.; Furuya, E. Y.; Kuperman, G. J.; Cimino, J. J.; & Bakken, S. (2012). Development and evaluation of an ontology for guiding appropriate antibiotic prescribing. Journal of Biomedical Informatics; 45: 120-128.
-   Cimino, J.; Clayton, P.; Hripcsak, G.; & Johnson, S. (1994). Knowledge-based approaches to the maintenance of a large controlled medical terminology . J Am Med Inform Assoc; 1(1): 35-50.
-   Dumontier, M.; & Villanueva-Rosales, N. (2009). Towards pharmacogenomics knowledge discovery with the semantic web. BRIEFINGS IN BIOINFORMATICS; 10(2): 153-163.
-   Eriksson, H.; Fergerson, R.; Shahar, Y.; Musen, M. A.; Banff, T. (1999). Knowledge Acquisition for Knowledge-based systems Workshop.
-   Jiménez-Ruiz, E. (2007). A well founded framework for the definition of application modules over large biomedical ontologies. Universitat Jaume I (Castellón).
-   Khosravi, F.; & Vazifedoost, A. (2007). Creating a Persian Ontology through Thesaurus: Reengineering for Organizing the Digital Library of the National Library of Iran. Paper presented at the Building An Information Society For All: Proceedings of the International Conference on Libraries, Information and Society, ICOLIS.
-   Merrill, G. H.; Ryan, P. B.; & Painter, J. L. (2008). Construction and Annotation of a UMLS/SNOMED-based DrugOntology for Observational Pharmacovigilance. Paper presented at the Presented at IDAMAP (Intelligent Data Analysis for bioMedicine and Pharmacology).
-   Na, J.-C.; & Neoh, H. L. (2008). Effectiveness of UMLS semantic network as a seed ontology for buildinga medical domain ontology. Aslib Proceedings, 60(1): 32-46.
-   Noy, N. F.; & McGuinness, D. L. (2001). Ontology Development 101: A Guide to Creating Your First Ontology. Stanford: Stanford Knowledge Systems Laboratory Technical Report and Stanford Medical Informatics Technical Report.
-   Ruiz-Martínez, J. M.; Valencia-García, R.; Fernández-Breis, J. T.; García-Sánchez, F.; & Martínez-Béjar, R. (2011). Ontology learning from biomedical natural language documents using UMLS.Expert Systems with Applications; 38(10): 12365-12378.
-   Shamsfard, M.; Hesabi, A.; Fadaei, H.; Mansoory, N.; Famian, A.; Bagherbeigi, S.; et al. (2010). Semi Automatic Development of FarsNet: The Persian WordNet. Paper presented at the 5th Global WordNet Conference (GWA).
-   Yu, H.; Friedman, C.; Rhzetsky, A.; & Kra, P. (1999). “Representing genomic knowledge in the UMLS semantic network”. Paper presented at the Proc AMIA Symp.