نوع مقاله : مقاله پژوهشی
نویسنده
دانشجوی دکترای کتابداری و اطلاعرسانی دانشگاه شهید چمران اهواز
چکیده
کلیدواژهها
مقدمه
مفاهیم بسیاری پیرامون ما وجود دارد که آنها را در قالب عبارتهای مختلف در بیان مسائل روزانه خود به کار میبریم. وقتی میگوییم «هوا خوب است»، در واقع هیچ کمیّتی برای خوب بودن هوا نداریم تا آن را اندازه بگیریم و این خوب بودن کاملاً یک مفهوم کیفی است. در واقع، مغز انسان با در نظر گرفتن عوامل گوناگون و بر پایة تفکر استنتاجی، جملههایی را تعریف و ارزشگذاری میکند که الگوبندی آنها به زبان و فرمولهای ریاضی اگر ناممکن نباشد، کاری بسیار پیچیده خواهد بود.
«منطق فازی»[1] بر آن است بر این مفاهیم غیردقیق و کیفی دلالت کند. منطق یا تئوری فازی «یک نوع منطق است که روش های نتیجهگیری در مغز بشر را جایگزین میکند». (ویکی پدیا، 2006)
در جهان واقع نیز آدمی بسیاری از مفاهیم را به صورت فازی (به معنای غیردقیق و مبهم) درک میکند و بهکار میبندد. هرچند کلمات و مفاهیمی همچون «گرم، سرد، بلند، کوتاه، پیر، جوان» و نظایر آنها به عدد خاص و دقیقی اشاره ندارند، ذهن انسان با سرعت و انعطافپذیری شگفتآوری همه را میفهمد و در تصمیمها و نتیجهگیریهای خود، به شمار میآورد. این در حالی است که ماشین فقط اعداد را میفهمد و ماهیتاً دقیق است.
منطق کلاسیک یا ارسطویی، تنها دو حالت برای موقعیتهای مختلف قایل است: سیاه و سفید؛ آری و نه؛ روشن و تاریک؛ صفر و یک؛ درست و غلط، حال آنکه قایلان به تفکر فازی معتقدند ابهام در ماهیت علم است؛ یعنی همانطور که این ابهامها در ذهن بشر وجود داشته و بشر با درک و توجه به آنها در ذهن خود پدیدهها را تغییر و مدلسازی میکند، منطق فازی نیز سعی دارد مدلهایی ارائه دهد که ابهام را به عنوان بخشی از سیستم ارائه کند. قوانین علمی گذشته، مثل ریاضیات، فیزیک، و مکانیک نیوتونی، همه بر اساس همین منطق دو ارزشی استوار شدهاند، اما بدیهی است که ذهن ما کارهایش را با منطق دیگری انجام میدهد و تصمیمهایش را میگیرد. با کمک منطق فازی میتوان شیوه تفکر انسان را به فناوری منتقل کرد (فرخیان، 2006).
منطق فازی در سال 1965 توسط دانشمند ایرانی به نام لطفعلیعسگرزاده که جامعه بینالملل به نام پروفسور لطفی زاده از ایشان یاد میکند، ارائه شد. وی پس از پایهگذاری تئوری «مجموعه فازی»، در زمینه کاربردهای این تئوری در حافظه مصنوعی، زبان شناسی، منطق، نظریه تصمیمها، نظریه کنترل، سیستمهای خبره و شبکههای اعصاب، تحقیقات گستردهای نمود. در حال حاضر، تحقیقات پروفسور لطفی زاده در زمینه منطق فازی نرم رایانهای، محاسبات رایانهای بر مبنای کلمات، نظریه رایانهای ادراک و زبان طبیعی است.
وی در یک مقالة علمی کلاسیک که در سال 1965 به چاپ رسید، مفهوم «مجموعه فازی»، را که اساس نظریه تجزیه و تحلیل سیستمهای پیچیده است، معرفی نمود که در آن «زبان طبیعی» به جای متغیرهای عددی برای تشریح رفتار و عملکرد سیستمها به کار میرود. پس از معرفی مجموعه فازی، بیش از 15000 مقاله علمی توسط دانشمندان جهان درباره منطق فازی و کاربردهای گسترده آن در نشریههای علمی منتشر گردید و حدود 3000 درخواست ثبت اختراع در این زمینه در کشورهای مختلف جهان به عمل آمده است.
پس از آن لطفی زاده به پژوهشهای خود در زمینه مجموعه فازی ادامه داد تا آنکه در سال 1973، در یک مقاله کلاسیک دیگر با عنوان «شرحی بر دیدی نو در تجزیه و تحلیل سیستمهای پیچیده و فرایندهای تصمیمگیری» مفهوم استفاده از متغیرهای زبانی را در سیستمهای حافظه و کنترل مطرح کرد. این مقاله اساس فناوری کنترل بر مبنای منطق فازی است که در آینده اثرهای عمیق در طراحی سیستمهای کنترل هوشیار خواهد داشت.گرچه منطق فازی کاربردی بسیار وسیعتر از منطق متداول دارد، ولی پرفسور لطفیزاده معتقد است منطق فازی اکسیر و نوشدارو نیست. وی میگوید: «کارهای زیادی هست که انسان میتواند به آسانی انجام دهد، در حالی که رایانهها و سیستمهای منطقی قادر به انجام آنها نیستند. (پروفسور لطفیزاده، 2006)
شکل زیر به خوبی میتواند مفهوم فازی را نشان دهد:
در این شکل، سرد بودن، گرم بودن، و داغ بودن، توابعی برای مقایسه درجه حرارت هستند و هر نقطهای روی این خطوط میتواند دارای یکی از سه ارزش بالا باشد. به عنوان مثال، برای یک درجه حرارت خاص که در شکل با یک خط نشان داده شده است، میتوان گفت «مقداری سرد است»، «اندکی گرم است»، یا «اصلاً داغ نیست». که هر سه این مفاهیم، نادقیق هستند.
از جمله مفاهیمی که از دل منطق یا تفکر فازی بیرون آمده، نظریه مجموعههای فازی[2] است. با بسط این نظریه می توان توضیحات دقیقتری در خصوص منطق فازی ارائه کرد. مجموعهای از اعداد را در نظر میگیریم. مثلاً «مجموعه اعداد بزرگتر از 3 بر روی تاس». یعنی:
{6 ،5 ،4}A:
در این مجموعه عدد 4 هست، ولی عدد 3 نیست. حال «مجموعه اعداد بزرگ بر روی یک تاس» را در نظر میگیریم. عدد 4 در این مجموعه هست؟ در حقیقت، نمیتوان با قاطعیت وجود یا نبودِ وجود 4 را در این مجموعه پذیرفت. چنین مجموعهای یک مجموعه فازی است.
چنانکه قبلاً گفته شد، در منطق کلاسیک یا دو ارزشی، اشیا در یک مجموعه دو حالت می پذیرند: تعلق و عدم تعلق، یا به زبان ریاضی صفر و یک. اما در منطق فازی، درجه عضویت هر شیء میتواند عددی بین صفر و یک را بپذیرد. به عنوان مثال، اگر قد علی 185 سانتیمتر باشد و بخواهیم ببینیم علی بلند قد است یا نه، در منطق ارسطویی دو حالت داریم: یا علی «بلند است» یا «بلند نیست». اما در منطق فازی، قد علی ممکن است «تا حدودی بلند» باشد. در این منطق، به قد علی عددی بین صفر و یک نسبت می دهیم. مثلاً میگوییم او به اندازه 8/. متعلق به بلندقدهاست. اما اگر قد وی 200 سانتیمتر باشد، او را کاملاً بلند قد میدانیم و می گوییم: او به اندازه 1 متعلق به بلند قدهاست.
بر همین اساس، یک انسان در نور کافی قادر به درک میلیونها رنگ است، ولی یک روبات چگونه میتواند این تعداد رنگ را تشخیص دهد؟ حال اگر بخواهیم روباتی طراحی کنیم که بتواند رنگها را تشخیص دهد، از منطق فازی کمک میگیریم و با اختصاص اعدادی به هر رنگ، آن را برای روبات طراحیشده، تعریف میکنیم (هادی، 1384).
منطق فازی و مدیریت اطلاعات
چنانکه گفته شد، منطق فازی در زمینههای متنوع و متفاوتی کاربرد دارد و تقریباً حدود 10 سال پس از ابداع آن به متون کتابداری راه یافت. به گواهی بانک چکیدههای مقالههای کتابداری و اطلاعرسانی (LISA, 1969-2006) مفهوم فازی اولین بار با عبارت «تئوری مجموعههای فازی» و در مقالهای تحت عنوان «جستجوی یک فایل در شرایط فازی» در دنیای کتابداری و اطلاعرسانی مطرح شد. در این مقاله[3] که در سال 1975 و به زبان فرانسه منتشر شده بود، به کاربرد نظریه و مجموعههای فازی در بازیابی اطلاعات پرداخته شده بود.
به جز مقالهای که در سال 1976 در خصوص کاربردهای عملی مجموعههای فازی در حل مشکلات مربوط به سازماندهی اطلاعات با عنوان «مجموعههای پراکنده در نظریه ردهبندی» به زبان روسی منتشر شد[4]، چند سالی تقریباً تمامی پژوهشها و مقالههای انتشار یافته در خصوص منطق فازی در عرصه کتابداری و اطلاعرسانی، بر مباحث مترتب بر بازیابی اطلاعات متمرکز بود، به نحوی که از مجموع 32 مقالهای که در فاصله سالهای 1975 تا 1990 با موضوع فازی منتشر شده، 25 مورد آن به نقش و کاربردهای منطق فازی در ذخیره و بازیابی اطلاعات و راهبردهای جستجو و... اختصاص داشته است.
مجموعاً 266 رکورد که واژه فازی جزء توصیفگرهای آنها بود و در مقالههای انتشار یافته در فاصله سالهای 1969 تا نیمه سال 2006 میلادی منتشر و در LISA فهرست شدهاند، بازیابی شد. این 266 مورد شامل تمامی جنبههای کتابداری و اطلاعرسانی میشود که لزوماً در تعریف مدیریت اطلاعات لحاظ نشدهاند. مواردی مانند کتابسنجی، نظامهای هوشمند، هوش مصنوعی و...
در پژوهش حاضر، کاربردهای منطق و نظریههای مجموعههای فازی در مدیریت اطلاعات بررسی میشود، بنابراین ابتدا باید تعریفی از مدیریت اطلاعات ارائه گردد تا با در نظر گرفتن مؤلفههای موجود در این تعریف، به شکل دقیقتری کاربرد منطق فازی در این مقوله دنبال شود. در کتاب «فرهنگ توصیفی واژگان اطلاعرسانی و علوم وابسته» «مدیریت اطلاعات» چنین تعریف شده است:
اعمال مهارتمندانه کنترل بر فراهمآوری، سازماندهی، ذخیره، ایمنی، بازیابی و اشاعه منابع اطلاعاتی که برای انجام موفقیتآمیز عملیات در یک پیشه، نهاد، سازمان، یا مؤسسه ضروری است و مستندسازی، مدیریت رکوردها و زیرساختار فنی را در بر میگیرد (ریتز، 1383).
چنانکه از تعریف فوق مستفاد میشود، «فراهمآوری»، «سازماندهی»، «ذخیره و بازیابی»، «ایمنی»، «اشاعه منابع اطلاعاتی»، «مستندسازی»، «مدیریترکوردها» و «زیرساختار فنی» واژههایی هستند که بر عملیات مدیریت اطلاعات دلالت دارند.
در مرحله بعد، هر یک از واژگان فوق به صورت جداگانه با واژه Fuzzy ترکیب شده و در فیلد کلیدواژهها LISA جستجو شد که حاصل این جستجوها در جدول 1 آمده است:
جدول1. توزیع فراوانی رکوردهای موجود در LISA با کلیدواژه فازی به تفکیک موضوع
واژه ترکیب شده با فازی |
تعداد رکوردهای بازیابی شده |
فراهمآوری |
6 |
سازماندهی |
4 |
ردهبندی |
11 |
فهرستنویسی |
0 |
ذخیره |
37 |
بازیابی |
62 |
ایمنی |
2 |
اشاعه اطلاعات |
0 |
مستندسازی |
0 |
مدیریت رکوردها |
0 |
زیرساختارفنی |
0 |
جمع |
112 |
در توضیح دادههای جدول 1، بهتر است به نکات زیر توجه شود: در بانک LISA همواره واژه ذخیره (storage) با واژه بازیابی (retrieval) قرین بوده در هیچ رکوردی این واژه به تنهایی مشاهده نشد. بنابراین، 62 مورد اعلام شده در خصوص بازیابی، 37 مورد ذخیره را نیز پوشش میدهد.
واژههای «ردهبندی» و «فهرستنویسی» با وجود آنکه عیناً در تعریف ODLIS نیامده بودند، اما از آنجا که از مفاهیم نهفته[5] در سازماندهی[6] بودند، به طور مستقل در LISA جستجو شدند. نتایج به دست آمده هیچ گونه همپوشانی با نتایج حاصل از جستجوی سازماندهی نداشت. در خصوص «فراهمآوری»[7]، عبارت «مجموعهگستری»[8] نیز که یکی از مفاهیم نهفته در فراهمآوری بود، جداگانه جستجو شد که یک مورد از نتایج جستجوی آن در فهرست حاصل از جستجوی فراهمآوری نیز مشاهده شده بود، بنابراین در جمع بندی رکوردها محاسبه نشد.
همانطور که از اطلاعات جدول میتوان برداشت کرد، در برخی موارد مثل «ایمنی» و «مدیریت رکوردها» موارد اندکی بازیابی شده و برای دیگر کلیدواژهها یعنی «اشاعه اطلاعات»، «مستندسازی»، و «زیرساختار فنی» نیز، رکوردی بازیابی نگردید.
البته، خارج از چارچوب تعریف ODLIS، امروزه نظریه مجموعههای فازی بیشتر به سمت نظامهای هوشمند و هوش مصنوعی سوق یافته است، به نحوی که در فاصله سالهای 1991 تا 2006 ، 110 مقاله در خصوص این دو موضوع و منطق فازی، در بانک LISA چکیده و نمایه شده است. در این پژوهش، تعداد مقالههای بازیابی شده در هریک از مباحث فوق، به نشانة میزان گسترش و اهمیت منطق فازی در بحث مذکور تلقی شده است، بنابراین از آنجا که بیشترین رکورد بازیابی شده در حوزه بازیابی اطلاعات بوده است، این بحث را با کاربرد مجموعههای فازی در بازیابی اطلاعات آغاز میکنیم.
بازیابی اطلاعات
چنانکه رکوردهای به ثبت رسیده در LISA نیز نشان میدهد، کاربرد عمده مجموعههای فازی در کتابداری و اطلاعرسانی، در حوزه بازیابی اطلاعات است. اساساً مفهوم ربط به دلیل نامشخص و نسبی بودنش، یک مفهوم فازی است (Hood & Wilson, 2002). در جریان جستجو و یافتن اطلاعات به رکوردهایی میرسیم که نمیتوان به طور قطع آنها را مرتبط یا کاملا بیربط با موضوع مورد جستجو تلقی کرد. بنابراین دو مفهوم ربط و فازی را می توان قرین و همزاد یکدیگر دانست.
عمدهترین ابزار ریاضی در بازیابی اطلاعات به شکل سنتی، جبر بولی است. تقریباً هر کسی که با یکی از پایگاههای اطلاعاتی، فهرستهای رایانهای، یا شبکه جهانی وب کار کرده باشد، از عملگرهای بولی بویژه برای انجام جستجوهای پیچیده استفاده کرده است. جبر بولی بر مبنای نظریه مجموعههاست. هر اصطلاحی که در مجموعهای از مدارک قابل بازیابی برای جستجو یا نمایه به کار میرود، میتواند با عملگرهای بولی (و، یا، نه) ترکیب شود. این اصطلاحات با یک سلسله مدارک موجود در نظام اطلاعاتی تطبیق داده میشود.
مفهوم ربط به دلیل نامعیّن بودنش، میتواند به راحتی به وسیله مدلهای مجموعة فازی مدلسازی شود. بنابراین، نظامهای بازیابی فازی به این صورت عمل میکنند: وقتی مدارک به سیستم اضافه میشوند، یک سلسله اصطلاحات به مدرک اختصاص یافته و به هر اصطلاحی وزنی داده میشود که درجه وابستگی آن اصطلاح به مدرک را نشان میدهد. نمایهساز آزاد است تعیین کند یک اصطلاح فقط تا حدودی به یک مدرک مرتبط است بدون اینکه ناگزیر باشد در خصوص مرتبط بودن یا نبودن آن اصطلاح، تصمیم قطعی بگیرد. در یک نظام بازیابی اطلاعات فازی، بازیابی بیشتر بر مبنای منطق مجموعههای فازی است تا مجموعههای جبری بولی. در نظام فازی، همان عملگرهای بولی (و، یا، نه) مورد استفاده قرار میگیرند، اما متکی بر «اجتماعِ» فازی، «اشتراکِ» فازی، و «به جز» فازی.
این رویکرد به بازیابی اطلاعات جنبههای نظری بسیاری دارد، زیرا به عنوان مدلی که در فرایند انتخاب منابع مرتبط توسط کاربران به مراتب مفیدتر است، ظاهر میشود. این مدل همچنین به نوعی جرح و تعدیل در نظام سنتی مکانیزمهای بازیابی بولی است، در حالی که قسمت عمدهای از مکانیزمها و زیرساختهای موجود در بازیابی اطلاعات، همچنان مفید هستند. به علاوه، بازیابی اطلاعات فازی در تخصیص اصطلاحات نمایه با استفاده از اصطلاحات مرتبط به قدر اصطلاحات کاملاً مرتبط، انعطافپذیر است.
سیستمهای بازیابی اطلاعات فازی با وجود تمام محاسنی که دارند، چندان در مقیاس وسیع به کار گرفته نشدهاند. دلیل این امر نیز هزینههای بالای نمایه کردن با روش فازی است. با وجود این، تحقیقات در نظام بازیابی فازی همچنان ادامه دارد و روز به روز نیز وسعت بیشتری مییابد(Hood & Wilson, 2002) .
اکنون به به اختصار[9]، به ارائه توضیحاتی درخصوص چگونگی کاربرد منطق یا تئوری مجموعههای فازی در بازیابی اطلاعات میپردازیم:
چنانکه قبلاً گفته شد، به جای این فرض که یک عنصر عضوی از یک مجموعه است، از تابع عضویت برای شناسایی درجه عضویت عنصر در یک مجموعه استفاده میشود. مجموعههای فازی برای بازیابی اطلاعات مفیدند، زیرا این مجموعهها میتوانند «موضوع» مدرک را توصیف کنند. به علاوه، از آنجا که در منطق فازی «زبان طبیعی» به جای متغیرهای عددی برای تشریح رفتار و عملکرد سیستم به کار میرود، میتوان برای بازیابی اطلاعات در بانکهای اطلاعاتی، به نحو مؤثری از آن بهره جست.
مجموعهای از عناصر که در آن هر عنصری محدوده مدرک را توصیف کند، ذاتاً مجموعهای فازی است. مدرکی که درباره «کتابهای کودکان و نوجوانان» است، ممکن است راجع به «روانشناسی کودک و نوجوان» نیز گفتگو کند. از این رو، ممکن است موضوع این مدرک تا حدودی درباره «روانشناسی کودک و نوجوان» باشد. قرار دادن روانشناسی کودک و نوجوان به عنوان عنصری از مجموعه، صحیح نیست، اما نادیده گرفتن آن نیز ما را از دقت لازم دور میکند.
یک مجموعه فازی دارای عضویتی است که در آن قوّت عضویت هر عنصر به شکل ذاتی دقیق نیست. در مثال بالا مجموعهای از مفاهیم که مدرک را توصیف میکند، به قرار زیر است:
C= {(children's books, 1.0),(children's psychology, 0.5)}
مجموعه C یک مجموعه فازی است، زیرا این مجموعه دارای درجات عضویت مربوط به هر عضو است. به طور قراردادی، یک مجموعه فازی که شامل مفاهیم موجود در C={c1,c2,….cn}باشد، به صورت زیر نمایش داده میشود:
در اینجا ،تابع عضویتی است که درجه عضویت عنصری را در مجموعه نشان میدهد (گراسمن و فریدر، 1384، ص 112-113).
از نظریة مجموعههای فازی به شکلهای گوناگون در بازیابی اطلاعات استفاده میشود. یکی از رایجترین این شکلها که در متون زیادی به آن پرداخت شده، بازیابی بولی مجموعههای فازی است.
بسط مجموعه فازی به منظور بازیابی بولی، در اواخر دهه 70 میلادی انجام گرفت (گراسمن و فریدر، 1384، ص113). ضریب تشابه بولی میتواند به وسیلة بررسی اصطلاحات موجود در مدرک به صورت فازی محاسبه گردد، زیرا عضویت اصطلاحات بر اساس تعداد رویداد آنها در مدرک صورت میپذیرد.
برای مثال، مجموعهD را که شامل همه مدارک مجموعه است، در نظر بگیرید. مجموعه فازیDt می تواند به صورت مجموعه D که تمام مدارک دارای اصطلاح t را توصیف می کند، محاسبه شود. این مجموعه به صورت:
نمایش داده می شود. دراینجا d1 شامل عنصرt با قوّت 0.8 و d2 شامل عنصرt با قوّت 0.5 است.
همینطور، مجموعه Ds به صورت مجموعهای از تمام مدارک که شامل اصطلاح S است، تعریف میشود. این مجموعه می تواند به صورت:
تعریف شود.
عملیات اصلی اشتراک، اجتماع، و متمم که اساس منطق بولی را تشکیل میدهد، در مجموعههای فازی به این صورت بیان شده است: اشتراک از حداقل دو تابع عضویت و اجتماع از حداکثر دو تابع عضویت که برای یک عنصر تعریف شده است، استفاده میکند. از تعاریف زیر برای به دست آوردن این مفاهیم استفاده میشود:
محاسبه به محاسبه و محاسبه به محاسبه نیاز دارد. این محاسبات می تواند با استفاده از مقدار حداکثر برای اجتماع، و مقدار حداقل برای اشتراک انجام شود. از این رو داریم :
درخصوص این روش، نکتهای که حتماً باید در نظر گرفته شود این است که این مدل، حاوی وزن اصطلاحات پرس و جو نیست (گراسمن ...، ص114).
روش دیگری که با استفاده از منطق فازی در بازیابی اطلاعات به کار گرفته میشود، روش استفاده از سلسله مراتب مفهومی و مجموعههای فازی است. این روش که برای اولین بار در سال 1991 معرفی شد، از شبکه مفهومی برای نشان دادن مفاهیم موجود در مدارک و پرس و جوها و نشان دادن ارتباط این مفاهیم، استفاده میکند (گراسمن ...، ص114). بعدها محققان ایرانی توانستند با بسط این روش، شیوهای مؤثر برای بازیابی اطلاعات در زبان فارسی ابداع کنند.به منظور برطرف کردن نقایص موجود در روشهای کلاسیک بازیابی و عملگرهای اولیه، یک درجه «کمیّت نمای فازی»[10] برای هر عبارت در یک پرس و جو محاسبه میشود. مثال زیر این روش را روشنتر میکند. فرض کنید یک کاربر علاقهمند است مدارکی به شرح زیر دریافت کند:
حداقل سه مورد از چهار اصطلاحی که در اختیار اوست، همراه با یک اصطلاح پنجم که حتماً باید در نتیجه جستجو باشد. چنین درخواستی بدین صورت نوشته میشود:
At least 3 (t1, t2, t3, t4) and t5
برای محاسبه درخواست فوق، جدول زیر را ملاحظه کنید:
At least 3 of the α cut |
The α cut set |
The α value |
0 |
Ø |
0.3 |
0 |
{t4} |
0.25 |
0 |
{t4, t3} |
0.15 |
1×0.1=0.1 |
{t4, t3, t2} |
0.1 |
0 |
{t4, t3, t2, t1} |
0 |
حال فرض کنید سند d با درجه عضویتی به شرح زیر انتخاب میشود:
نخست، برای محاسبه بخش اول عبارت یعنی حداقل سه مورد از (t1, t2, t3, t4) مجموعة فازی را که حاصل انطباق با سند d است، حساب میکنیم. (محاسبات این قسمت نظیر فرمولهایی است که در ابتدای همین فصل گفته شده است) این محاسبات به محاسبه کمّی «نماهای نیمه فازی»[11] منجر خواهد شد که به صورت زیر نمایش داده میشود:
بنابراین، تمامی مقادیر کمّی نماهای فازی فوق، میتواند به صورت زیر محاسبه شود:
at least 3 (t1, t2, t3, t4) = 0 × 0.3 + 0 × 0.25 + 0 × 0.15 + 1 × 0.1 + 1 × 0 = 0.1
اکنون عضویت سند d نسبت به کل عبارت جبری، به قرار زیر خواهد بود:
0.1 and 0.4 = min (o.1, 0.4) = 0.1
شایان ذکر است، این روش به صورت عملی در یک مجموعه 65000 رکوردی از مقالههای روزنامه همشهری آزمایش شد. نتایج حاصل از این بررسی نشان داد روش یاد شده در زبان فارسی بهتر از زبان انگلیسی نتیجه داده و ضمناً نتایج آن در قیاس با روشهای حاصل از مدل «فضای برداری»[12] رضایتبخشتر بوده است (Nayyeri & Oroumchian, 2006, p.5).
سازماندهی اطلاعات
چنانکه دادههای جدول 1 نیز نشان داد، استفاده از نظریههای فازی در ردهبندی اطلاعات، به میزان بازیابی اطلاعات متداول نبوده است، تا سال 1995به جز مقالهای که در سال 1976 در خصوص ردهبندی منتشر شد[13]، هیچ مقالهای در خصوص ردهبندی یا سازماندهی و منطق فازی در LISA به ثبت نرسیده است. در فاصله سالهای 1995 تا 2006 نیز آثار منتشر شده با این موضوع، عمدتاً در حوزه اطلاعات پزشکی بوده است. به استناد مقالههای ثبت شده در بانک اطلاعاتی LISA، در سالهای اخیر تمایل به استفاده از ردهبندی فازی در ساخت پایگاههای اطلاعاتی و نیز نظامهای خبره، افزایش یافته است.
برای مثال، در ایجاد پایگاههای اطلاعاتی با استفاده از سرورهای SQL، ردهبندی فازی و استفاده از پرس و جوهای متداول، شرایطی را ایجاد کرده است که دادهها به نحو سادهای درست مانند ردهبندیهای متداول غیرفازی، از پایگاههای اطلاعاتی استخراج میشوند. چارچوبهای پیشرفتهای نیز به عنوان ابزار دادهآمایی در نظامهای گسترده اطلاعات استفاده شده و با پایگاههای اطلاعاتی مرتبط که معمولاً مورد استفاده قرار میگیرند، یکی میشوند. با استفاده از راهکارهای ارائهشده از طریق این روش، تحلیل دادهها به نحو انعطاف پذیرتری انجام میشود و اطلاعات نیز در مرحله شکلگیری گزارش به شکل بهتری ارائه میگردد (Veryha, 2005, p. 360).
قواعد ردهبندی فازی در پارهای موارد به صورت خودکار تعیین میشوند. شیوههای «نورو فازی»[14] یا فازی نوین، گزینش «الگوریتم تکوینی»[15] و «خوشهبندی فازی»[16] در ترکیب یا بهینهسازی الگوریتم تکوینی، از جمله فنونی است که برای ارائه این قواعد به کار گرفته میشود. مدلهای مختلف فازی، برای ردهبندی مراحل زیر را دنبال میکنند:
1. ساختار مدل
2. دادههای به دست آمده از ارزشدهی اولیه
3. تضمین صحت و شفافیت
4. استخراج قواعد مشابه سازی بر اساس سادهسازی
5. انتخاب ویژگیها بر اساس تفکیکسازی درونردهای
6. بهینهسازی چند مادهای تکوینی.
شیوه ارزشدهی به مدل بر اساس کوواریانس حاصل از یک دستهبندی فازی مقدماتی به کار گرفته میشود. با بهکارگیری موفقیتآمیز گزینش ملاکها، آسانسازی حاصل از بهکارگیری قواعد و تنظیم آنها بر مبنای الگوریتم تکوینی، کار کارشناسان ردهبندی در زمانی کوتاهتر، به شکل دقیقتری انجام خواهد گرفت. (Roubos & Setnes & Abonyi, 2001)
فراهمآوری اطلاعات
طبق اطلاعات ثبت شده در بانک اطلاعاتی LISA، واژه فازی برای اولین بار در سال 2003 به ادبیات فراهمآوری در کتابداری و اطلاعرسانی راه یافت. اما با نگاه دقیقتری به مقالههای این مجموعه، مشخص شد هیچ یک از این مقالهها به طور دقیق به کاربرد مجموعههای فازی در مجموعهسازی نپرداختهاند. آنچه این شش مقاله در نظر داشتهاند، نوعی تعامل میان «مجموعههای سخت»[17] و «مجموعههای نامعین»[18] در فراهمآوری دانش و بهرهگیری از رویکرد نظریه احتمالات در شکلگیری مجموعههای سخت بوده است.
پیش از این تاریخ، «بنسمن»[19] در مقالهای که سال 2001 منتشر شد، به «قانون بردفورد» و «مجموعههای نامعیّن» توجه کرده بود. هرچند در کلیدواژههای این مقاله از واژه «فراهمآوری»، یا «مجموعهگستری» استفاده نشدهاست، اما از آنجا که قانون بردفورد مستقیماً با مجموعهسازی مرتبط است، میتوانیم این مقاله را در زمرة مقالههای مربوط به فراهمآوری و فازی قلمداد کنیم. «بنسمن» که معتقد بود قانون بردفورد از منطق کلاسیک پیروی میکند، با تشریح نظریه مجموعههای فازی، به مسائلی که پیرامون این دو تفکر در مجموعهسازی مطرح میشود، پرداخته است. بردفورد در گزارشی که برای قانون پراکندگی ارائه کرده بود، برای به دست آوردن تابع عضویت متناسب با این قانون، از نمودهای عینی استفاده کرد. این نمودها در شیوه به کار رفته برای تعیین ردههای a, b, c که در جدولهایی بسط داده شدهاند، آشکارا موجودند. با بررسی این روند، میتوان به شیوه وی پی برد. از تقسیم کل ارجاعات هر مجله به تعداد سالهای دربرگیرندة نمونه (برای مثال چهار سال برای ژئوفیزیک کاربردی) و به منظور تعیین کل ارجاعات در هر سال.
به این ترتیب ردههای معیّن شده، به صورت زیر قابل تبییناند:
a) مجلههایی که سالانه بیش از 4 ارجاع دارند.
b) مجلههایی که سالانه حداقل 4 و حداکثر بیش از 1 ارجاع دارند.
c) مجلههایی که سالانه 1 ارجاع یا کمتر دارند.
پیادهسازی این روش، به خارج قسمتهایی با حداکثر دو مرتبه اعشاری میانجامد که عامل ایجاد ردههایی با مرزبندیهای زیر است: بین a و b در 01/4؛ بین b و c 01/1؛ و بین c و رده صفر _ که بنسمن خود آن را اضافه کرده و d نامیده است- در 01/0 . اگر رده a را که شامل 8/2% مجلهها و 3/32% ارجاعات در موضوع ژئوفیزیک کاربردی است، در نظر بگیریم و آن را «هسته نشریههای ادواری و بسیار مختص و مرتبط با موضوع» بدانیم، برای مجموعههای بردفورد، تابع عضویت غیرقابل تخصیص است.
اگر تعداد ارجاعات سالانه به یک مجله از 4 بزرگتر باشد، نمره/درجه عضویت آن مجله برابر یک است. ولی اگر تعداد ارجاعات سالانه به یک مجله، برابر 4 یا کمتر از آن باشد، درجه عضویت آن مجله برابر با تعداد ارجاعات به آن در سال، تقسیم بر 01/4 است. عدد 01/4 با نشان دادن پایینترین حد هسته به عنوان خارج قسمت در بخش دوم تابع عضویت، انتخاب شده است. بهکارگرفتن چنین تابع عضویتی برای دادههای بردفورد، در یک جدول مجزا تنظیم میشود. در این جدول، ردههای بردفورد همراه با رده اضافه شده صفر (d) بر اساس اصول مجموعههای نامعیّن که به ترتیب، تنزل عضویت مجموعه را مینمایاند، نامگذاری و نشان داده شدهاند. A=a؛ A=b و نه A؛ c = نه A و A؛ و بالاخره d = نه A. بررسی این جدول نشان میدهد در پایین مجلههای هسته یا همان رده A، نمره عضویت مجلهها بلافاصله کم میشود، به نحوی که در واقع صرفاً به صورت حاشیه – و نه هسته- مجموعه یک رشته خاص به شمار میآیند. تعداد مجلههای موجود در رده صفر (d) تعداد مشخصنشده است و این همان سؤال پیچیدهای است که بردفورد هم نتوانست با موفقیت به آن پاسخ گوید (بنسمن، 1383، ص139-140).
تضمین امنیت منابع
از جمله موارد دیگری که منطق فازی در آن مؤثر بوده، امنیت منابع الکترونیکی بویژه در حوزه شبکههاست. در دنیای امروز گسترش وابستگی جوامع پیشرفته به ارتباطات دوربرد و شبکههای اطلاعاتی و سامانههای مختلف الکترونیکی، امری اجتنابناپذیر است. البته، این سامانهها و شبکهها هر لحظه در معرض آسیب بوده و به لحاظ امنیتی مورد تهدید هستند (Abouzakhar & Manson, 2003, p. 33)
تأمین امنیت شبکهها به کمک منطق فازی، برای اولین بار در سال 2003 مطرح شد. پیش از آن، تنها در یک مقاله در سال 1997 از بهکارگیری منطق فازی برای تأمین امنیت نظامهای رایانهای سخن رفته بود، و آن مورد نیز در خصوص شناسایی قرنیه چشم افراد به عنوان رمزینه ورود آنها به سیستم با کمک عوامل فازی بوده است.[20] این مسئله که اطلاعات شبکهها باید به صورت یکپارچه در دسترس کاربران قرار گیرد، صحیح است اما موردی که فراتر از دسترسی است و باید به آن توجه شود، تعریف سطوح دسترسپذیری و پرکردن حفرههای امنیتی موجود در شبکه است تا در صورت حمله به سامانههای اطلاعاتی و الکترونیکی، موجودیت اطلاعات صدمهای نبیند. برای کشف حملههای شبکهای و دفع آنها، طرح استفاده از عوامل هوشمند نوروفازی پیشنهاد شده است که از طریق آن میتوان ترافیک شبکهها را بررسی نمود. عوامل نوروفازی به ترکیب ویژگیهای منطق فازی و شبکههای عصبی میپردازند و از این طریق میتوان بر محدودیتهای تخصص انسان در تأمین امنیت شبکههای اطلاعاتی غلبه نمود.
به طور کلی، نوروفازی اجازه استفاده از اطلاعات در منابع چندگانه را فراهم میسازد. با بررسی میزان ترافیک ورود به شبکهها و تحلیل استفاده از آنها، میتوان برای تأمین امنیت شبکهها با کمک نوروفازی اقدام نمود. نوروفازی، پارامترهای سیستم فازی را با استفاده از دادههای به دست آمده از شبکههای جدید شناسایی میکند. تعیین پارامترهای سیستم فازی همچون عملکردهای عضویت، اهمیت اساسی داشته و شماری از رویکردهای آماری در آنها ارائه میگردند. عوامل هوشمند نوروفازی برای کشف ترافیک مشکوک در بسترهای TCP/IP پیشنهاد میشوند؛ زیرا قابلیتهای فراوانی برای استفاده از سیستمهای نوروفازی در تحلیل ترافیک شبکهها و تضمین امنیت آنها وجود دارد. دانش تخصصی انسان برای توصیف کارکردهای عضویت فازی در شبکهها محدود است، بخصوص اینکه مقدار گسترده دروندادها و بروندادهای شبکهای در ارتباطات دوربرد، تحقق این امر را دشوارتر میسازد. بنابراین، استفاده از مدلهای فازی، بویژه نوروفازی، این امر را تسهیل میکند. (Abouzakhar & Manson, 2003, p. 38)
کاربران اطلاعات
همان طور که دادههای جدول 1 نیز نشان میدهد، جستجوی مستقیم در خصوص اشاعة اطلاعات و فازی در LISA نتیجهای در بر نداشت. اما اگر مطالعات کاربران را به عنوان مصرفکنندگان نهایی اطلاعات، یکی از حوزههای مرتبط با اشاعه اطلاعات فرض کنیم، مطالعة رفتارهای اطلاعیابی آنان میتواند به عنوان یکی از شاخههای اشاعة اطلاعات و مفاهیم درگیر با این حوزه، تلقی شود. البته، مطالعه رفتارهای اطلاعیابی کاربران را به نوعی میتوان با تمامی حوزههای مدیریت اطلاعات مرتبط دانست، زیرا تمامی فرایندهای در حال انجام در این زمینه را متأثر خواهد کرد و با استفاده از این نتایج میتوان در خصوص فراهمآوری و شیوههای ذخیره و بازیابی، تصمیمهای جدیدی اتخاذ نمود.
«بوید»[21] در سال 2004 طی مقالهای که چکیده آن نیز در LISA به ثبت رسیده است، فرایند اطلاعیابی را به دلیل ماهیت نامشخصی که دارد، یک مفهوم فازی دانست (Boyd, 2004, p. 82).
در حقیقت، شیوههای اطلاعیابی به دلیل تنوع و گستردگی اطلاعات، همچنین به دلیل وجود تفاوتهای فردی و شیوههای گوناگونی که افراد بسته به نیازها و موقعیت خود برای جستجو و دریافت اطلاعات انتخاب میکنند، نامعیّن یا فازی است. سیستمهای کنترل فازی میتوانند به پژوهشگرانی که در حوزه مطالعات کاربران تحقیق میکنند، شیوههایی ارائه کنند که به وسیله آنها به بررسی نامعیّن بودن رفتارهای اطلاعیابی بپردازند.
در یک تحقیق بر روی کاربران وبسایتها، سؤالی دربارة میزان اهمیت وب سایت در قالب طیف لیکرت از آنها پرسیده شد. این مقیاس از 1 به معنای بیاهمیت شروع میشد و تا 10 به معنای بسیار مهم گسترش مییافت. با استفاده از سیستم کنترل فازی، پژوهشگران توانستند به گروهبندی پاسخها بپردازند و آنها را تحلیل نمایند.
به علاوه، چنانکه میدانیم با توجه به تنوع محملهای اطلاعاتی در دنیای الکترونیکی امروز، و راههای گوناگونی که برای انتقال اطلاعات وجود دارد، کاربران بسته به نیاز خود، از راهها و محملهای گوناگونی برای دریافت اطلاعات استفاده میکنند که میتوان آنها را شبکههای مختلف ارتباطی نامید. سیستمهای کنترل فازی در دستهبندی شبکههای مختلف نقش بسزایی ایفا میکنند و از طریق آنها میتوان بهراحتی رفتارهای اطلاعیابی کاربران را ـ که چندان نیز قابل پیشبینی نیستند ـ بررسی و تحلیل نمود (Boyd, 2004, p. 86).
نتیجهگیری
نظریة مجموعههای فازی، نقش بسزایی در مدیریت اطلاعات دارد و اگرچه بیش از 40 سال از ارائه این نظریه میگذرد، نه تنها وجوه استفاده از آن کمرنگ نشده، بلکه بتدریج به کاربردهای آن در حوزههای مختلف مدیریت اطلاعات افزوده میشود. در جهانی که همه چیز به سوی نسبیت پیش میرود و از قطعیت فاصله میگیرد، تمرکز بر منطق فازی که زیربنای آن را عدم قطعیت تشکیل میدهد، تقریباً اجتنابناپذیر است.
بویژه با وجود ابزارها و محملهای جدید اطلاعاتی مانند اینترنت، روز به روز با عدم قطعیت و ابهام بیشتری مواجه میشویم. در حقیقت، با فراگیر شدن رسانههای اطلاعاتی، با مخاطبان عامی مواجهیم که کنترل آنها به راحتی ممکن نیست و وجود و ماهیت آنها برای سرویسدهندگان در هالهای از ابهام قرار دارد. هرچند این کاربران ممکن است خواستههای مشخص و دقیقی داشته باشند، اما از آنجا که دانش آنها در سطوح متفاوت قرار دارد و به هیچ وجه قابل اندازهگیری نیست، ذخیره، سازماندهی و شیوههای بازیابی اطلاعات باید به گونهای باشد که بتواند با درنظر گرفتن ابهامی که در سیستم وجود دارد و با کمک زبان طبیعی، پاسخگوی این خواستهها باشد. زبان طبیعی از آنجا که به ساختار ذهنی انسان نزدیکتر بوده و توسط همه کاربران با هر سطح از توانایی و دانش قابل استفاده است، بویژه در شرایطی که خدمات کتابخانه غیرحضوری است و امکان آموزش به استفادهکنندگان نیز وجود ندارد، در ایجاد پایگاههای اطلاعاتی و طراحی موتورهای جستجو و ذخیره و بازیابی اطلاعات، بسیار مورد توجه قرار گرفته است و منطق فازی به تحقق چنین نظامی بسیار کمک میکند. به نظر میرسد در حوزه فراهمآوری و ردهبندی، منطق فازی نوپا بوده و عرصه برای پژوهشهای بیشتر، خالی مانده است. اگرچه این دو حوزه به لحاظ ماهیت کار و با توجه به پژوهشهای انجام شده، تا حدودی از منطق فازی دور هستند، اما به دلیل انعطاف زیادی که در نظریه مجموعههای فازی وجود دارد، این علم به باز شدن گرههای موجود در این دو حوزه نیز کمک خواهد کرد.
مجموعههای کتابخانهها که امروزه کم کم از حالت سخت خارج شده و به سمت دنیای مجازی حرکت میکنند، بیشک بر بنیادهای فازی بهتر بنا شده و خدماترسانی آنها نیز رضایت بخشتر خواهد بود. بویژه در پاسخگویی به نیازهای کاربران، از آنجا که این نیازها ماهیتاً فازی بوده و از فردی به فرد دیگر ممکن است تغییر یابند، استفاده از منطق فازی، برای سامانههای اطلاعاتی این امکان را فراهم میسازد که با در نظر داشتن نقاط ابهام در درخواستهای کاربران، دقیقترین اطلاعات موجود در پایگاه را در اختیار آنان قرار دهند. با توجه به نقش ارزندهای که منطق فازی میتواند در مدیریت اطلاعات داشته باشد، لزوم توجه به این علم در کتابداری و اطلاعرسانی، ضروریتر به نظر میرسد. اما همانطور که مطالب مندرج در این پژوهش نیز نشان میدهد، تسلط به نظریههای فازی و محاسبات آن اندکی دشوار بوده و به درک مفاهیم پیچیده ریاضی نیاز دارد. به همین دلیل، لازم است پژوهشگران این عرصه با مفاهیم و محاسبات ریاضی کاملاً آشنایی داشته و با درک صحیحی از این مقوله، به حل مسائل موجود در رشته با کمک منطق فازی مبادرت ورزند.
1. Negoirat, constantin. v; Stefanescut, Alexandru. “Searching a File under Fuzzy Conditions”. Studii-Si-Cercetari-de-documentare. 17(3-4) july-sep/oct-nov 75, 243-246.
2. Rebrova, M.P. “Diffuse Sets in Classification Theory”. Nauchno Teknicheskaya Informatsiya. Series 2 (10) 1976, 15-21.
1. برای یافتن مفاهیم مشابه با آنچه در این تعریف آمده بود، از سیاهه زیر استفاده شد:
List of Basic Library and Information Science Topics. Available at: http://en.wikipedia.org/wiki/List_of _basic_library_and_information_science_topics
2. از آنجا که واژه سازماندهی در انگلیسی با دو املای organisation و organization نوشته میشود، با هر دو املا جستجو شد که نتایج حاصل برای organisation صفر بود.
1. به منظور جلوگیری از سردرگمی خوانندگان محترم، از ارائه توضیحات بیشتر که به محاسبات پیچیده ریاضی منجر میشد، پرهیز گردید. علاقهمندان به مطالعه بیشتر درخصوص مباحث این فصل، میتوانند به این منبع مراجعه کنند: دیوید ا. گراسمن؛ افی فریدر، بازیابی اطلاعات الگوریتمها و روشهای اکتشافی، ترجمه جعفر مهراد و سارا کلینی، مشهد: کتابخانه رایانهای، 1384.