نوع مقاله : مقاله پژوهشی
نویسنده
عضو هیئت علمی گروه پژوهشی زبانشناسی رایانهای کتابخانه منطقهای علوم و تکنولوژی
چکیده
کلیدواژهها
1. مقدمه
زبانی که در زندگی روزانه برای ایجاد ارتباط با دیگران به کار میبریم، پیچیدگیهای فراوانی دارد. آنچه ابهامهای موجود را بین سخنگویان بومی مرتفع میسازد، توانش زبانی آنها، اطلاعات آنها در خصوص جهان پیرامون، طرح پرسش مجدد در صورت وجود یا احساس ابهام و به طور کلی مجموعهای از اطلاعات زبانی و غیر زبانی است که سخنگویان بومی به آن مجهزند. مسلماً در مکالمات بین سخنگویان بومی و افرادی که آن زبان را به عنوان زبان دوم یا خارجی یاد میگیرند، موارد ابهامزای بیشتری به وجود میآید. این نکته نشان میدهد استفاده درست از زبان به اطلاعات متنوعی نیاز دارد که متأسفانه تاکنون نتوانستهایم دست کم برخی از آنها (مانند اطلاعات مربوط به جهان پیرامون، قدرت حل مسئله، توانایی پرسش مجدد، استفاده از اطلاعات متنی، بافتی و ...) را به ماشین ترجمه بدهیم. این امر خود سبب کاهش عملکرد سیستمهای ترجمه میشود. امروزه برای بسیاری از زبانها هنوز ماشین ترجمهای ساخته نشده است. حتی برای زبان فارسی نیز چند سیستم یکسویه وجود دارد که از انگلیسی به فارسی ترجمه میکنند و قادر به حرکت در مسیر عکس (از فارسی به انگلیسی) نیستند. مسلماً نمیتوان انتظار داشت سیستمهای مناسب در زمانی کوتاه پدید آیند. با این همه، برای دستیابی به سیستمهای ترجمه مناسب نخست باید تحقیقهای زبان شناختی جامعی در حطیههای آواشناسی، معناشناسی، نحو، منظورشناسی و ... به انجام برسد و در هر حطیه اجزای مربوط بررسی و به گونهای طرح شود که بتوان از آنها در محیطی رایانهای استفاده کرد.
ابهام از جمله مختصات زبانی است که مشکلات فراوانی را در سیستمهای ترجمه ایجاد میکند و سبب نامفهوم شدن یا نامرتبط شدن آن میشود. رفع ابهام، به مطالعه در حیطههای معناشناسی، واژهسازی و نحو نیازمند است. امروزه متأسفانه بین زبانشناسی نظری و تحقیقات عملی انجام شده در حیطه ماشین ترجمه شکاف بزرگی وجود دارد. تحقیقات عملی دست کم در ایران اغلب خود را از مباحث مربوط به ماشین ترجمه دور نگه داشتهاند و تحقیقات نظری نیز نتوانستهاند مدلی جامع که به تمامی ابعاد زبان پرداخته باشد، ارائه نمایند.
از سوی دیگر، متأسفانه بسیاری از این نظریهها بر اساس امکانات و ویژگیهای زبان انگلیسی تهیه شدهاند که علت آن نیز این بوده که زبان مادری زبانشناسی نظری اغلب انگلیسی بوده است. این نکات ضرورت توجه جدیتر محققان ایرانی را به مباحث نظری و کاربردی زبانشناسی نشان میدهد. آنچه به کار ماشین ترجمه و سیستمهای رایانهای میآید، زبانشناسی محض نیست؛ بلکه زبانشناسی رایانهای است که متأسفانه هنوز در نظام آموزش عالی کشور جایگاهی ندارد.
2ـ تاریخچه تحقیق
در این قسمت، نخست به برخی از مهمترین آثاری که توسط محققان ایرانی و خارجی در خصوص ابهام و موارد مرتبط با آن نوشته شده اشاره خواهد شد. سپس آثاری ارائه میگردد که ابهام را در ارتباط با ماشین ترجمه بررسی کرده و بویژه برای ابهام زدایی در سیستمهای ترجمه تدبیری اندیشیدهاند.
تحقیق در خصوص ابهام، سابقهای طولانی دارد. امپسون (1930) در کتاب جامع خود هفت نوع ابهام را مورد بررسی قرار داد. لاینز (1977) نیز در کتاب معروف خود که با عنوان «معناشناسی» و در دو جلد به چاپ رسید، بحث مفصلی در خصوص ابهام و گونههای آن ارائه داد. کتاب معناشناسی سعید (1997) نیز کتابی مناسب برای مطالعه ابهام میباشد.
محققان ایرانی نیز در این خصوص آثار خوبی تولید کردهاند که از آن جمله میتوان به کتاب ارزشمند دکتر کوروش صفوی (1380) با عنوان درآمدی بر معناشناسی، کتاب نگاهی تازه به دستور زبان دکتر محمدرضا باطنی (1371) و نیز پایاننامههای کارشناسی ارشد داوری اردکانی (1375)، معدنی (1376)، صحت (1377) و قنبری (1377) اشاره کرد.
پایاننامه علوی (1379) و مقالههای کس و هوپ (1985)، دانگ و سایرین (2002)، مگنینی و سایرین (2002) و میهالسی (2002) نمونههایی از مجموعه آثاری است که توسط محققان ایرانی و خارجی در خصوص ابهام نوشته شده و در آنها بخصوص روی روشهای مختلف ابهامزدایی به صورت عام و ابهامزدایی از مفهوم واژه صحبت شده است. تروزول (1996)، اسپیوی و سایرین (1993) و مک دونالد و سایرین (1994) نیز بر روی ابهام نحوی مطالعه کردند و راهحلهایی رایانهای را برای ابهامزدایی ارائه دادند که بتواند به عنوان مبنایی برای بهبود عملکرد سیستمهای ترجمه مورد استفاده قرار گیرد. متأسفانه در میان آثار پژوهشگران ایرانی، ابهام اغلب از منظری صرفاً زبانشناختی مورد مطالعه قرار گرفته و در خصوص رفع مشکلات مربوط به آن در ماشین ترجمه و یا ارتباط آن با ماشین ترجمه، کاری صورت نپذیرفته است. مقاله حاضر، بابی است در این خصوص.
3ـ انواع ابهام
3ـ1. ابهام واژگانی
این نوع ابهام به طور کلی به پنج دسته تقسیم میشود که عبارت است از: ابهام مقولهای، واژههای همآوا ـ همنویسه، چند معنایی و ابهام انتقالی.
ابهام مقولهای وقتی اتفاق میافتد که یک واژه در بافتهای مختلف نقشهای نحوی مختلفی چون اسمی، فعلی، صفتی، قیدی و ... را داشته باشد. این نوع ابهام در انگلیسی و فارسی از فراوانی بسیاری برخوردار است و بنابراین برای دستیابی به یک سیستم کارآمد باید به شکلی خاص مورد توجه قرار گیرد. به عنوان مثال، واژه light در انگلیسی میتواند اسم، فعل و حتی یک صفت باشد؛ واژه Import نیز میتواند نقشهای اسمی و فعلی داشته باشد و ... در فارسی واژه بردار میتواند اسم (بُردار) و یا فعل امر (بَردار) باشد. یکی از تفاوتهای عمدهای که بین این دو زبان وجود دارد، ظهور مصوت کوتاه در واژگان انگلیسی و عدم ظهور اینگونه مصوتها در واژگان فارسی است. اینگونه ابهامها در بسیاری از موارد از سوی سخنگویان بومی از طریق مراجعه به اطلاعات بافتی قابل رفع است، ولی برای اینکه ماشین ترجمه بتواند این نوع مشکلات را مرتفع سازد باید اطلاعات مربوط در بخش ساختواژی و نحو ماشین ترجمه وارد شود (بخش ساختواژی اطلاعات مربوط به واژهها، ریشهیابی، وندها و ... و بخش نحوی اطلاعات مربوط به ساختار نحوی جمله را در خود داراست.
وقتی در جمله تنها یک واژه مبهم وجود داشته باشد رفع ابهام آسانتر است، ولی گاه ممکن است بیش از یک کلمه مبهم در جمله وجود داشته باشد که درک جمله را دشوارتر میسازد. در چنین مواردی، مراجعه به اطلاعات نحوی و بافتی برای رفع ابهام ضروری است، مانند:
(1).آن مرد سرخورد و مرد.
در این مثال «مرد» اول به «انسان بالغ مذکر» و «مرد» پایانی به «فعل گذشته از مصدر مُردن» برمیگردد. ضمناً واژه «سرخورد» نیز دارای چهار نوع ابهام به شرح زیر است:
سَر (با فتحه) قسمتی از بدن که بالای گردن قرار میگیرد.
سُر (با ضمه) لیز خوردن و از دست دادن تعادل بدن.
خُورد جویدن و قورت دادن غذا (مربوط به سَر)
خُورد جزئی از فعل (سُر خورد) به معنی لیز خوردن.
مشاهده میشود که در جمله (1) در مجموع 6 مورد ابهام وجود دارد که سخنگویان بومی با استفاده از اطلاعات نحوی و نیز بافتی، جمله را ابهامزدایی میکنند. البته، این نکته بدان معنا نیست که سخنگویان بومی همواره میتوانند جمله را درست ابهامزدایی کنند. به عنوان مثال، برای جمله (1) میتوان تعبیر (2) را در نظر گرفت. (هرچند تعبیر (2)، نمونهای بعید و تا حد زیادی دور از انتظار است، نمیتوان آن را به کل ناممکن خواند):
(2). آن مَرد سَر خورد و مرد. (علت مرگ، خوردن سر فردی بوده است)
نکته دیگر در خصوص ابهام مقولهای آن است که تجزیهگر ماشین ترجمه، برخلاف سخنگویان بومی صرفاً در خصوص مقولهها و ترکیبهای مجاز مقولهای حاوی اطلاعاتی است و بنابراین موارد ابهامزا در ماشین ترجمه بسیار فراوان خواهد بود، بویژه در عناوین خبری موجود در روزنامهها که در آنها واژههای دارای نقشهای دستوری اغلب حذف میشود و مثلاً به یک عنوان خبری که در قالب جمله (3) ارائه گردیده است توجه کنید:
(3) Foot Heads Arms Body
در این مورد خواننده باید در خصوص واقعیتهای موجود در جهان پیرامون نیز اطلاعات لازم را داشته باشد. او باید بداند که یک سیاستمدار انگلیسی به نام Foot به ریاست کمیتهای منصوب شده که مسئولیت آن تحقیق و بررسی در مورد برنامه کنترل تسلیحات است. در جمله بالا، تقریباً تمامی واژهها دارای ابهاماند و بویژه دو واژه Heads و Arms ابهام مقولهای دارند چون هر دو میتوانند فعل سوم شخص مفرد و یا اسم جمع باشند. یا در فارسی وقتی گزارشگر ورزشی در ورزشگاه آزادی تهران از جوانی جمله (2) را میپرسد:
(4). قرمز یا آبی؟
سیستم ترجمه به دلیل ناآشنایی با فرهنگ ایران و اطلاعات جهان پیرامون، این جمله را به صورت Red Or Blue? ترجمه خواهد کرد، در صورتی که منظور از قرمز یا آبی تیمهای فوتبال پرسپولیس و استقلال تهران است.
3ـ1ـ1. همآوا ـ همنویسه، همنویسه و چند معنایی
نوع دوم ابهام واژگانی زمانی که یک واژه دارای بیش از یک معنا باشد. زبانشناسان معمولاً بین واژههای همآوا ـ همنویسه، همآوا و چند معنایی تمایز قائل میشوند (در این بخش، از بحث در خصوص واژههای همآوا (مانند خار و خوار) صرف نظر خواهد شد زیرا در مبحث ماشین ترجمه با متن مکتوب سر و کار داریم و نه گفتار شفاهی).
واژههای همآوا ـ همنویسه به واژههایی اطلاق میگردد که دارای نگارشی یکسان باشند و به یک شکل هم تلفظ شوند، ولی معانی کاملاً متفاوتی داشته باشند. مثلاً در انگلیسی واژه Light دارای دو معنی روشن و سبک است. در فارسی نیز واژه «سیر» دست کم دارای دو معنای نامرتبط است: 1.نوعی گیاه با طعم و بویی تند و 2. مقابل گرسنه. یا در جملههای (5) و(6) واژههای «تار» و «چنگ» دارای ابهاماند.
(5). در شب تار تار میزند.
(6). همه دلخوشند که مطرب بزند به تار چنـگی
من از آن خوشم که چنگی بزنم به تار مویی
گاه در زبان با واژههایی برخورد میکنیم که دارای املای کاملاً یکسان ولی تلفظ متفاوتند، مثل گل (گِل و گُل) و یا دیر (دیر و دِیر). اینگونه واژهها را «واژههای همنویسه» مینامیم. علت فراوانی این نوع واژهها در زبان فارسی آن است که در این زبان مصوتهای کوتاه در خط نموده نمیشوند، مانند مثال (7).
(7). پانصد گِرَم آش گَرم خریدم.
گاه تغییر جایگاه تکیه نیز سبب تغییر معنای واژه میشود.
(8). ماهی یک ماهی میخورم.
(9). خدا روزی روزی را از تو میگیرد.
در مثال 8 ماهی اول به «یک ماه» و ماهی دوم به «جانداری آبزی» اشاره دارد. در مثال 9 نیز روزی اول به معنی «یک روز» و روزی دوم به معنی «رزق» است.
سرانجام به واژههای چند معنایی میرسیم که مجموعهای از واژههای دارای صورت و تلفظ یکسان را توصیف میکند که بر خلاف واژههای همآوا ـ همنویسه بین معانی آنها نوعی ارتباط وجود دارد، مانند واژه «سر» که در ترکیبات «سر آدم، سر کلاس، سر بطری، سر کوه و ...»
نگاهی به مثالهای بالا نشان میدهد که سیستم ترجمه در صورتی می تواند به تعبیر و ترجمهای درست از واژگان و در نهایت جمله دست پیدا کند که بتواند تعبیر درست را از طریق بررسی و مراجعه به ساخت نحوی، اطلاعات ساختواژی و اطلاعات بافتی انتخاب نماید. نکته حایز اهمیت دیگر این است که بطور طبیعی بین مقولههای بالا (همآوا ـ هم نویسه، چند معنایی و همنویسه) نمیتوان بطور کامل تمایز قایل شد، چون با گذشت زمان ممکن است واژهای همآوا ـ همنویسه به واژهای چندمعنایی و ... تبدیل شود. به عنوان مثال، در بیشتر کتابهای زبانشناسی واژه Bank نمونهای از واژههای همآوا ـ همنویسه محسوب گردیده که این به معنای بیارتباط بودن معانی مختلف این واژه است؛ حال آنکه از نگاهی تاریخی و در زمانی، میتوان بین دو مفهوم این واژه ارتباط پیدا کرد و بنابراین میتوان این واژه را نمونهای از چند معنایی دانست. علت این امر هم آن است که در سالیان گذشته جویندگان طلا در حاشیه رودخانه اطراق میکردند و به جستجوی طلا میپرداختند. پس بر اساس اصل بسط معنایی واژه Bank میتواند به مرکز مالی نیز اشاره کند.
همانگونه که پیشتر ذکر شد، گاه چند نوع ابهام در یک جمله ظاهر میشود، به طوری که بدون مراجعه به اطلاعات بافتی متن (بندهای قبل و بعد، صفحات و فصلهای قبل و بعد) حتی سخنگوی بومی نیز قادر به درک معنای موردنظر نویسنده نخواهد بود. ضمناً گاه یک واژه ابهامزا در جمله وجود دارد، ولی واژگان دیگر موجود در جمله به شکلی است که همان واژه ابهامزای منفرد نیز حتی برای سخنگویان بومی با تجربه، ایجاد مشکل میکند، مانند مثالهای (10) و (11) زیر:
(10). او آن داستان را قشنگ خواند.
تعبیر اول: او آن داستان را به شکلی زیبا قرائت کرد.
تعبیر دوم: او آن داستان را زیبا ارزیابی/ قلمداد کرد.
(11). این کارت زشت است.
تعبیر اول: این کار تو زشت است.
تعبیر دوم: این کارت (برگه تبریک، عروسی، مشخصات و ...) زشت است.
در حوزه معناشناسی پارهای از ابهامها از طریق مراجعه به مشخصهها و مؤلفههای معنایی واژهها قابل رفع است. بر این اساس، جمله (12) جملهای مورد قبول و پذیرفته نیست زیرا فعل خوردن به فاعلی نیاز دارد که کنشگر باشد؛ یعنی توانایی انجام فعل (در این مورد عمل خوردن) را داشته باشد ضمناً این فعل به مفعولی نیاز دارد که قابل خوردن باشد، مانند سیب.
(12). سیب علی را خورد.
اگرچه استفاده از مشخصههای معنایی در مثال (12) ابهام را مرتفع میسازد، گاه با مواردی مواجه میشویم که مشخصههای معنایی نیز قادر به رفع ابهام نیستند. به عنوان مثال، در جملههای (13) و (14) واژههای «چنگال» و «همراه» دارای ابهاماند و با مراجعه به مشخصههای معنایی نیز نمیتوان ابهام موجود را برطرف نمود. تنها باید امیدوار باشیم که در جایی از متن این معما حل شده باشد.
(13). برای خوردن سوسیس از چنگالش استفاده کرد.
(14). همراه علی گم شد.
در مثال (13) «چنگال» می تواند به دو معنی باشد: (1). وسیلهای برای خوردن که با قاشق به کار میرود و (2). دست. در مثال (14) نیز «همراه» میتواند به معنای فرد «همراه» یا «تلفن همراه» باشد. در هیچ یک از این دو مورد مشخصههای معنایی قادر به رفع ابهام نیستند.
3ـ1ـ2. ابهام انتقالی
تاکنون از ابهام مقولهای، واژههای همآوا ـ همنویسه، هممعنایی و همنویسه به عنوان نمونههایی از ابهام واژگانی صحبت کردیم. تمامی این ابهامها از یک جهت به هم شباهت دارند و آن این است که همگی ابهامهایی تک زبانهاند؛ یعنی در یک زبان خاص اتفاق میافتند. اما در کار ترجمه ماشینی با نوع دیگری از ابهام مواجهایم که بین دو زبان اتفاق میافتد. این نوع ابهام که ابهام انتقالی یا ابهام در ترجمه نامیده میشود، زمانی اتفاق میافتد که یک واژه زبان مبدأ بتواند بالقوه به بیش از یک واژه در زبان مقصد ترجمه شود. نمونه بارز این نوع ابهام را میتوان در واژههای «واگرا» و «اصل واگرایی» مشاهده کرد. بر اساس این اصل، یک واژه زبان مبدأ با حفظ صورت به معانی متعددی اشاره میکند، ولی در زبان مقصد برای بیان آن معانی مختلف، واژهها و صورتهای متفاوتی وجود دارد، مانند واژه Cousin در انگلیسی که دارای 8 معنای مختلف است ولی در فارسی برای بیان آن 8 معنی از 8 واژه پسرعمو، دخترعمو، پسردایی، دخترعمو، پسردایی، دختردایی، پسرعمه، دخترعمه، پسرخاله و دخترخاله استفاده میشود. اینگونه واژهها اغلب در زبان مقصد ایجاد مشکل میکند و باید به واژههای مختلف شکسته شوند. بنابراین، این نوع ابهام به امر ترجمه مربوط است و نه به تجزیه و تحلیل یک زبان خاص.
4ـ ابهام ساختاری
در بخش 3 ریشه بیشتر ابهامهای موجود را در واژه جستجو کردیم، اما نوع دیگری از ابهام نیز وجود دارد که ریشه آن (به جای واژه) ساختار دستوری جمله زبان مبدأ است. این نوع ابهام زمانی اتفاق میافتد که بر اساس قواعد موجود در دستور بتوانیم یک جمله روساختی بیش از یک ژرف ساخت قائل شویم. بنابراین، در این نوع ابهام دو نکته از اهمیت بسیاری برخوردار است: 1ـ سطح یا واحد جمله و 2ـ دستور مورد استفاده در سیستم ترجمه.
بیشتر سیستمهای ترجمه ماشینی تجزیه و تحلیل را صرفاً در واحد جمله به انجام میرسانند و به واحدهای بزرگتر از آن مثل بند و ... و نیز نحوه ارتباط جملات نمیپردازند. ضمناً تجزیهگر ماشین ترجمه در امر تجزیه و تحلیل نمیتواند خارج از دستور موجود عمل کند. بنابراین، عدم کفایت دستور نیز سبب بروز مشکل در عملکرد تجزیهگر ماشین ترجمه خواهد شد. در حقیقت، با استفاده از دستور زبان است که ماشین ترجمه قرائتهای مختلف را شناسایی میکند. ابهام ساختاری دارای انواع مختلفی است که در ادامه به اختصار به دو مورد از مهمترین آنها با عناوین «ابهامهای ساختاری واقعی و سیستمی (تصادفی)» اشاره میشود.
4ـ1. ابهام ساختاری واقعی
این نوع ابهام بسیار مورد توجه زبانشناسان بوده است تا بتوانند از میان تعبیرهای نحوی مختلف، تعبیر مناسب را برگزینند. این نوع ابهامها را واقعی مینامیم چون سخنگویان بومی نیز جمله را دارای ابهام ارزیابی میکنند. به مثال زیر توجه کنید:
(15). The man saw the girl with the telescope.
این جمله در انگلیسی دارای ابهام ساختاری واقعی است و میتواند دارای یکی از تعابیر زیر باشد:
(15a) The man saw the girl who had the telescope.
(15b) The man saw the girl with the aid of the telescope.
نکته مهم این است که این جمله در یک بافت خاص عاری از هر گونه ابهامی باشد. مثلاً اگر این جمله در داستانی به کار رود، دنبال کردن جریان داستان مشخص میکند که کدام یک از دو تعبیر فوق مد نظر بوده است. این در حالی است که سیستم ترجمه قادر به دنبال کردن خط سیر داستان نیست. بنابراین، در این مورد ابهام واقعی با نوع دیگری از ابهام که سیستمی نامیده میشود، ترکیب شده است. این مورد در فارسی نیز به فراوانی اتفاق میافتد. به مثالهای زیر توجه کنید:
(16). او به مدیر تور گفت که نمیتواند بدود.
(16الف) او به مدیر تور گفت که مدیر تور نمیتواند بدود.
(16ب) او به مدیر تور گفت که او (فاعل) نمیتواند بدود.
(17). برخی از مردان و زنان ایران.
(17الف) برخی از مردان ایران و برخی از زنان ایران.
(17ب) برخی از مردان ایران و تمام زنان ایران.
همانگونه که در مثالهای بالا مشاهده میشود، این جملات حتی برای سخنگویان بومی نیز ابهام تولید میکند. معمولاً در بسیاری از دستورها برای رفع این مشکل از اصل قرابت یا نزدیکی استفاده میشود. بدین ترتیب «نمیتواند» به «مدیر تور» و «برخی» به «مردان» برمیگردد. اما باید توجه داشته باشیم که این اصل همواره صادق نیست و ممکن است منظور نویسنده تعبیر دیگری باشد؛ مثلاً منظور او واقعاً برخی از مردان و برخی از زنان ایران باشد.
نوع دیگری از ابهام ساختاری واقعی به عبارت حرف اضافهای مربوط میگردد. مثلاً در جمله (18).
(18). دانشمندی از ایران همراه علی بود.
مشخص نیست که «از ایران» صفت نسبی برای دانشمند است (دانشمند ایرانی) و یا نشاندهنده نقطه شروع است (از ایران آن دانشمند همراه علی بود). گاه رعایت نکردن علائم نشانهگذاری نیز به ابهامی ساختاری منجر میشود، مانند مثال (19).
(19). آن کتاب تاریخ را توصیف کرد.
(19الف) موضوع آن کتاب، توصیف تاریخ است. (در این صورت بعد از واژه کتاب باید کاما وجود داشته باشد)
(19ب) فردی آن کتاب تاریخ را توصیف کرد.
بدیهی است، سخنگویان بومی با مشاهده علایم نشانهگذاری صحیح و با استفاده از اطلاعات متنی نسبت به انتخاب تعبیر درست اقدام به عمل میآورند. حال آنکه انتخاب تعبیر درست از سوی ماشین ترجمه بسیار دشوارتر خواهد بود.
نوع دیگری از ابهام به ساختار واژه در جمله مربوط میگردد. این مورد اغلب در مورد اسامی غیر بسیط نیز اتفاق میافتد. در زبان فارسی اغلب اسامی غیر بسیط به شکلهای مختلفی نوشته میشوند که این تنوع برای سیستم ترجمه و حتی فرد مترجم، مشکلاتی را ایجاد میکند. به عنوان مثال، در جمله (20) چنانچه واژه «همکلاس» به صورت پیوسته نوشته نشود، میتواند ابهامزا باشد.
(20). من همکلاسم را دیدم.
(20الف) من هم، کلاسم را دیدم.
(20ب) من همکلاسم را دیدم.
متأسفانه در زبان فارسی برای رفع این مشکل راه حلی با ضمانت اجرایی مناسب که بتواند سبب یکدستسازی نوشتار فارسی گردد ارائه نگردیده و یا اگر هم مطرح شده از ضمانت اجرایی لازم برخوردار نیست. مسلماً اینگونه اسامی چنانچه سر هم نوشته شوند مشکلساز نخواهند بود و حتی در صورت استفاده از صورت ناپیوسته آن، میتوان از طریق ایجاد یک فاصله بین هم و کلاس (مفهوم20 الف) و ایجاد فاصله کمتر نیم فاصله بین هم و کلاس (مفهوم20ب) تمایز لازم را ایجاد نمود.
4ـ 2. ابهام ساختاری سیستمی
گاه علت بروز وجود نقصان در سیستم است که نمیتواند از جمله ابهامزدایی کند. به بیان دیگر، در اینگونه موارد سخنگویان بومی به راحتی جمله را درک و ابهامزدایی میکنند ولی ماشین ترجمه قادر به انجام چنین کاری نیست. این نوع ابهامها را سیستمی مینامیم و به انواع مختلفی تقسیم میشوند که در ادامه به چند مورد در زبان فارسی و انگلیسی اشاره میشود.
گاه ابهام ساختاری تصادفی زمانی اتفاق میافتد که واژههای دارای ابهام مقولهای، به صورت تصادفی با هم ترکیب میشوند.
(21). Fruit flies like grape.
در جمله (21) Flies میتواند فعل سوم شخص مفرد یا اسم جمع باشد؛ Like میتواند نقش فعلی یا اسمی داشته باشد و ... در حقیقت در جمله بالا Fruit Flies اسم مرکب است و چنانچه به صورت توالی فاعل و فعل تجزیه شود، معنای جمله عوض خواهد شد. بنابراین، به جای «مگسهای میوه انگور را دوست دارند» جمله ممکن است به صورت «میوه دوست داشتن را انگور پرواز میکند» ترجمه شود. سخنگویان بومی این جمله را به شکلی درست تقطیع خواهند کرد. چون از اطلاعات ژرف ساختی استفاده میکنند و تعبیر دیگر را منطقاً نامعقول میدانند.
نوع دیگری از ابهام ساختاری تصادفی زمانی اتفاق میافتد که با فعل مرکب و یا توالیای از یک سری اسامی مثل یک اسم مرکب، سر و کار داشته باشیم.
(22). گل یخ یخ زد.
اسم مرکب فعل مرکب
در مثال (22) یک اسم مرکب (گل یخ) و یک فعل مرکب (یخ زد) وجود دارد و هر گونه تقطیع دیگری مثلاً به صورت «گل + یخ + یخ + زد» یا «گل + یخ + یخ زد»، مانع دستیابی ما به تعبیر درست خواهد شد. تعبیر درست «گل یخ + یخ زد» است. با توجه به فراوانی اسامی مرکب در فارسی و انگلیسی و نیز فراوانی ابهامهای مقولهای در این دو زبان، با نمونههای زیادی از ابهام ساختاری مواجه خواهیم شد.
نوع دیگری از ابهام ساختاری سیستمی به عدم تطابق حروف اضافه در زبانهای مختلف مثل فارسی و انگلیسی مربوط میگردد. بنابراین، سیستم باید در خصوص نحوة کاربرد حروف اضافه و ادات (که مورد اخیر به همراه فعل میآید) اطلاعات درستی داشته باشد.
(23). علی در شیراز در به در شد.
برای ترجمه جمله (23) به زبان انگلیسی سیستم باید بتواند بین سه مورد وقوع واژه «در»، تمایز قایل شود. ضمناً در حین ترجمه باید به شکلی بین دو حرف اضافه at و in یکی را برگزیند. سیستم باید بداند که شیراز شهر بزرگی است و بنابراین حرف اضافه in مناسب است و نه at.
4ـ3. رفع ابهام ساختاری
4ـ3ـ1. استفاده از اطلاعات مربوط به مؤلفههای معنایی و دانش زبانی
اغلب جملات مبهم را میتوان از طریق مراجعه به دانش زبانی و مؤلفههای معنایی ابهام زدایی کرد. دانش زبانی دارای انواع مختلفی است. نکته مهم این است که در تمام آنها از اطلاعات مربوط به واژهها و نحوه ترکیب آنها استفاده میشود و به وقایع جهان پیرامون توجهی نمیشود. اینگونه قالبها نوع عناصری را که میتوانند پیش یا پس از فعل ظاهر شوند، مشخص میکنند. به عنوان مثال، فعلی مانند «دادن» حداقل به سه گروه اسمی نیاز دارد که دو مورد دارای نقشهای دهنده (فاعلی) و گیرنده (مفعولی) است و مورد دیگر به چیز یا شیئی اشاره دارد که داده یا گرفته میشود.
(24). علی کتاب را به محمد داد.
محمد = گیرنده کتاب، علی = دهنده کتاب، کتاب = شیء داده شده یا گرفته شده.
برای انتخاب گروههای اسمی مناسب نیز از مؤلفههای معنایی مثل [+/- جاندار] [+/- انسان] و ... استفاده میشود. این مؤلفهها در مثال بالا مانع ایفای نقش فاعلی از سوی واژه کتاب میشوند.
4ـ3ـ2. کلیدهای بافتی
در زبان تعداد جملاتی که حاوی نمونههایی از ابهام واقعی باشند، بسیار کم است. چنانچه از طریق مؤلفههای معنایی و دانش زبانی ابهامزدایی نشود، از اطلاعات بافتی استفاده میگردد. در اینگونه موارد کلیدهای بافتی مشخص میکند که کدام تعبیر، درست یا مورد نظر است. به عنوان نمونه، در مثالهای 14 و 15 تنها راه درک جمله این است که فرد از جملات قبل، بندهای قبل و یا حتی فصلهای قبل مربوط به آن مطلع باشد. سیستمهای ترجمه اغلب نمیتوانند از این نوع اطلاعات بافتی استفاده کنند چون هیچ قانون مشخصی وجود ندارد که بر اساس آن سیستم بتواند محل اطلاعات مورد نیاز برای ابهامزدایی را شناسایی نماید.
4ـ3ـ3. استفاده از دانش غیر زبانی (اطلاعات مربوط به جهان پیرامون)
گاه پیش میآید که کلیدهای بافتی و مؤلفههای معنایی هیچ یک نمیتوانند ابهام موجود را مرتفع سازند. در چنین مواردی، گاه با استفاده از اطلاعات مربوط به جهان پیرامون، میتوان ابهامزدایی کرد.
(25). علی اسب را با دوربین دید.
در جمله بالا، ریشه ابهام در عبارت حرف اضافهای با «دوربین» است. در حقیقت، میتوانیم دو تعبیر زیر را تصور کنیم:
(الف) علی از دوربین برای دیدن استفاده کرده و (ب) اسب دوربین داشته و علی هر دو را با هم دیده است.
در این مورد، با استفاده از اطلاعات جهان بیرون میتوانیم ابهامزدایی کنیم؛ بدین ترتیب که بر اساس تجربیات ما از جهان پیرامون، تعبیر (الف) منطقیتر به نظر میرسد.
(26). The man saw the girl with red hair.
در مثال (26) نیز برای درک عبارت حرف اضافهای از اطلاعات جهان پیرامون استفاده میشود و تعبیر «آن مرد دخترِ مو قرمز را دید» مناسب و مرتبط تشخیص داده میشود و تعبیر «آن مرد دختر را با موی قرمز دید» تعبیری نادرست محسوب میگردد، چون بر اساس تجربیات جهان خارج میدانیم نمیتوان با موی قرمز (به عنوان یک وسیله) شیء یا فردی را دید، بلکه برای دیدن از ابزاری چون دوربین، تلسکوپ و ... استفاده میشود.
همانگونه که پیشتر نیز ذکر شد، وارد نمودن تمامی اطلاعات جهان پیرامون به شکلی که بتواند ابهامهای احتمالی را مرتفع سازد، کاری غیرممکن و مدام در حال تغییر است. پیشرفتهای به دست آمده در هوش مصنوعی نیز نتوانسته بهبود چندانی پدید آورد، بنابراین، از پیچیدگی و گستردگی اطلاعات جهان پیرامون میتوان به عنوان دو عامل مهم که مانع دستیابی به راه حلی فوری میشوند نام برد.
4ـ3ـ4. مشورت با افراد متخصص
یکی دیگر از راهکارهای ابهامزدایی، به تماس با نویسنده و یا مشورت با افراد متخصص مربوط میگردد؛ بدین ترتیب که افراد متخصص در امر ترجمه وارد شده و بر اساس درک خود، یکی از تجزیه و تحلیلها را برمیگزینند. البته این تدبیر نیز قادر نیست همواره ما را به تعبیر درست برساند.
4ـ3ـ5. استفاده از سیاست گمانهزنی یا بهترین حدس
چنانچه با استفاده از راهکارهای بالا ابهام مرتفع نشود، جمله دارای ساختار رایجتر به عنوان تعبیر مورد نظر برگزیده میشود. مثلاً عبارتهای حرف اضافهای اغلب اسم پیش از خود را توصیف میکنند؛ عبارتهای نزدیکترین فعل به خود را توصیف میکنند و ... البته از آنجا که این رویکرد بر پایه حدس و گمان بنا شده، از ضریب خطای بالایی برخوردار است.
(27). Investigation of techniques of stress analysis by thermal emission.
در مثال (27) حدس ما این خواهد بود که عبارت by thermal emission به اسم پیش از خود یعنی analysis برمیگردد و نه به techniques یا investigation .
4ـ3ـ6. چشمپوشی از مورد ابهامزا
در این رویکرد، ابهام موجود در زبان مبدأ به همان صورت و بدون ابهامزدایی وارد زبان مقصد میشود؛ بدین ترتیب که جمله زبان مقصد نیز دارای ابهامی مانند ابهام موجود در جمله زبان مبدأ میشود. از این روش صرفاً در مواردی میتوان استفاده کرد که زبانهای مبدأ و مقصد از نظر ساختار و واژگان بسیار به هم شبیه و نزدیک باشند، مثل آلمانی و فرانسه. البته، حتی در این دو زبان نیز همیشه امکان انجام چنین کاری وجود ندارد.
نکتهای که در خصوص ابهامهای ششگانه فوق باید ذکر شود این است که از نظر خود سیستم اینگونه تمایزها نامربوط است. برای سیستم نوع ابهام از اهمیت چندانی برخوردار نیست. نکته حائز اهمیت این است که آیا سیستم برای رفع ابهام، اطلاعات و امکانات لازم را در اختیار دارد یا خیر؟
4ـ3ـ7. مرجعیابی
مرجعیابی به بررسی ارتباط بین اسم و مرجع آن میپردازد که این دو ممکن است در یک جمله یا در جملات، بندها و حتی صفحات مختلف وجود داشته باشند. بحث در خصوص مرجعیابی خود به مقالهای جدا نیاز دارد، ولی از آنجا که آن نیز نوعی ابهام به شمار میآید، در قسمت پایانی مقاله اشاره کوتاهی به آن خواهیم داشت.
مرجعیابی نیز میتواند تولید ابهام کند، چون ممکن است مرجع یک ضمیر نامشخص باشد یا کاملاً مشخص نباشد. به مثالهای زیر توجه کنید:
(28). میمون سیب را خورد چون آن گرسنه بود.
(29). میمون سیب را خورد چون آن رسیده بود.
(30). Me Killed her.
در مثال (28) ضمیر «آن» به «میمون» و در مثال (29) به «سیب» برمیگردد. بنابراین، در مثال (28) «میمون گرسنه بود» و در مثال (29) «سیب رسیده بود»، چرا که محدودیتهای همآوایی مشخص میسازد که سیب نمیتواند گرسنه باشد (برخلاف انسان و حیوان) و میمون نمیتواند (برخلاف میوه) رسیده باشد. ولی در جمله (30) با مشکل دیگری مواجه هستیم؛ بدین ترتیب که ترجمه ماشینی این جمله به صورت «او او را کشت» خواهد شد و میبینیم که ابهام این جمله از جمله زبان مبدأ بیشتر است. علت این امر آن است که در جمله انگلیسی برای مذکر و مؤنث از ضمایری جدا استفاده میکنیم، ولی در زبان فارسی برای هر دو جنس از ضمیر «او» استفاده میشود. بنابراین، جمله ترجمه شده ابهام بیشتری را در خود دارد. برای رفع این مشکل، باید ضمن یافتن مرجع این دو ضمیر، دست کم یکی از آنها را رمزگشایی کنیم؛ مثلاً «او مری را کشت»، «جک مری را کشت»، «او آن زن را کشت» و ... . طبیعی است با خروج مرجعیابی از سطح جمله و گسترش کار به بند و صفحه و ... کار مرجعیابی دشوارتر و برای ماشین تا حد زیادی ناممکن میگردد.
خلاصه
در این مقاله، ضمن بررسی ابهامهای واژگانی و ساختاری، سعی شد مشکلاتی که اینگونه ابهامها برای ماشینهای ترجمه ایجاد میکنند، تشریح گردد. در پایان نیز شش روش مختلف ابهامزدایی معرفی گردید. از آنچه گفته شد میتوان چنین استنباط نمود که سیستمهای ترجمه برای کارایی مطلوب باید از نظریهای مناسب و جامع استفاده نمایند. ضمناً سیستم ترجمه در صورتی موفق خواهد بود که بتواند مانند ذهن یک انسان در هنگام مواجهه با پیچیدگیهای زبانی از اطلاعات نحوی، واژگانی، معنایی، بافتی، دانش جهان پیرامون و ... استفاده نماید. نبود ماشین ترجمه فارسی به انگلیسی، نشان میدهد که تاکنون محققان کشور در این خصوص تحقیقات منسجم و دنبالهداری را به انجام نرساندهاند. با توجه به اینکه بیشتر نظریههای زبانی از سوی محققان انگلیسی ارائه گردیده (حتی دستور زبان چامسکی نیز پس از گذشت حدود نیم قرن نتوانسته جای خود را در مدارس باز کند) حتی برای زبان انگلیسی و زبانهای مشابه آن نیز با مشکلات فراوانی مواجه است. این موارد نشان میدهد برای رسیدن به ماشینهای ترجمه مناسب هنوز باید کار بسیاری در حیطه زبانشناسی رایانهای به انجام برسد که همانگونه که پیشتر نیز ذکر شد، در حال حاضر چنین رشتهای در دانشگاههای ایران تدریس نمیشود.