۱) استراتژی بهترین- اولین[۹۷]:
در این روش مانند روش قبل تمامی اشارههای ماقبل تالی بهعنوان کاندیدایی برای مرجع مشترک انتخاب میشوند. در نهایت اشارهای انتخاب میشود که بالاترین احتمال را برای هممرجع بودن، با عبارت مورد بررسی داشته باشد.[۱۰۱]
۲)تولید مجموعه آموزشی :
برای قابل اجرا بودن ردهبندی بهترین – اولین نحوهی انتخاب نمونههای آموزشی تغییر میکند. عملکرد تولید مجموعه آموزشی به این ترتیب است که به جای اینکه نمونههای مثبت را از هر عبارت اسمی و نزدیکترین عبارت اسمی هممرجع با آن فراهم شود، نمونههای مثبت از هر عبارت اسمی و مناسبترین عبارت اسمی که میتواند با آن هممرجع باشد، انتخاب میگردد.[۱۰۱]
۲-۱-۳-۲-۲-۱. درخت بل[۹۸]
در سال ۲۰۰۴، لو[۹۹] و همکارانش، روشی برای تشخیص مرجع مشترک ارائه دادند که در آن از درختِ بل بهعنوان فضای جستجو استفاده شده است.[۱۰۶] سال بعد از آن نیز عماد زیتونی و همکارانش از این روش برای زبان عربی استفاده نمودند.[۴۹] به طور کلی در این روش درختِ بل، مسئله تشخیص مرجع مشترک بهعنوان یافتن بهترین مسیر از ریشه درختِ بل به گرههای انتهایی است. در این روش از مدل حداکثر آنتروپی جهت رتبهبندی این مسیرها استفاده میشود. هر یک از برگهای درختِ بل، نمایانگر یکی از خروجیهای ممکن برای تشخیص زنجیرهی عبارت اسمی هممرجع میباشد.گرهی ریشه، وضعیت آغازین فرایند و تنها شامل یک موجودیت است که اولین عبارت اسمی به آن تعلق دارد. هنگام اضافه کردن دومین عبارت اسمی، میتوان از هر یک از عملیاتهای «اضافه کردن به یک موجودیت قبلی» و یا «آغاز کردن یک موجودیت جدید» استفاده نمود.
پس از انجام هر یک از عملیاتها، لایه دوم گره ایجاد میشود. بهعنوان مثال سه عبارت اسمی را در یک متن در نظر بگیرید. درختِ بل متناظر با فرایند تشخیص مرجع مشترک بر روی متن شامل سه عبارت مذکور مطابق شکل ۲-۲ خواهد بود.
شکل ۲-۲. درختِ بل به ازای سه عبارت اسمی[۱۰۰]
همانطور که در شکل۲-۲ مشاهده مینمایید، این فرایند یک فرایند همزمان با عبارات اسمی است، بدین معنی که هر لایه از گرهها تنها با اضافه کردن یک عبارت اسمی جدید ایجاد میشود. از آنجائیکه تعداد برگهای درخت برابر است با تعداد خروجیهای ممکن فرایند تشخیص مرجع مشترک، و این عدد با عدد بل یکسان است، درخت تشکیل شده را درختِ بل مینامند. عدد بل تعداد راههایی است که میتوان n شیء متمایز را به زیر مجموعههایی که با هم اشتراکی ندارند، افراز نمود.
در سال ۲۰۰۷، لو، یک مدل دوگانه[۱۰۱] برای بهبود روش درختِ بل ارائه داد. در روش درختِ بل تنها یک مدل با بهره گرفتن از حداکثرآنتروپی آموزش داده میشد و آن مدل «متصل کردن به یک موجودیت قبلی» بود. همچنین احتمال «آغاز کردن یک موجودیت جدید» نیز از روی احتمال متصل نشدن به موجودیتهای قبلی محاسبه میشد. شیوه ارائه شده توسط لو مشابه شیوه درختِ بل است، با این تفاوت که دو مدل جداگانه برای «متصل کردن به یک موجودیت قبلی» و «آغاز کردن یک موجودیت جدید» در نظر گرفته میشود. هر کدام از این مدلها بصورت مجزا آموزش داده میشوند. نتایج نشان دادهاست که این شیوه بهتر از شیوهی درختِ بل عمل میکند.[۱۰۷]
مزایا و معایب روش درختِ بل
مزیت این روش، در نظر گرفتن و رعایت روابط متعدی، است. مشکل این روش در آن است که عدد بل با افزایش n (تعداد عبارات اسمی متمایز) به سرعت افزایش مییابد و بدین ترتیب با افزایش تعداد عبارتهای اسمی، جستجو در درختِ بل مشکلتر میشود. جهت رفع این مشکل از یک مکانیزم جستجوی کارا و روشهای هرس کردن درخت استفاده میشود.
۲-۱-۳-۲-۲-۲.افراز گراف[۱۰۲]
در روش افراز گراف، پس از ردهبندی و تصمیم گیری که در مورد هممرجع بودن دو عبارت اسمی صورت میگیرد. نوبت به مرحله تعیین زنجیره های عبارتهای اسمیِ هممرجع که در یک گروه قرار داشته و به یک موجودیت اشاره میپردازند، میرسد.
در افراز گراف، گرههای گراف، عبارتهای اسمی(یا اشارهها) و وزن یالهای میان هردو گره، بیانگر ارتباط یا به عبارت دیگر میزان احتمال هممرجع بودن آن دو گره میباشد. این وزنها از مرحله ردهبندی بدست میآیند. برای تشخیص موجودیتهای موجود در متن که با هم هممرجع هستند، باید گراف را به گونهای افراز کرد که تمام گرههای قرار گرفته در یک زیرگراف به یک موجودیت یکسان اشاره داشته باشند[۱۸،۲۰،۳۰،۵۱]
در مرحله تعیین زنجیره عبارات هممرجع، نیکلای[۱۰۳] و همکارانش در سال ۲۰۰۶، از روشی استفاده نمودند که در آن فضای عبارات اسمی هممرجع، به صورت یک گراف بدون جهت وزندار نمایش داده میشود. [۱۸]در این روش از ردهبند حداکثر آنتروپی برای وزندهی یالها استفاده شده (آنها بر این باورند که مدل حداکثر آنتروپی میتواند نتایج بهتری نسبت به مدل درخت تصمیم ارائه دهد) و به ازای هر یک از انواع موجودیتها گراف جداگانهای ایجاد میشود. در نهایت، نمونه تغییر یافتهای از الگوریتم «برش کمینه[۱۰۴] ی» استور[۱۰۵] [۶۴]بر روی هر کدام از گرافها اعمال میشود و بدین ترتیب مرحله خوشهبندی به انجام پیمانههای که افرازهای ایجاد شده توسط این الگوریتم، عبارتهای اسمی خواهند بود که به یک موجودیت واحد اشاره میپردازند. همچنین میتوان مانند بانسال[۱۰۶] ، از الگوریتم خوشهبندی رابطهای نیز برای تخمین مسئلهی افراز گراف استفاده نمود.[۷۲] در این شیوه، ناسازگاری حضور یک گره در هر افراز محاسبه میشود و مرحله افرازبندی بگونهای انجام میپذیرد که این ناسازگاریها به حداقل ممکن برسند.
در سال ۲۰۱۰، ساپنا[۱۰۷] و همکارانش یک روش افراز گراف محدود شده را پیشنهاد نمودند. آنها برای وزندهی به یالها از ردهبند درخت تصمیم استفاده کردند و برای بهینه سازی نتایج از یک الگوریتم تکرارشونده تحت عنوان برچسبگذاری راحت[۱۰۸] استفاده نمودند.[۴۷] در این الگوریتم، برای تخصیص هر گره به هر افراز، محدودیتهایی بررسی میشود. و هدف آن پیدا کردن یک برچسبگذاری وزنی بیشینه است.[۳۰]
از طرف دیگر، کای و همکارانش یک مدل افراز ابرگراف عمومی را پیشنهاد دادند. هدف نهائی این مدل انجام تحلیل مرجع مشترک در یک مرحله است. نخست کل متن به عنوان یک ابرگراف[۱۰۹] در نظر گرفته میشود. سپس این ابرگراف با در نظر گرفتن ویژگیهایی مانند تطابق رشتهای، تطبیق ضمیر و… به تعدادی زیرگراف تقسیم میشود. برای افراز گراف نیز، خوشهبندی طیفی بازگشتی در میان تمام زیر گرافها اجرا شده و به جای استفاده از برش کمینه، از برش نرمال[۱۱۰] استفاده میشود، این کار آنقدر ادامه پیدا میکند تا به شرط توقف برسد.[۲۰]
مزایا و معایب روش افراز گراف
روش افراز گراف نسبت به برخی از روشها مانند روش درختِ بل[۱۰۶]عملکرد بهتری نشان داده است. البته روش افراز گراف نیز مانند روش درختِ بل، روابط متعدی را در نظر میگیرد، و در عین حال از برخی خصوصیتهای الگوریتمهای گراف مانند سادگی و موثر بودن بهره میبرد. از طرفی دیگر، این روش هنگام تشکیل و افراز گرافها، تنها از افراز غیراشاره استفاده میکند و برای تشخیص مرجع مشترک، از یک شیوهی ردهبندی ساده بهره میگیرد. در نتیجه عملکرد آن در تشخیص مرجع مشترک خیلی مناسب نیست.
۲-۱-۳-۳.روشهای مبتنی بر پیکره
تکنیکهای داده کاوی[۱۱۱]، از جمله روشهایی هستند که در مسئلهی تشخیص مرجع مشترک استفاده شدهاند. هاراباگیو[۱۱۲] و همکارانش در سال ۲۰۰۱ ، از پایگاه دادههای برچسبگذاری شدهی MUC-6 و MUC-7 استفاده کردند. آنها به منظور استفاده از شیوههای دادهکاوی با بهره گرفتن از این دو پایگاه داده، دادههای بیشتری تولید کردند.[۹۳]
یکی از نتایج بدست آمدهی قابل توجه آنها این است که تعداد پیوندهایی که یک عبارت اسمی را به یک عبارت اسمی خاص متصل کردهاست ۲۹٫۱ % و تعداد پیوندهای هممرجع میان دو عبارت اسمی عام ۱۰% است. از طرفی دیگر حدود۸۳% از زنجیره های هممرجع در پیکرهی MUC-6 با ویژگیها و قواعد سادهای مانند تکرار یک عبارت اسمی، نام مستعار، هسته[۱۱۳] مشترک و غیره حل خواهد شد.
پس از تولید پایگاهداده بزرگتر با بهره گرفتن از پایگاه دادههای برچسبگذاری شده موجود، تعدادی قاعده استخراج میشود و به ازای هر قاعده، آنتروپی آن بهعنوان معیاری برای درجه صحت آن قاعده در نظر گرفته میشود. سپس افراز عبارتهای اسمی به گونهای انجام میپذیرد که تعداد بیشتری از قاعدههایی که درجه صحت بالاتری دارند، این افراز را تایید نمایند.
میتوان از پیکرهها برای کاوش در الگوهایی مانند الگوهایی که بوسیله آنها دو عبارت اسمی به یکدیگر مرتبط میشوند، بهرهگرفت. الگوهایی که به کرات میان دو عبارت اسمی مشاهده شدهاند، بیانگر رابطهی میان آن دو عبارت اسمی هستند.
بین[۱۱۴] و همکارانش در سال ۲۰۰۴، سیستمی ایجاد کردند که در آن سیستم براساس رابطه میان کلمات و زمینهای را که آن کلمات میتوانند در آن باشند را به شیوهای بدون نظارت آموزش میبینند. مشخص کردن نقش معنایی عبارتهای اسمی، نقش بسیار مهمی در زنجیره های عبارات اسمی هممرجع دارد. [۲۵] بهعنوان نمونه مثالهای ذیل را در نظر بگیرید.
Maria, Roberto, and Dino, who were staying at the Tecun hotel مثال۷: kid-napped by armed men …
ماریا، ربرتو و داینو که در هتل«تکان»مستقر بودند، توسط مردان نقابدار دزدیده شدند.
After they were released …مثال۸:
پس از آنکه آنها آزاد شدند…
After they blindfolded the men…مثال۹:
پس از آنکه مردها دستگیر شدند…
درمورد (مثال۸)، « آنها» با «ماریا»، «ربرتو» و «داینو» (پسران) هممرجع هستند.و در مورد (مثال۹)، «آنها» با «مردان نقابدار» مرجع مشترک دارند.
در چنین شرایطی، یافتن عبارات اسمی که به یک مرجع واحد اشاره دارند، نیاز به یک دانش قبلی دارد. به عنوان مثال کسانی که به اسارت گرفته میشوند، آزاد میشوند. کسب و استفاده از چنین دانشی در زبانهای طبیعی، یک مسئله حل نشدهاست. در عین حال وجود پیکرههای بزرگ میتواند برای آسانتر شدن کاوش در چنین الگوهایی کمک بسزائی داشته باشد. بین و همکارانش نیز از شیوه بدون نظارت مبتنی بر پیکره برای این منظور استفاده نمودهاند. در شیوهی ارائه شده توسط آنها، مفاهیم به صورت چارچوبهای موضوعی نمایش داده میشوند که میتوان قابهای موضوعی[۱۱۵] را به عنوان عبارتهایی با یک پرکننده در نظر گرفت.[۲۵] مانند مثال ذیل:
“Murder of <NP>”, “killed<NP>”مثال۱۰: .
این سیستم از چند پیمانه تشکیل شده است. یک پیمانه با این فرض که قابهایی از واژه ها که با یکدیگر رخ میدهند با یکدیگر مرتبط نیستند، شبکه قاب موضوعی را، با مشخص کردن قابهای مرتبط میسازد. بنابراین با دادن قاب موضوعی، میتوان تمامی قابهای موضوعی که با آن قاب رخ میدهند را لیست کرد. به عنوان نمونه، برای مثال فوق میتوان انتظار داشت که “<NP> were kidnapped” با “<NP> were released” رخ دهد.
یک پیمانه دیگر، قابهای موضوعی مرتبط با واژه ها را مشخص مینماید. به این ترتیب که اگر دو واژه با یکدیگر رخ دهند، پس آنها با قابهای موضوعی یکدیگر مرتبط خواهندبود. بنابراین با داشتن یک قاب موضوعی میتوان تمام واژههایی که انتظار میرود با آن رخ دهند را لیست نمود. در نهایت نیز پیمانه دیگری با رابطهی میان قابها و نوع معنایی واژه ها آموزش میبیند. این نوع معنایی از شبکه واژگانی استخراج میشود.
در سال ۲۰۰۶، برگسما[۱۱۶] و لین[۱۱۷] احتمال اینکه یک عبارت اسمی با کاندیداهای احتمالی خود هممرجع باشد را بر اساس مسیری که درخت تجزیه[۱۱۸]ی میان آنها وجود دارد، محاسبه کردند. این اطلاعات به صورت خودکار و با بهره گرفتن از پایگاه دادهی بزرگی که در آن ساختار وابستگی[۱۱۹] جملات مشخص شده است، استخراج میشوند. به عنوان مثال، دو جملهی زیر را در نظر بگیرید:
مثال۱۱:جان به دوستش نیاز دارد
مثال۱۲:جان به حمایت او نیاز دارد
[سه شنبه 1401-04-14] [ 05:21:00 ب.ظ ]
|