دانشگاه آزاد اسلامی واحد میناب
چکیده: (7471 مشاهده)
گفتمان به هر قطعه یا پارهای از زبان گفته میشود که به قصد برقراری ارتباط به کار برده شده باشد. سیستم شناسایی روابط موجود در گفتمان سیستمی است که میتواند روابط موجود بین واحدهای متنی یک گفتمان را شناسایی کند. یکی از روابط موجود در گفتمانهای زبان فارسی رابطه تقابل است که شناسایی آن به توانائی تولید و درک گفتمان کمک می-کند و در سیستمهای متعددی مانند خلاصهساز، تفسیر و... کاربرد دارد. این رابطه در یک گفتمان میتواند به کمک نقش-نماهای خاص رابطه تقابل مانند "اما" و "ولی" شناسایی شود؛ اما در بعضی موارد این نقشنماها حذف میشوند و شناسایی رابطه را با مشکل مواجه میکنند. لذا به منظور شناسایی این رابطه، از ویژگیهائی مانند زمان فعلها، جفت کلمات و ... استفاده شد. بدین منظور و پس از گردآوری 5000 نمونه رابطه تقابل و 5000 نمونه سایر روابط از مجموعه داده پژوهشکده هوشمند علائم، برای هر نمونه بردار ویژگی تشکیل داده شد و در نهایت برای دستهبندی و تشخیص رابطه تقابل از چند روش یادگیری باسرپرستی شامل ماشین بردار پشتیبان ، نزدیکترین همسایه، پنجره پارزن و همچنین ترکیب این دسته-بندها استفاده شد. که بهترین میزان صحت 87.13 و مربوط به ترکیب دستهبندها در بهترین حالت میباشد
نوع مطالعه:
پژوهشي |
موضوع مقاله:
مقالات پردازش متن دریافت: 1392/3/1 | پذیرش: 1393/11/24 | انتشار: 1394/7/8 | انتشار الکترونیک: 1394/7/8