تشخیص افعال مرکب نقش مهمی در کیفیت پردازش زبان دارد، زیرا معمولاً این ساخت­ها اصطلاحی هستند و در بسیاری موارد معنای آنها از مجموع معنای اجزا ساخته نمی­شود. زبان فارسی تعداد محدودی فعل ساده دارد و بیشتر افعال در این زبان از ترکیب یک عنصر غیرفعلی و یک فعل سبک تشکیل می­شوند.

این پژوهش بخشی از برنامۀ پارسیم (PARSEME) است. پارسیم یک گروه پژوهشی بین ­رشته­ ای به هدف بررسی واژه­ های مرکب و ساخت ابزار پردازش برای آنها است. پیکرۀ فعلی پارسیم در نسخه ۳-۱ خود مشتمل بر فعل­ های مرکب ۲۶ زبان مختلف است. پارسیم یک شیوه­ نامۀ جهانی دارد، اما تا حدودی دست را برای تفاوت­های بین­ زبانی باز گذاشته است. در این پژوهش بنا داریم بر مبنای شیوه­ نامۀ پارسیم یک شیوه ­نامه برای برچسب ­زنی افعال مرکب فارسی ارائه دهیم. بر اساس شیوه ­نامۀ پارسیم فعل مرکب به فعلی گفته می­شود که حداقل دو بخش واژگانی داشته باشد، یعنی یک هسته فعلی و یک واژۀ دیگر که از لحاظ نحوی به هسته مرتبط است (ارتباط می­تواند به طور مستقیم یا به کمک حرف اضافه برقرار شود). دسته ­بندی پارسیم برای افعال مرکب به شرح زیر است.

  • دسته­ های جهانی که در همه زبان­های موجود در پیکره وجود دارند:

الف- ساختارهای فعلی دارای فعل سبک

  • فعل سبک کاملا از لحاظ معنایی تهی شده باشد.

جزء غیرفعلی یک اسم با معنای انتزاعی است (to make a decision). گاهی یک حرف اضافه رابطه اسم و فعل را برقرار می­کند (to come into bloom). اسم می­تواند غیرانتزاعی باشد در صورتی که در ساخت معنای رویدادی داشته باشد (to take a shower).

  • فعل سبک یک معنای سببی به اسم اضافه کند.

ب- افعال اصطلاحی

در این پیکره افعالی که بیش از دو جزء دارند (to make ends meet) و افعالی که جزء غیرفعلی آنها صفت (to come clean) یا قید (to take it seriously) یا اسم غیرانتزاعی با معنای غیررویدادی (to give a hand) باشد فعل اصطلاحی محسوب می­شوند.

 

  • دسته­ هایی که در بعضی زبان­ها وجود دارند:

الف- افعال انعکاسی (reflexive): s’évanouir (فعل “غش کردن” در فرانسوی)

ب- ساختار فعل-جزء قیدی (particle):

  • جزء قیدی معنا را کاملاً تغییر می­دهد

to do in (کشتن)

  • جزء قیدی معنایی تقریباً قابل­پیش­بینی اضافه می­کند

To end up (به شکل غیرمنتظره­ای به پایان رسیدن)

پ- سایر افعال چندبخشی که یک هسته فعلی واحد ندارند
to drink and drive, to voice act, to short-circuit

شیوه­نامه پارسیم را در اینجا ببینید و توضیحات بیشتر را در این مقاله.

در سنت دستوری فارسی نیز فعل مرکب از یک فعل سبک و یک جزء غیر فعلی تشکیل می­شود. فعل سبک فعلی است که معنای اصلی خود را تقریباً یا کاملاً از دست داده باشد و جزء غیرفعلی می­تواند اسم (انجام دادن)، صفت (دراز کشیدن) یا پیشوند (فراخواندن) باشد. در فعل­ هایی که جزء غیرفعلی آنها اسم است گاهی یک حرف اضافه ارتباط بین اسم و فعل را برقرار می­کند، مانند فعل­های “به یاد آوردن” و “به فراموشی سپردن”. در برخی موارد حرف اضافه به مرور زمان حذف شده است، مانند “پا شدن” (بر پا شدن) و “گردن گرفتن” (به گردن گرفتن). این پژوهش با هدف تطبیق ویژگی­ های فعل مرکب در دستور زبان فارسی با شیوه­نامۀ پارسیم با چالش­هایی چون حضور صفات و اسامی غیررویدادی و غیرانتزاعی در جایگاه عنصر غیرفعلی در فارسی (خاموش کردن و مسواک کردن) و همچنین چگونگی برچسب ­زنی افعال مجهول (دعوت شدن، اجاره داده شدن )، ساخت­ های چندلایه (کاهش پیدا کردن)، ساخت­ های استثنایی (خوش آمدن “خوشم می ­آید”)، افعال پیشوندی (برگشتن) و صفات محمولی (فراموش کردن) روبه­ رو بوده است. بر مبنای شیوه­ نامۀ فارسی تنظیم­ شده پیکره­ای متشکل از ۵۶۲۰ ( ۳۶۲۰ جمله از نسخۀ اول پارسیم و ۲۰۰۰ جمله از پیکره فارسی PerUDT که برچسب­های وابستگی مشابهی با پارسیم دارد) برچسب ­زنی و به نسخۀ سوم پارسیم اضافه شد. در همایش UniDive در شهر بوداپست در بهمن­ ماه ۱۴۰۳ گزارشی از روند کار به شکل پوستر ارائه شد:

https://unidive.lisn.upsaclay.fr/lib/exe/fetch.php?media=meetings:general_meetings:3rd_unidive_general_meeting:30_a_corpus_of_persian_sentenc_poster_material.pdf

شرح کامل­تری نیز به زودی به شکل مقاله منتشر خواهد شد.