تشخیص افعال مرکب نقش مهمی در کیفیت پردازش زبان دارد، زیرا معمولاً این ساختها اصطلاحی هستند و در بسیاری موارد معنای آنها از مجموع معنای اجزا ساخته نمیشود. زبان فارسی تعداد محدودی فعل ساده دارد و بیشتر افعال در این زبان از ترکیب یک عنصر غیرفعلی و یک فعل سبک تشکیل میشوند.
این پژوهش بخشی از برنامۀ پارسیم (PARSEME) است. پارسیم یک گروه پژوهشی بین رشته ای به هدف بررسی واژه های مرکب و ساخت ابزار پردازش برای آنها است. پیکرۀ فعلی پارسیم در نسخه ۳-۱ خود مشتمل بر فعل های مرکب ۲۶ زبان مختلف است. پارسیم یک شیوه نامۀ جهانی دارد، اما تا حدودی دست را برای تفاوتهای بین زبانی باز گذاشته است. در این پژوهش بنا داریم بر مبنای شیوه نامۀ پارسیم یک شیوه نامه برای برچسب زنی افعال مرکب فارسی ارائه دهیم. بر اساس شیوه نامۀ پارسیم فعل مرکب به فعلی گفته میشود که حداقل دو بخش واژگانی داشته باشد، یعنی یک هسته فعلی و یک واژۀ دیگر که از لحاظ نحوی به هسته مرتبط است (ارتباط میتواند به طور مستقیم یا به کمک حرف اضافه برقرار شود). دسته بندی پارسیم برای افعال مرکب به شرح زیر است.
- دسته های جهانی که در همه زبانهای موجود در پیکره وجود دارند:
الف- ساختارهای فعلی دارای فعل سبک
- فعل سبک کاملا از لحاظ معنایی تهی شده باشد.
جزء غیرفعلی یک اسم با معنای انتزاعی است (to make a decision). گاهی یک حرف اضافه رابطه اسم و فعل را برقرار میکند (to come into bloom). اسم میتواند غیرانتزاعی باشد در صورتی که در ساخت معنای رویدادی داشته باشد (to take a shower).
- فعل سبک یک معنای سببی به اسم اضافه کند.
ب- افعال اصطلاحی
در این پیکره افعالی که بیش از دو جزء دارند (to make ends meet) و افعالی که جزء غیرفعلی آنها صفت (to come clean) یا قید (to take it seriously) یا اسم غیرانتزاعی با معنای غیررویدادی (to give a hand) باشد فعل اصطلاحی محسوب میشوند.
- دسته هایی که در بعضی زبانها وجود دارند:
الف- افعال انعکاسی (reflexive): s’évanouir (فعل “غش کردن” در فرانسوی)
ب- ساختار فعل-جزء قیدی (particle):
- جزء قیدی معنا را کاملاً تغییر میدهد
to do in (کشتن)
- جزء قیدی معنایی تقریباً قابلپیشبینی اضافه میکند
To end up (به شکل غیرمنتظرهای به پایان رسیدن)
پ- سایر افعال چندبخشی که یک هسته فعلی واحد ندارند
to drink and drive, to voice act, to short-circuit
شیوهنامه پارسیم را در اینجا ببینید و توضیحات بیشتر را در این مقاله.
در سنت دستوری فارسی نیز فعل مرکب از یک فعل سبک و یک جزء غیر فعلی تشکیل میشود. فعل سبک فعلی است که معنای اصلی خود را تقریباً یا کاملاً از دست داده باشد و جزء غیرفعلی میتواند اسم (انجام دادن)، صفت (دراز کشیدن) یا پیشوند (فراخواندن) باشد. در فعل هایی که جزء غیرفعلی آنها اسم است گاهی یک حرف اضافه ارتباط بین اسم و فعل را برقرار میکند، مانند فعلهای “به یاد آوردن” و “به فراموشی سپردن”. در برخی موارد حرف اضافه به مرور زمان حذف شده است، مانند “پا شدن” (بر پا شدن) و “گردن گرفتن” (به گردن گرفتن). این پژوهش با هدف تطبیق ویژگی های فعل مرکب در دستور زبان فارسی با شیوهنامۀ پارسیم با چالشهایی چون حضور صفات و اسامی غیررویدادی و غیرانتزاعی در جایگاه عنصر غیرفعلی در فارسی (خاموش کردن و مسواک کردن) و همچنین چگونگی برچسب زنی افعال مجهول (دعوت شدن، اجاره داده شدن )، ساخت های چندلایه (کاهش پیدا کردن)، ساخت های استثنایی (خوش آمدن “خوشم می آید”)، افعال پیشوندی (برگشتن) و صفات محمولی (فراموش کردن) روبه رو بوده است. بر مبنای شیوه نامۀ فارسی تنظیم شده پیکرهای متشکل از ۵۶۲۰ ( ۳۶۲۰ جمله از نسخۀ اول پارسیم و ۲۰۰۰ جمله از پیکره فارسی PerUDT که برچسبهای وابستگی مشابهی با پارسیم دارد) برچسب زنی و به نسخۀ سوم پارسیم اضافه شد. در همایش UniDive در شهر بوداپست در بهمن ماه ۱۴۰۳ گزارشی از روند کار به شکل پوستر ارائه شد:
شرح کاملتری نیز به زودی به شکل مقاله منتشر خواهد شد.