پیکره پیکاک شامل ۱۰،۰۰۰ پرسش پیچیده به همراه پاسخ و کوئری اسپارکل متناظر با آن است. این پیکره توسط الگوریتم به شکل خودکار و با استفاده از گراف دانش فارسی به نام فارس‌بیس استخراج شده است. هر پرسش حداقل دارای ۲ بازنویسی است که توسط زبان‌شناسان نوشته شده است. این پرسش‌ها از نظر پیچیدگی به ۶ دسته‌ی مختلف تقسیم می‌شوند: چندموجودیتی، چندرابطه‌ی پرشی، زمانی، برتری، مقایسه‌ای و تجمیعی. تعداد رابطه‌های یکتا در این پیکره برابر با ۴۳۲ و تعداد موجودیت‌های یکتا برابر با ۲۷۸۷ می‌باشد.
مشارکت کننده در ساخت :
رومینا اعتضادی

اطلاعات ارجاع :

PeCoQ: A Dataset for Persian Complex Question Answering over Knowledge Graph (https://arxiv.org/abs/۲۱۰۶,۱۴۱۶۷)

مجوز استفاده: (CC BY ۴,۰)
https://creativecommons.org/licenses/by/۰,۴
آخرین نسخه:
۲۰۲۰