پیکاک شامل پرسش پیچیده به همراه پاسخ و کوئری اسپارکل است.

پیکره پیکاک شامل ۱۰،۰۰۰ پرسش پیچیده به همراه پاسخ و کوئری اسپارکل متناظر با آن است. این پیکره توسط الگوریتم به شکل خودکار و با استفاده از گراف دانش فارسی به نام فارس‌بیس استخراج شده است. هر پرسش حداقل دارای ۲ بازنویسی است که توسط زبان‌شناسان نوشته شده است. این پرسش‌ها از نظر پیچیدگی به ۶ دسته‌ی مختلف تقسیم می‌شوند: چندموجودیتی، چندرابطه‌ی پرشی، زمانی، برتری، مقایسه‌ای و تجمیعی. تعداد رابطه‌های یکتا در این پیکره برابر با ۴۳۲ و تعداد موجودیت‌های یکتا برابر با ۲۷۸۷ می‌باشد.

مشارکت کننده در ساخت : 
رومینا اعتضادی

اطلاعات ارجاع : 

  • PeCoQ: A Dataset for Persian Complex Question Answering over Knowledge Graph (https://arxiv.org/abs/2106.14167)

One Reply to “پیکره پیکاک”