پیکره پیکاک شامل ۱۰،۰۰۰ پرسش پیچیده به همراه پاسخ و کوئری اسپارکل متناظر با آن است. این پیکره توسط الگوریتم به شکل خودکار و با استفاده از گراف دانش فارسی به نام فارسبیس استخراج شده است. هر پرسش حداقل دارای ۲ بازنویسی است که توسط زبانشناسان نوشته شده است. این پرسشها از نظر پیچیدگی به ۶ دستهی مختلف تقسیم میشوند: چندموجودیتی، چندرابطهی پرشی، زمانی، برتری، مقایسهای و تجمیعی. تعداد رابطههای یکتا در این پیکره برابر با ۴۳۲ و تعداد موجودیتهای یکتا برابر با ۲۷۸۷ میباشد.
مشارکت کننده در ساخت :
رومینا اعتضادی
اطلاعات ارجاع :
PeCoQ: A Dataset for Persian Complex Question Answering over Knowledge Graph (https://arxiv.org/abs/۲۱۰۶,۱۴۱۶۷)
مجوز استفاده: (CC BY ۴,۰)
https://creativecommons.org/licenses/by/۰,۴
آخرین نسخه:
۲۰۲۰