پیکاک شامل پرسش پیچیده به همراه پاسخ و کوئری اسپارکل است.
پیکره پیکاک شامل ۱۰،۰۰۰ پرسش پیچیده به همراه پاسخ و کوئری اسپارکل متناظر با آن است. این پیکره توسط الگوریتم به شکل خودکار و با استفاده از گراف دانش فارسی به نام فارسبیس استخراج شده است. هر پرسش حداقل دارای ۲ بازنویسی است که توسط زبانشناسان نوشته شده است. این پرسشها از نظر پیچیدگی به ۶ دستهی مختلف تقسیم میشوند: چندموجودیتی، چندرابطهی پرشی، زمانی، برتری، مقایسهای و تجمیعی. تعداد رابطههای یکتا در این پیکره برابر با ۴۳۲ و تعداد موجودیتهای یکتا برابر با ۲۷۸۷ میباشد.
مشارکت کننده در ساخت :
رومینا اعتضادی
اطلاعات ارجاع :
- PeCoQ: A Dataset for Persian Complex Question Answering over Knowledge Graph (https://arxiv.org/abs/2106.14167)
درخواست این پیکره داده را دارم