فارس‌واژه

مجموعه‌ای از کلمات زبان فارسی است که از ترکیب کلمات زایا، فارس‌نت، فرهنگ املائی و تعدادی از کلماتی که به صورت دستی وارد و ویرایش شده‌اند، تشکیل شده است. این مجموعه شامل حدود ۷۲ هزار کلمه است و به همت دانشجویان آزمایشگاه پردازش زبان طبیعی دانشگاه شهید بهشتی جمع‌آوری شده است. هر کلمه دارای صورت نوشتاری، صورت آوایی، برچسب مقوله‌ی نحوی، فرکانس، صورت صحیح نوشتاری بودن/نبودن، مرکب بودن/نبودن، مشتق بودن/نبودن، شکل مفرد کلمه در صورت جمع مکسر بودن، می‌باشد.