فارسواژه
مجموعهای از کلمات زبان فارسی است که از ترکیب کلمات زایا، فارسنت، فرهنگ املائی و تعدادی از کلماتی که به صورت دستی وارد و ویرایش شدهاند، تشکیل شده است. این مجموعه شامل حدود ۷۲ هزار کلمه است و به همت دانشجویان آزمایشگاه پردازش زبان طبیعی دانشگاه شهید بهشتی جمعآوری شده است. هر کلمه دارای صورت نوشتاری، صورت آوایی، برچسب مقولهی نحوی، فرکانس، صورت صحیح نوشتاری بودن/نبودن، مرکب بودن/نبودن، مشتق بودن/نبودن، شکل مفرد کلمه در صورت جمع مکسر بودن، میباشد.