ترجمه ماشینی از حوزه های پرکاربرد پردازش زبان طبیعی است که به دلیل ابهامات و پیچیدگی قواعد زبان طبیعی در زبان مبداء و مقصد با مشکلات زیادی روبرو بوده است. البته کارایی ترجمه ماشینی به کارایی پردازش های پایه ای زبان طبیعی مورد استفاده در آن نیز بستگی دارد. ترجمه ماشینی به طور معمول با مفهوم ترجمه یک نوشتار از زبان مبداء به مقصد مطرح می شود. ترجمه گفتار به گفتار با ترکیب مولفه های تبدیل گفتار به نوشتار و نوشتار به گفتار با ترجمه نوشتاری قابل انجام است.

دو گرایش کلی مبتنی بر قاعده و مبتنی بر پیکره در ترجمه ماشینی وجود دارد. در گرایش مبتنی بر قاعده با مطالعات زبانی، پایگاهی از قواعد برای ترجمه ایجاد می شود که به طور معمول پوشش کافی ندارند. همچنین ممکن است، جملات ترجمه شده روان نباشند.در گرایش مبتنی بر پیکره، دانش زبانی مورد نیاز برای ترجمه به صورت ماشینی از پیکره موازی استخراج می شود. پیکره موازی حاوی میلیون ها جمله معادل به دو زبان مبداء و مقصد است.

روش ترجمه آماری در گرایش مبتنی بر پیکره از اوائل دهه نود مورد توجه قرار گرفته است و بیشتر تحقیقات اخیر نیز درباره این روش است. در این روش با یادگیری احتمالات مختلف از پیکره زبانی، جمله خروجی دارای بیشترین احتمال تولید می شود. محصول حاضر یک مترجم آماری فارسی به انگلیسی است که با استفاده از پیکره میزان با حدود یک میلیون جمله در دامنه ادبیات کلاسیک آموزش داده شده است. در مدل آماری این مترجم سعی شده است که تفاوت ترتیب کلمات در دو زبان فارسی و انگلیسی آموزش داده شود.