GoogleCAT — краткий обзор
Wednesday, June 10th, 2009Посмотрел я на Google Translator Toolkit. Это минималистская переводческая среда (TenT), за которой, однако, стоит опыт Google в машинном переводе.
Работает Toolkit со следующими форматами: HTML, Microsoft Word (.doc), OpenDocument Text (.odt), txt, rtf, возможна загрузка ТМ и термбаз. Поддерживается также прямой импорт страниц из Википедии и Google Knol. Вот для примера я и взял заглавную страницу Википедии.
При загрузке файла на перевод происходит автоматическая сегментация, применение ТМ (видимо, только 100 %-ные совпадения) и машинный перевод. При щелчке по сегменту он выделяется желтым, и открывается всплывающее окно, в котором предложенный перевод можно изменить.
Резюме: в коммерческих целях использовать это не нужно :) Хотя бы потому, что Google упорно переводил все атрибуты HTML-тегов. И обратите внимание на один скромный параметр по умолчанию: If no TM is specified, translated segments are stored in our shared, global TM. То есть по умолчанию все ваши переводы останутся у Google и будут в дальнейшем использоваться в его машинном переводе.
