Мы ищем механизм машинного перевода с открытым исходным кодом, который может быть включен в наш рабочий процесс локализации. Мы рассмотрим следующие варианты:
Среди них Моисей имеет самую широкую поддержку сообщества и опробован многими компаниями и исследователями локализации. Мы фактически склоняемся к Java-движку, так как наши приложения все на Java. Кто-нибудь из вас использовал Joshua или Phrasal как часть вашего рабочего процесса. Не могли бы вы поделиться с ними своим опытом? Или, Моисей слишком далеко опережает их с точки зрения возможностей, которые он предоставляет, и легкости интеграции.
И мы требуем, чтобы двигатель поддерживал:
- Обучение, связанное с конкретным доменом (т.е. оно должно поддерживать отдельные таблицы фраз для каждого домена, к которому принадлежат входные данные).
- Инкрементальное обучение (т.е. избегание переучивания модели с нуля каждый раз, когда мы хотим использовать некоторые новые учебные данные).
- Распараллеливание процесса перевода.