Я пытаюсь найти хорошее объяснение высокого уровня о том, как работает статистический перевод. То есть, предположим, что у меня есть свод неприсоединившихся английских, французских и немецких текстов, как я могу использовать это для перевода любого предложения с одного языка на другой? Это не то, что я ищу для создания Google Translate сам, но я хотел бы понять, как это работает более подробно.
Я искал Google, но не нашел ничего хорошего, он либо быстро нуждается в передовых знаниях математики, чтобы понять, либо слишком обобщен. Статья в Википедии о SMT, похоже, и то, и другое, поэтому на самом деле это мало помогает. Я скептически отношусь к тому, что это такая сложная область, которую просто невозможно понять без всякой математики.
Может ли кто-нибудь дать или узнать общее пошаговое объяснение того, как работает такая система, ориентированная на программистов (поэтому примеры кода прекрасны), но без необходимости понимать степень математики? Или книга, которая понравится, тоже будет замечательной.
Изменить. Прекрасным примером того, что я ищу, будет SMT, эквивалентный Питер Норвиг замечательная статья о коррекции правописания. Это дает хорошее представление о том, что это касалось написания проверки орфографии, не вдаваясь в детализированную математику по алгоритмам Левенштейна/звука/сглаживания и т.д.