Home
raspberry, setelogia, людмила кудрявцева, сетелогия, caricatura.ru

May 2008

S M T W T F S
    123
45678910
11121314151617
18192021222324
25262728293031

Tags

Powered by LiveJournal.com
raspberry, setelogia, людмила кудрявцева, сетелогия, caricatura.ru

У Windows Live появился онлайн-переводчик

Microsoft наконец реализовала аналог Google Translate, запущенного в мае этого года. Windows Live Translator пока работает в бета-версии, но уже с теми же 12 языками, что и Google.

Онлайн-переводчики пока сохраняют у рунетовских пользователей статус игрушек, которые забавно коверкают предложенные им куски текста. Переводы действительно далеки от вразумительности, поэтому сравнивать транслейторы достаточно сложно. Я предложила продуктам Google и Microsoft для перевода кусок текста из "Ежика в Тумане". Текст не слишком сложный, на английский его способен перевести средний школьник.

Над рекой поднялся туман, и грустная белая лошадь утонула в нем по грудь, и теперь казалось - большая белая утка плывет в тумане и,отфыркиваясь, опускает в него голову. Ежик сидел на горке под сосной и смотрел на освещенную лунным светом долину, затопленную туманом. Красиво было так, что он время от времени вздрагивал: не снится ли ему все это? Расскажу - не поверят!" - подумал Ежик, и стал смотреть еще внимательнее, чтобы запомнить до последней травинки всю красоту. И он стал медленно спускаться с горы, чтобы тоже попасть в туман и посмотреть, как там внутри. - Вот, - сказал Ежик. - Ничего не видно. И даже лапы не видно. - Лошадь! - позвал он. Но лошадь ничего не сказала. "Где же лошадь?" - подумал Ежик. И пополз прямо. Вокруг было глухо, темно и мокро, лишь высоко сверху сумрак слабо светился.


Перевод :

The fog rose above the river, and sad white horse sank in it on the breast, and now it seemed - large white duck will swim in the fog and, [otfyrkivayas], is lowered in it head. Hedgehog sat on the hill under the pine tree and looked at the illuminated by moonlight valley, flooded by fog. There was beautifully so that it from time to time it shuddered: does not dream to it all this? I will describe - they will not believe! “ - thought hedgehog, and it began to look still more attentive in order to memorize entire beauty to the last blade of grass. And it began to slowly get down from the mountain in order also to fall into the fog and to look as there inside. - Here, said hedgehog. - One can see nothing. And even paw evidently. - Horse! - it called. But horse said nothing. “Where horse?” - thought hedgehog. And it crawled directly. It was all around blind, dark and wet, is only highly on top dusk weakly shone.


перевод от Google
Smoke rose above the river, and the sad white horse drowned in it on the chest, and it seemed a great white duck sailing in the fog and otfyrkivayas, lowering its head. Software sitting on the hump of pine and looked at the moon illuminated light valley flooded fog. It was so beautiful that he occasionally vzdragival: Is it not dreaming all this? Tell not believe! "Ezhik thought, and became even closer look to the past to remember all the beautiful grass. And he has slowly down from the mountains to also enter the fog and see how it inside. - Here, "said Ezhik . - No visible. And even begins is not visible. - A horse! - called it. But the horse did not say. "Where is the horse?" - Ezhik thought. And popolz directly. The debate was rigidly, dark and wet, only highly top Love little glowed.


Пытаюсь анализировать. Не пинайте сильно, последний раз я была лингвистом в 9-11 классах.

  • Microsoft очень часто игнорирует артикли

  • У Microsoft проще язык, и перевод за счёт этого выигрывает, получаясь понятнее. Зато у Google больше словарный запас, и перевод получается худоджественнее.

  • Microsoft помечает непереведенные слова скобками, а Google маскирует транслитом

  • Но у Google не бывает столь бредовых конструкций, как "is lowered in it head"

  • Google перевел "ежик" как "software" - что это вообще?? Дальше "ежик" - это Ezhik. У Microsoft - Hedgehog. C маленькой буквы. Можно решить, что Microsoft знает слово "ежик", а Google - нет. А можно понять так, что Google докадался, что Ёжик - это герой произведения, и его имя не надо переводить, а Microsoft тупо перевел

  • Microsoft перевел "вздрагивал", а Google - нет

  • Перевод фразы "расскажу - не поверят": Google - просто перевел оба слова, получилось "Tell not beleive"
    Microsoft уловил смысл: "I will describe - they will not believe!"

  • Дальше вообще триумф мелкомягких: совершенно осмысленный пассаж "I will describe - they will not believe! “ - thought hedgehog, and it began to look still more attentive in order to memorize entire beauty to the last blade of grass" против кучки несвязанных слов "Ezhik thought, and became even closer look to the past to remember all the beautiful grass".

  • Но в то же время перевод вопроса "Где лошадь"? дает совершенно обратную картину: "Where horse", - тупо перечисляет слова Microsoft. "Where is the horse?", - справляется с заданием для третьеклассника Google.


в общем, во мне в ходе тестов зародилось чисто субъективное ощущение, что Microsoft переводит с русского на английский лучше Google.

Попробуем обратно.
Берем с англоязычной Википедии статью "Москва".
Moscow is the capital of Russia and the country's economic, financial, educational, and transportation centre. It is located on the Moskva River in the Central Federal District, in the European part of Russia. Moscow is the most populous city in Europe, whose population constitutes about 7% of the total Russian population. Historically, it was the capital of the former Soviet Union and the Grand Duchy of Moscow, the pre-Imperial Russian state. It is the site of the Kremlin, which now serves as the ceremonial residence of the President of Russia. Moscow also remains a major economic centre and is home to a large number of billionaires; it was recently named for the second consecutive year the most expensive city in the world. It is home to many scientific and educational institutions, as well as numerous sport facilities. It possesses a complex transport system that includes the world's busiest metro system, which is famous for its architecture.


Имеем следующее:

Google:
Москва - столица России и в стране экономических, финансовых, образовательных, транспортных и центра. Он расположен на Москву реку в Центральный федеральный округ, в европейской части России. Москва - самый густонаселенный город в Европе, население которого составляет около 7% от общего населения России. Исторически он был столицей бывшего Советского Союза и Великого княжества Московского, до Имперского российского государства. Это сайт Кремля, который в настоящее время выступает в качестве вечернего резиденцией Президента России. Москва остается основным экономическим центром и находится большое число миллиардеров; Было недавно именем уже второй год подряд самым дорогим городом в мире. Здесь проживает множество научных и учебных заведений, а также многочисленные спортивные объекты. Он обладает сложной транспортной системы, включающей в мире метро оживленных систему, которая славится своей архитектурой.



Microsoft:
Москва столица Россия и центра страны хозяйственных, финансовохозяйственных, воспитательных, и перевозки. Оно расположено на реке Moskva в центральном федеральном округ, в европейской части Россия. Москва большинств многолюдный город в европе, населенность которой образовывает _ около 7 полной русской населенности. Исторически, было столицей бывшего Советского Союза и великого герцога Москва, pre-Имперского русского положения. Это место Кремль, которое теперь служит как церемониальная резиденция президента Россия. Москва также остает главным хозяйственным центром и домашнее к большое количество миллиардеров; оно недавно было названо на второй последовательный год самый дорогий город в мире. Оно домашн к много научной и образовательным учреждениям, также, как многочисленнNp средства спорта. Оно обладает сложной транспортной системой которая включает систему метро мира самую многодельную, которая известна для своего зодчества.


Итого: Google порвал Microsoft на ленточки. Особенно порадовало третье предложение. Не должно смущать и то, что оригинальный текст сам выглядит как перевод с русского на английский: он грамматически правилен и вообще аутентичен языку, что и требовалось.

В качестве финального аккорда предложим эти тексты Промту, который на сегодняшний день наше рунетовское всё.

"Ёжик" превращается...
Above the river the fog has risen, and the sad white horse has sunk in it on a breast, and now it seemed - the greater white duck floats in a fog and, отфыркиваясь, lowers in it a head. The hedgehog sat on a hill under a pine and looked at the valley shined by a moonlight flooded by a fog. It was beautiful so, that it from time to time shuddered: whether all this dreams it? I Shall tell - will not believe! " - the Hedgehog has thought, and began to look even more closely to remember up to last blade all beauty. And it became slowly


... превращается ёжик... До таких сложностей, как "has risen" и "has sunk" ни один из предыдущих учаснегов не додумался. "lowers in it a head" - еще одна вариация, не менее замороченная, чем у Google, и не более понятная. Но в целом текст создает впечатление связного и даже читается.

Как насчёт английского?
Москва - капитал России и страны, экономической, финансовой, образовательной, и центра транспортировки. Это расположено на Московской Реке в Центральном Федеральном округе, в европейской части России. Москва - самый густонаселенный город в Европе, население которой составляет приблизительно 7 % полного российского населения. Исторически, это был капитал прежнего Советского Союза и Великое Герцогство Москвы, предимперского российского государства. Это - участок Кремля, который теперь служит церемониальным местом жительства президента России. Москва также остается главным экономическим центром и является родиной большого количества миллиардеров; это было недавно названо по имени в течение второго последовательного года самый дорогой город в мире. Это является родиной многих научных и образовательных учреждений, так же как многочисленных спортивных средств обслуживания. Это обладает сложной транспортной системой, которая включает всемирную самую занятую систему метро, которая является известной ее архитектурой.

Ужас. Оно не знает слово "столица". Но всё же получше, чем у Microsoft, особенно вторая половина текста.

В общем, качество перевода у отечественной разработки явно посерьёзнее. Зато предыдущие две послушно переводят всё, что дадут, а вот Промт очень хочет, чтобы за всю полноту сервиса вы принесли ему денег. Ну или хотя бы зарегистрировались. Пока юзер этого не сделает, переводить ему будут по паре предложений за раз.

Comments

спасибо за пост!
по-моемц тоже промт сильнее их, что радует - все-таки наши разработчики :-)
Еще бы, 13 лет люди работали :)
Клево!
Поучительно.

Вот какой интересный момент обнаружил:

Гугль перевел "Moscow is the most populous city in Europe, whose population constitutes about 7% of the total Russian population. Historically, it was the capital of the"

следующим образом:

"Москва - самый густонаселенный город в Европе, население которого составляет около 7% от общего населения России. Исторически он был столицей бывшего Советского Союза и Великого княжества Московского"

То есть он нашел для "Historically it was..." контекст безличного "it" и правильно сказал, что это "он", "город".

Поразительно...

На самом деле, если бы было переведено как "она" - Москва, я бы действительно поверила в искусственный интеллект :)) А "он" - это дефолтовая форма местоимения (м.р. ед.ч.)
Ну а вы посмотрите, как остальные перевели:

* Исторически, было столицей ...
* Исторически, это был капитал прежнего Советского Союза

Микрософт например перевел it как средний род. Промпт - вообще тупо сказал "это"

а Гугль понял, что it это не "это" а именно "он".
всё познается в сравнении :)
Но я пока придерживаюсь вывода о том, что однозначно лучшего среди Google и MS назвать нельзя.

(Anonymous)

ААА! Я сейчас моск сломаю! Как! Ну как вам удалось перевести текст с английского на русский в Windows Translator, если там в списке нет пары английский-русский!

Спасибо за внимание.
Там есть пара "русский-английский". Обратной действительно уже нет.
Значит, они её куда-то зачем-то дели. И меня это даже не удивляет.
Но в те далекие времена, когда писался пост, она была. В этом я вам зуб даю.

(Anonymous)

Спасибо, значит я в порядке)
Вы подтвердили мои догадки.

>И меня это даже не удивляет
Хм.. И почему же? Зачем прятать именно эту пару.
Ну не вижу я в этом особого смысла.
да я тоже не вижу смысла. Но когда нечто под лейблом "Microsoft" ведет себя странно - мне это кажется привычным :)