Провёл небольшое исследование по гугл-переводчику. Писать однотипные "Ааааааоооооо" и переводить с монгольского - совершенно неинтересное и безрезультатное занятие, надоевшее ещё в первый день. Теперь нужно понять, как это работает, как нейросети гугла формируют слова, предложения, как видят наш язык и как выглядит язык их собственный.
— Переводы с армянского, казахского, киргизских языков очень похожие и простые, остальные (всякие бенгальские, панджаби и другие) в основном пересказывают библию. Монгольский язык формирует предложения или непонятным мне сложным, или случайным образом - часто кажется, будто он берет информацию из кэшированных страниц, точно так же, как некоторые языки берут фразы из Библии. — Армянский и казахский вообще одинаково переводятся. Но я использую киргизский, он, как мне кажется, лучше работает с предложениями. — Создается впечатление, что каждое на вид бессмысленное слово - это транслитерация (иногда сокращенная) любого слова любого языка. Например, "пуш" = английское Push = "толкать/нажим", Апа = с киргизского "мама", үч в киргизском = үш в казахском = уш в гугловском = "три". — Некоторые слова складываются между собой логичным образом. Например, "Апа шш" переводится не "мать город", что следовало ожидать, а "побратимы". Но дело в том, что "Апа" иногда переводится как "сестра" или даже "бабушка", а город-сестра - это и есть город-побратим. — Проблема в том, что свой собственный язык Гугл переводит так же, как и остальные - хуево. — Одни и те же слова могут по-разному переводиться сами по себе и в предложениях. На одно слово часто приходится несколько смыслов. Впрочем, как и в реальной жизни. Этот язык скорее интуитивный.
Теперь про отдельные слова и символы. Я использовал киргизский: — "Пе" и "Па" значат "Вы хотите?" и "Это является", можно формировать вопросы и утверждения. — Запятые меняют смысл отдельных слов, но я не уверен, что это будет работать в предложениях. ",,." или ",," перед словом обычно связано с различиями, иногда - с летом. ",,йб" - "разные семьи", ",,шш" - "разные города", "АПА ,,йб" - "мать разных семей". Еще возможно, что при переводе предложений возникает конфликт между ,,. как частью слова и ,,. как пунктуацией. — "цг" - "отсчет по радионавигационной системе, полученный при использовании пространственной волны от ведущей станции и поверхностной волны от ведомой станции", лол. Но в предложениях это никак не использовалось. — Похоже, одиночные буквы практически ничего не значат, или же гугл их не так переводит. Только отдельные варианты. "Ё" - это "кафе, Техас", ъ - "цвет, коричневый". "уш ъ Ё" - "Трехцветный кафе/Техас" или "Три коричневых Техаса". — Потратив пару часов, уже начинаешь понимать основы и составлять простые предложения. Уже можно писать заголовки к порно: "Пе уш аааа апа ъй?" - "Вы хотите три горячей мамы домой?"
Думаю, все свои наработки записал. Давайте же станем первыми людьми, понявшими и выучившими язык пришельцев нейросетей.
Слова в предложениях почти не связаны с отдельными словами. Думаю, надо с каждым словом делать по несколько переводов, вставляя их в предложения, и записывать самые частые варианты.
Ещё проверил переводы транслита, фразы вроде "биг блэк френд" переводятся как "большой черный друг" со многих языков в гугле и со всех языков в яндексе, даже с азиатских. Думаю, буквосочетания вроде "ъй" на самом деле считаются гуглом за транслит иероглифов с какого-то языка.
>>500354 Вроде того. Не игрался с монгольским языком, что ли? Здесь почти то же самое, но более осмысленное. Исследуем, что можем, а потом учим гуглоязык.
"щг" в предложениях переводится как "SCG", но вне предложений - "научный комитет по кооперированию работы геофизических союзов". http://www.perevod-translate.ru/english/s/sc/scg.html Точно так же SCG переводит какой-то левый сайт.
>>500253 Потому что классика "типового" перевода это Библия или Коран. By default многие разработчики переводчиков используют каноничные переводы этих книг как шаблон для проверки.
— Переводы с армянского, казахского, киргизских языков очень похожие и простые, остальные (всякие бенгальские, панджаби и другие) в основном пересказывают библию. Монгольский язык формирует предложения или непонятным мне сложным, или случайным образом - часто кажется, будто он берет информацию из кэшированных страниц, точно так же, как некоторые языки берут фразы из Библии.
— Армянский и казахский вообще одинаково переводятся. Но я использую киргизский, он, как мне кажется, лучше работает с предложениями.
— Создается впечатление, что каждое на вид бессмысленное слово - это транслитерация (иногда сокращенная) любого слова любого языка. Например, "пуш" = английское Push = "толкать/нажим", Апа = с киргизского "мама", үч в киргизском = үш в казахском = уш в гугловском = "три".
— Некоторые слова складываются между собой логичным образом. Например, "Апа шш" переводится не "мать город", что следовало ожидать, а "побратимы". Но дело в том, что "Апа" иногда переводится как "сестра" или даже "бабушка", а город-сестра - это и есть город-побратим.
— Проблема в том, что свой собственный язык Гугл переводит так же, как и остальные - хуево.
— Одни и те же слова могут по-разному переводиться сами по себе и в предложениях. На одно слово часто приходится несколько смыслов. Впрочем, как и в реальной жизни. Этот язык скорее интуитивный.
Теперь про отдельные слова и символы. Я использовал киргизский:
— "Пе" и "Па" значат "Вы хотите?" и "Это является", можно формировать вопросы и утверждения.
— Запятые меняют смысл отдельных слов, но я не уверен, что это будет работать в предложениях. ",,." или ",," перед словом обычно связано с различиями, иногда - с летом. ",,йб" - "разные семьи", ",,шш" - "разные города", "АПА ,,йб" - "мать разных семей". Еще возможно, что при переводе предложений возникает конфликт между ,,. как частью слова и ,,. как пунктуацией.
— "цг" - "отсчет по радионавигационной системе, полученный при использовании пространственной волны от ведущей станции и поверхностной волны от ведомой станции", лол. Но в предложениях это никак не использовалось.
— Похоже, одиночные буквы практически ничего не значат, или же гугл их не так переводит. Только отдельные варианты. "Ё" - это "кафе, Техас", ъ - "цвет, коричневый". "уш ъ Ё" - "Трехцветный кафе/Техас" или "Три коричневых Техаса".
— Потратив пару часов, уже начинаешь понимать основы и составлять простые предложения. Уже можно писать заголовки к порно: "Пе уш аааа апа ъй?" - "Вы хотите три горячей мамы домой?"
Думаю, все свои наработки записал. Давайте же станем первыми людьми, понявшими и выучившими язык пришельцев нейросетей.