Два года назад компания Google представила новый поисковый алгоритм BERT для лучшей обработки запросов на разных языках. С помощью нейронной сети алгоритм анализирует не отдельные слова, а предложения целиком, что существенно улучшает релевантность выдачи. Оказалось, что на базе BERT можно создать крайне эффективного ИИ-цензора, чем воспользовались китайские разработчики.
Как известно, китайский сегмент интернета отличается высокой степенью цензуры. Сложность китайского языка и различные ухищрения пользователей не позволяют эффективно использовать для цензуры традиционные алгоритмы поиска «крамольных» публикаций. Например, поиск по ключевым словам достигает точности 70 %, а точность обученной людьми нейросети приближается к 80 %. Новая китайская разработка с элементами ИИ на алгоритме BERT даже без обучения позволяет повысить точность обнаружения подлежащих цензуре текстов до 91 %.
Алгоритм Google BERT с открытым кодом не может анализировать тексты длиной более 512 слов. Чтобы обойти это ограничение разработчики из Шэньянского университета Лигун и Китайской академии наук разработали алгоритм для разбивки больших текстов на доступные для анализа с помощью BERT и технологию последующей сборки текстов до первоначального объёма. Получилось решение, которое может искать даже скрытый между строк подтекст.
Сегодня в Китае для обеспечения цензуры в интернете — для поиска содержимого от аморального и террористического до нападок на коммунистическую партию и строй в стране — работает огромная армия цензоров-людей. Это колоссальная статья расходов. Искусственный интеллект приближается к тому, чтобы не только заменить всё это на машинный анализ, но также обещает буквально не захлебнуться в растущем потоке данных, с чем люди просто не справятся.
>>9782802 (OP) Какие же молодцы Китайцы. Всё делают ради того чтобы юные граждане не сидел 24/7 в интернетах, а занимались учебой и улучшали жизнь в собственной стране. Горжусь Китаем.
Вот бы все страны так поступали. Есть на белом свете ещё страна не куколдов, а нормальных, традиционных людей, которые сражаются за всё хорошее и против всего плохого. Уважаю.
>>9782848 Какие чипы нахуй? Ты сидишь в интернете со смартфона с геолокацией, пользуешься гуглосервисами, твой ip виден всем, твоя история торрент-скачиваний и раздач фиксируется на специальном сайте и опять же видна всем.
Условно говоря, чип настолько глубоко в твоей жопе, что ты его никак не вытащишь.
>>9782802 (OP) > ВСЁ ШТО ДЕЛАЮТ КЛЯТЫЕ ПИНДОСЫ ПРОТИВНО НАШЕМУ СВЕТЛОМУ КОММУНТИСТИЧЕСКОМУ ОБЩЕСТВУ > НИ ОДНА ГРЯЗНАЯ МЫСЛЬ ИЗ ИХ ЗАМУСОРЕННЫХ ГОЛОВ НЕ МОЖЕТ ЗАИНТЕРЕСОВАТЬ НАСТОЯЩЕГО КИТАЧАНИНА > КРОМЕ НЕРОЙНОЧКИ, НЕЙРОНОЧКУ ОСТАВТЬЕ, НАМ ПРИГОДИТЦО
>>9782876 >с геолокацией Отключена. >пользуешься гуглосервисами Не пользуюсь. >твоя история торрент-скачиваний и раздач фиксируется на специальном сайте и опять же видна всем Попробовал только в нулевых пару раз и всё, больше не использовал. мимо
>>9782995 > Отключена. > Не пользуюсь. > Попробовал только в нулевых пару раз и всё, больше не использовал. Наивный пиздец.
Ну, даже если ТЫ ОТКЛЮЧИЛ (лол) всё это, то у тебя остался ИНТЕРНЕТ на твое имя + сим карта на ТВОЕ имя, а даже если и не на твое, то пилинг всё равно приведет к ТЕБЕ домой. А ещё ты наверное пользуешься картой сбера или прочей фигни, А ОНИ тоже сливают данные о тебе. Кстати, а ты знал, что Абу тоже сливает все твои данные? Как и любой сайт, который имеет ру-контингент. Закон их обязывает это делать.
>>9783032 Можно проверить логи. >>9783059 >у тебя остался ИНТЕРНЕТ на твое имя Не на моё. >сим карта на ТВОЕ имя Она вообще без имени, лол. >пилинг всё равно приведет к ТЕБЕ домой И как же он приведёт, если я его помещу в клетку Фарадея? >А ещё ты наверное пользуешься картой сбера или прочей фигни Не пользуюсь. >Кстати, а ты знал, что Абу тоже сливает все твои данные? Как и любой сайт, который имеет ру-контингент. Закон их обязывает это делать Со всеми ты конечно переборщил, но кое-какие да. Любой сайт их собирает, если не использовать методы защиты.
>>9783026 >Что за тупость ты написал, китайцы спиздили и использовали всё, что только можно было спиздить и использовать. как и американцы до этого (а ещё японцы и европейцы)
У нас также есть интернет-цензура. Просто в отличие от китайцев, занимаются ей русские васяны из-за чего она обходится даже парой кликов, а не установкой VPN.
Как известно, китайский сегмент интернета отличается высокой степенью цензуры. Сложность китайского языка и различные ухищрения пользователей не позволяют эффективно использовать для цензуры традиционные алгоритмы поиска «крамольных» публикаций. Например, поиск по ключевым словам достигает точности 70 %, а точность обученной людьми нейросети приближается к 80 %. Новая китайская разработка с элементами ИИ на алгоритме BERT даже без обучения позволяет повысить точность обнаружения подлежащих цензуре текстов до 91 %.
Алгоритм Google BERT с открытым кодом не может анализировать тексты длиной более 512 слов. Чтобы обойти это ограничение разработчики из Шэньянского университета Лигун и Китайской академии наук разработали алгоритм для разбивки больших текстов на доступные для анализа с помощью BERT и технологию последующей сборки текстов до первоначального объёма. Получилось решение, которое может искать даже скрытый между строк подтекст.
Сегодня в Китае для обеспечения цензуры в интернете — для поиска содержимого от аморального и террористического до нападок на коммунистическую партию и строй в стране — работает огромная армия цензоров-людей. Это колоссальная статья расходов. Искусственный интеллект приближается к тому, чтобы не только заменить всё это на машинный анализ, но также обещает буквально не захлебнуться в растущем потоке данных, с чем люди просто не справятся.
https://3dnews.ru/1037301/poiskoviy-algoritm-google-pomog-kitaytsam-sozdat-samogo-effektivnogo-iitsenzora-dlya-interneta