Сохранен 7
https://2ch.su/b/res/332897434.html
К сожалению, значительная часть сохранённых до 2024 г. изображений и видео была потеряна (подробности случившегося). Мы призываем всех неравнодушных помочь нам с восстановлением утраченного контента!

Мысли?

 Аноним 10/05/26 Вск 19:03:47 #1 №332897434 
1778429027315.jpg
Мысли?
sage[mailto:sage] Аноним 10/05/26 Вск 19:07:13 #2 №332897566 
ученые КНДР научили компьютер распознавать ботохуету по тексту

Мысли?
Аноним 10/05/26 Вск 19:08:43 #3 №332897618 
>>332897566
>ученые КНДР
Твои протыки?
Аноним 10/05/26 Вск 19:10:31 #4 №332897680 
>>332897434 (OP)
Коротко: звучит громко, но это не «магия», а старая тема в NLP — автоматическое определение гендера автора по стилю письма (author profiling). Этим занимаются лет 15+.
Что реально стоит за такими новостями
Компьютер не «понимает пол». Он ищет статистические языковые паттерны:


частота местоимений


длина предложений


эмо-лексика


использование уменьшительно-ласкательных форм


пунктуация, эмодзи


темы и словарь


По огромным корпусам текстов модель учится угадывать вероятности.
Это примерно как:

«По почерку можно предположить возраст и характер» — только в цифрах.

Насколько это работает
В академических работах обычно:


70–85% точность на «чистых» данных


но резко падает в реальной жизни


Почему падает:


женщины и мужчины пишут очень по-разному внутри групп


стиль зависит от возраста, профессии, соцсетей, культуры


тексты можно легко «замаскировать»


Т.е. модель угадывает не биологический пол, а социальные и культурные паттерны письма.
Главный подвох таких новостей
Журналисты пишут «определяет пол человека», а корректнее:

«угадывает вероятность гендера автора по стилю текста в обученной выборке».

Это огромная разница.
Ограничения и спорные моменты


Стереотипы
Модель учится на данных → данные содержат культурные стереотипы.


Легко обмануть
Попроси LLM переписать текст — точность резко падает.


Не универсально
Работает хуже:


на коротких текстах


на технарях 😄


на формальном стиле


на людях, пишущих «нейтрально»




Этический вопрос
Использование для HR/модерации — очень спорно.



Мой вывод
Это не прорыв, а очередная вариация задачи author profiling + хороший PR заголовок.
Если убрать хайп, новость переводится так:

«Сделали классификатор текста с вероятностным угадыванием гендера».
Аноним 10/05/26 Вск 19:10:56 #5 №332897696 
>>332897434 (OP)
Почему только пол? А целого когда научатся?
Аноним 10/05/26 Вск 19:27:30 #6 №332898223 
>>332897434 (OP)
Заебись было бы иметь детектор сельдей
Аноним 10/05/26 Вск 19:36:54 #7 №332898526 
1673589587714.jpg
>>332897434 (OP)
Ты пидр.
мимокомп
comments powered by Disqus