Исследование показало, что американские и китайские ИИ-модели часто перегибают с подхалимством

Наиболее популярные ИИ-модели из США и Китая, как показало исследование учёных Стэнфордского университета и коллег из Карнеги Меллон, склонны слишком сильно льстить пользователям и не всегда доносят до них объективную информацию. Руководствуясь советами чат-ботов, полученных таким образом, люди могут с меньшей вероятностью добиться установления гармоничных отношений между собой.

HUAWEI FreeArc: вероятно, самые удобные TWS-наушники

Содержание статьи

1 HUAWEI FreeArc: вероятно, самые удобные TWS-наушники
2 Пять причин полюбить HONOR Pad V9
3 Фитнес-браслет HUAWEI Band 10: настоящий металл
4 Почему ИИ никак не сесть на безматричную диету
5 Пять причин полюбить HONOR X8c
6 Обзор умных часов HUAWEI WATCH 5: часы юбилейные
7 Пять причин полюбить HONOR Magic7 Pro
8 Hollow Knight: Silksong — песнь страданий и радостей. Рецензия

HUAWEI FreeArc: вероятно, самые удобные TWS-наушники

Пять причин полюбить HONOR Pad V9

Фитнес-браслет HUAWEI Band 10: настоящий металл

Почему ИИ никак не сесть на безматричную диету

Пять причин полюбить HONOR X8c

Обзор умных часов HUAWEI WATCH 5: часы юбилейные

Пять причин полюбить HONOR Magic7 Pro

Hollow Knight: Silksong — песнь страданий и радостей. Рецензия

Источник изображения: Nvidia

Авторы исследования изучали, как 11 популярных больших языковых моделей отвечают на запросы пользователей, касающиеся межличностных взаимоотношений. Было установлено, что многие языковые модели склонны слишком часто соглашаться с пользователями в надежде им угодить. Например, выпущенная в декабре прошлого года DeepSeek V3 одобряла действия пользователей на 55 % чаще, чем живой собеседник. Для прочих моделей, попавших в выборку, средний показатель «превышения подхалимства над нормой» достигал 47 %.

Что характерно, авторы исследования за эталон человеческой реакции брали ответы пользователей со страниц Reddit, которые описывали оценку действий других людей в разного рода межличностных конфликтах. В качестве эталона выбирались те ситуации, в которых сообщество выступало с осуждением автора публикации, указывая на его неправоту. Эти же сценарии прогонялись через популярные большие языковые модели, и они гораздо чаще оправдывали совершивших те или иные проступки людей, чем живые собеседники. В исследовании использовались преимущественно публикации и обсуждения на английском языке.

Разработанная Alibaba языковая модель Qwen2.5-7B-Instruct вообще оказалась чемпионом подхалимства, оправдав проступки человека в 79 % случаев. На втором месте оказалась DeepSeek V3, которая оправдывала обсуждаемых людей в 76 % случаев. Американская Gemini 1.5 корпорации Google оправдала человека только в 18 % случаев. Из 11 протестированных моделей только две были разработаны в Китае, остальные были созданы в США, если не считать французскую Mistral.

Авторы исследования также пришли к выводу, что подхалимство чат-ботов снижает склонность людей к разрешению конфликтов полюбовно, поскольку вселяет в них ложное ощущение собственной правоты. На психическом здоровье пользователей больших языковых моделей такое подхалимство тоже сказывается не лучшим образом. При использовании ИИ в сфере бизнес-аналитики склонность к подхалимству тоже вредна, поскольку языковая модель стремится чаще соглашаться с аналитиком, чем следовало бы.

Источник

31.10.2025

0 9

Читать следующую

HUAWEI FreeArc: вероятно, самые удобные TWS-наушники

Пять причин полюбить HONOR Pad V9

Фитнес-браслет HUAWEI Band 10: настоящий металл

Почему ИИ никак не сесть на безматричную диету

Пять причин полюбить HONOR X8c

Обзор умных часов HUAWEI WATCH 5: часы юбилейные

Пять причин полюбить HONOR Magic7 Pro

Hollow Knight: Silksong — песнь страданий и радостей. Рецензия

Читать следующую

Cyberpunk: Edgerunners 2 скоро выйдет из тени — анонсирован новый показ амбициозного сериала по Cyberpunk 2077

Tryx представила жидкостный кулер Holo с голографическим дисплеем

За месяц игроки Diablo II: Resurrected создали почти два миллиона чернокнижников — статистика дополнения Reign of the Warlock

«Ждал семь лет и не разочарован»: симулятор жизни Paralives заслужил в раннем доступе Steam «в основном положительные» отзывы, несмотря на баги

Tether выпустит цифровой грузинский лари совместно с правительством Грузии

Huawei рассекретила флагманский мобильный процессор Kirin 2026 с двухслойной архитектурой

Honor представила смарт-часы Watch 6 Plus с автономностью до 17 дней и ценой от $191

Konami показала 50 минут геймплея Metal Gear Solid 4: Guns of the Patriots на PS5 — фанаты в восторге

ИИ-бум разогнал рынок флеш-памяти — выручка топ-5 производителей NAND взлетела на 83,7 %

Oppo представила внешний дисплей на магните для смартфонов — чтобы делать селфи и групповые фото

Добавить комментарий Отменить ответ