ИИ стал реже галлюцинировать, но всё ещё уверенно выдаёт ложь за правду

Проблема галлюцинаций, то есть заведомо неверных ответов, которые предоставляют ИИ-модели, по-прежнему актуальна. Хотя ИИ-инструменты стали делать это реже, они всё ещё выдают неточные ответы, при этом подкрепляя их сверхубедительной риторикой, пишет Axios.

Выбираем лучший игровой ноутбук до 100 000 рублей: сравнительное тестирование 7 интересных моделей

Содержание статьи

1 Выбираем лучший игровой ноутбук до 100 000 рублей: сравнительное тестирование 7 интересных моделей
2 Компьютер месяца — май 2026 года
3 Обзор Intel Core Ultra 7 270K Plus — лучший Arrow Lake за полцены
4 Обзор Intel Core Ultra 5 250K Plus, или Как Arrow Lake превратился в «топ за свои деньги»
5 От Ryzen 7 1800X до Ryzen 7 9850X3D: девять лет эволюции AMD в одном тесте
6 Обзор Apple MacBook Neo: удивительно хороший ноутбук с процессором от iPhone
7 72 полёта над Марсом: как Ingenuity пережил зиму, сбои и собственную миссию
8 Линия защиты: обзор виртуальных машин и песочниц для Android

Выбираем лучший игровой ноутбук до 100 000 рублей: сравнительное тестирование 7 интересных моделей

Компьютер месяца — май 2026 года

Обзор Intel Core Ultra 7 270K Plus — лучший Arrow Lake за полцены

Обзор Intel Core Ultra 5 250K Plus, или Как Arrow Lake превратился в «топ за свои деньги»

От Ryzen 7 1800X до Ryzen 7 9850X3D: девять лет эволюции AMD в одном тесте

Обзор Apple MacBook Neo: удивительно хороший ноутбук с процессором от iPhone

72 полёта над Марсом: как Ingenuity пережил зиму, сбои и собственную миссию

Линия защиты: обзор виртуальных машин и песочниц для Android

Источник изображения: Steve A Johnson/unsplash.com

Ложные ответы гораздо сложнее распознать, когда они звучат убедительно. Это растущая проблема, поскольку пользователи всё больше полагаются на ИИ для исследований, медицинских консультаций и других задач.

Исследование Йельской медицинской школы, проведенное в этом месяце, показало, что инструменты для ведения записей с помощью ИИ (ИИ-писцы) могут помочь в медицинской практике, но только в сочетании с профессиональными рецензентами. Участвовавшие в опросе студенты первого курса, которые редактировали свои клинические записи с помощью черновиков, сгенерированных ИИ, отметили, что в записях ИИ часто опускались важные детали, включая продолжительность симптомов. По словам двух третей студентов, эти записи были «полезны в качестве первого черновика», но 21 % отметили, что использование ИИ-писцов «может снизить способность научиться делать хорошие записи».

Согласно исследованию Гарвардского университета, при попытке специалистов Boston Consulting Group выявить ошибки в результатах работы ИИ модель реагировала не раскаянием и исправлением, а «бомбардировкой убеждением», прибегая к различным методам и даже к лести.

Компании в сфере ИИ пытаются уменьшить количество ложных ответов с помощью таких технологий, как генерация с дополненной информацией (RAG), или обоснование ответов релевантными документами и данными, но это всё равно не даёт 100-процентной точности.

В свою очередь, проверка результатов работы ИИ может занять время, сэкономленное при использовании ИИ-инструментов. Как показало опубликованное в марте исследование, сотрудники часто пренебрегают проверкой результатов, сгенерированных ИИ, поскольку мало кто обращает внимание на ошибки.

Источник

31.05.2026

0 14

Читать следующую

Выбираем лучший игровой ноутбук до 100 000 рублей: сравнительное тестирование 7 интересных моделей

Компьютер месяца — май 2026 года

Обзор Intel Core Ultra 7 270K Plus — лучший Arrow Lake за полцены

Обзор Intel Core Ultra 5 250K Plus, или Как Arrow Lake превратился в «топ за свои деньги»

От Ryzen 7 1800X до Ryzen 7 9850X3D: девять лет эволюции AMD в одном тесте

Обзор Apple MacBook Neo: удивительно хороший ноутбук с процессором от iPhone

72 полёта над Марсом: как Ingenuity пережил зиму, сбои и собственную миссию

Линия защиты: обзор виртуальных машин и песочниц для Android

Читать следующую

«Хватит пугать людей» — Дженсен Хуанг раскритиковал апокалиптическую риторику ИИ-отрасли

Графические процессоры Nvidia отправятся на Луну до конца года

Глава игрового бизнеса Amazon убеждён, что кризис памяти приведёт к вымиранию игровых консолей и ПК

В США разгорелись споры между сторонниками и противниками открытых ИИ-моделей

Apple и Micron заставляют администрацию Трампа выбирать: дешёвые iPhone или американские чипы

Samsung и Broadcom заключили соглашение о сотрудничестве в сфере ИИ-чипов на $200 млрд

Google подтвердила, что Pixel 11 станут дороже из-за дефицита памяти

Intel подтвердила возвращение Hyper-Threading в чипах Coral Rapids в 2028 году

Простой ракеты Vulcan обернулся для ULA финансовыми проблемами

Американские технологические компании сократили 140 тыс. человек в 2026 году

Добавить комментарий Отменить ответ