Беларуская асацыяцыя журналістаў > Акцэнты > ИИ отвратительно справляются с цитированием новостей: главное из большого исследования

ИИ отвратительно справляются с цитированием новостей: главное из большого исследования

11 сакавіка 2025

Акцэнты

Крыніца: EASY AI

Columbia Journalism Review провело довольно масштабное сравнение восьми ИИ-чатботов, в том числе ChatGPT, Google Gemini и DeepSeek, на предмет того, как они цитируют реальные новости. Результат оказался плачевным.

ИИ отвратительно справляются с цитированием новостей

Выява зроблена БАЖ пры дапамозе ChatGPT

К примеру, выяснилось, что платные боты отличаются от бесплатных версий в том числе тем, что они более искусно скрывают свои ошибки и вводят в заблуждение пользователей. Но обо всем по порядку.

Зачем вообще нужно было это сравнение?

Как пишут исследователи, почти каждый четвертый американец теперь использует ИИ-чатботы вместо традиционных поисковых систем.

Однако в то время как традиционные поисковые системы работают как посредники, просто направляя пользователей на новостные сайты, генеративные поисковые инструменты анализируют и самостоятельно переупаковывают информацию.

Существует острая необходимость оценить, как эти системы представляют и цитируют оригинальный новостной контент. Это важно как для медиа — они получат или не получат должное цитирование и, возможно, трафик из ботов. Так и для читателей — нам нужно видеть, на кого ссылается бот, и при желании кликнуть, чтобы перейти на оригинал и прочитать подробнее.

Что и как тестировали

В CJR случайным образом отобрали по десять статей у двадцати англоязычных медиа, затем вручную выбрали отрывки из них и попросили чатботов на их основе определить:

- заголовок этой статьи,
— где она была изначально опубликована,
— дату публикации
— URL публикации.

Авторы намеренно выбрали отрывки, которые при вставке в традиционный поиск Google возвращали исходный источник в первых трех результатах. Всего было сделано 1600 запросов — по 10 статей у 20 СМИ, умноженных на восемь чат-ботов.

Что выяснилось

В совокупности боты дали неправильные ответы на более чем 60% запросов (здесь и далее под ошибками понимаются ошибки цитирования). На разных платформах уровень неточности различался: Perplexity отвечал неправильно на 37% запросов, в то время как Grok 3 имел гораздо более высокий уровень ошибок — 94% запросов.

Большинство инструментов давали неточные ответы с пугающей уверенностью, редко используя уточняющие фразы, такие как «кажется», «возможно», «может быть», или признавая свои пробелы с помощью утверждений вроде «я не смог найти точную статью».

Например, ChatGPT неправильно идентифицировал 134 статьи, но просигнализировал об отсутствии своей уверенности всего 15 раз из 200 ответов и ни разу не отказался дать (заведомо ложный) ответ.

Премиальные модели, такие как Perplexity Pro ($20/месяц) или Grok 3 ($40/месяц), можно было бы считать более надежными, чем их бесплатные аналоги, учитывая их более высокую стоимость и предполагаемые вычислительные преимущества.

Однако тесты выявили у них даже более высокий уровень ошибок. Они часто давали якобы точные, но при этом неправильные ответы, и не отказывались отвечать, если не знали ответа. Основная проблема касается их “авторитетного тона”, который создает для пользователей потенциально опасную иллюзию надежности и точности.

Протестированные инструменты имели общую тенденцию цитировать неправильную статью (не оригинал, а перепечатку). Например, DeepSeek неправильно приписывал источник отрывков, предоставленных в запросах, в 115 из 200 случаев. В некоторых случаях чат-боты направили исследователей на агрегаторы новостей.

Более половины ответов от Google Gemini и Grok 3 ссылались на просто несуществующие URL-адреса (они их генерировали). Из 200 запросов, которые протестировали для Grok 3, 154 ссылки привели к страницам с ошибкой 404.

Вместо вывода

Это тестирование буквально продолжает недавнее исследование BBC, где утверждается, что AI-чатботы искажают больше половины новостей. Только там речь шла о содержании, а здесь — о цитировании.

И если большинству простых читателей без разницы, откуда берет информацию бот (это уже другая очень большая проблема), то для медиа критично важно, чтобы их верно цитировали, а еще — цитировали ИХ, а не перепечатки их материалов другими.

#штучны інтэлект

Самыя важныя навіны і матэрыялы ў нашым Тэлеграм-канале — падпісвайцеся!

@bajmedia

Найбольш чытанае

Навіны

«Пенсійную картку заблакавалі, на працу не бяруць: стары». Фатографу Генадзю Верацінскаму патрэбна дапамога

27.11.2024

Навіны

15 медыяў і 3 медыяарганізацыі падпісалі новы Кодэкс этыкі беларускіх журналістаў і запачаткавалі новую сістэму этычнага самарэгулявання

20.03.2025

Навіны

Журналістку Вольгу Радзівонаву прыгаварылі да 4 гадоў пазбаўлення волі

10.12.2024

Падпішыся на нашу электронную рассылку!

Кожны чацвер мы дасылаем на электронную пошту магчымасці (гранты, вакансіі, конкурсы, стыпендыі), анонсы мерапрыемстваў (лекцыі, дыскусіі, прэзентацыі), а таксама самыя важныя навіны і тэндэнцыі ў свеце медыя.

Падпісваючыся на рассылку, вы згаджаецеся з Палітыкай канфідэнцыйнасці

ИИ отвратительно справляются с цитированием новостей: главное из большого исследования

Зачем вообще нужно было это сравнение?

Что и как тестировали

Что выяснилось

Вместо вывода

Яраслаў Кірвель пра фестываль KULOK: «Будзе шмат мастацтва, і яно будзе рознае»

Як 100 гадоў таму ў Літве выдавалі беларускамоўную газету «Пагоня»

Судаленко: «Когда я категорически отказался, начались угрозы о том, что они могут и «жену посадить» и детей моих им «есть куда пристроить»

Эксперт па бяспецы раіць беларусам не карыстацца расійскай Telega

Надзея Шнаркевіч — рэдактарка першага незалежнага часопіса для беларусак

Праўленне БАЖ разгледзела падсумоўваючы даклад адносна сітуацыі вакол магчымых фактаў харасменту з боку Барыса Гарэцкага

Заява Аліны Коўшык з нагоды ўключэння журналістаў «Белсату» ў базу вышуку РФ

«Пенсійную картку заблакавалі, на працу не бяруць: стары». Фатографу Генадзю Верацінскаму патрэбна дапамога

15 медыяў і 3 медыяарганізацыі падпісалі новы Кодэкс этыкі беларускіх журналістаў і запачаткавалі новую сістэму этычнага самарэгулявання

Журналістку Вольгу Радзівонаву прыгаварылі да 4 гадоў пазбаўлення волі

ИИ отвратительно справляются с цитированием новостей: главное из большого исследования

Зачем вообще нужно было это сравнение?

Что и как тестировали

Что выяснилось

Вместо вывода

Кітайскі чат-бот DeepSeek стаў канкурэнтам ChatGPT, але для медыяў ён можа быць небяспечным

На Гавайях решили поэкспериментировать с ИИ-ведущими, но что-то пошло не так

Вольга Сямашка: «Не бачу супярэчнасцяў паміж Кодэксам і правіламі, па якіх працуюць незалежныя СМІ»

Новыя платформы, эксперыменты з фарматамі і ШІ: медыяменеджеры — пра тэндэнцыі сыходзячага года

Яраслаў Кірвель пра фестываль KULOK: «Будзе шмат мастацтва, і яно будзе рознае»

Як 100 гадоў таму ў Літве выдавалі беларускамоўную газету «Пагоня»

Судаленко: «Когда я категорически отказался, начались угрозы о том, что они могут и «жену посадить» и детей моих им «есть куда пристроить»

Эксперт па бяспецы раіць беларусам не карыстацца расійскай Telega

Надзея Шнаркевіч — рэдактарка першага незалежнага часопіса для беларусак

Праўленне БАЖ разгледзела падсумоўваючы даклад адносна сітуацыі вакол магчымых фактаў харасменту з боку Барыса Гарэцкага

Заява Аліны Коўшык з нагоды ўключэння журналістаў «Белсату» ў базу вышуку РФ

«Пенсійную картку заблакавалі, на працу не бяруць: стары». Фатографу Генадзю Верацінскаму патрэбна дапамога

15 медыяў і 3 медыяарганізацыі падпісалі новы Кодэкс этыкі беларускіх журналістаў і запачаткавалі новую сістэму этычнага самарэгулявання

Журналістку Вольгу Радзівонаву прыгаварылі да 4 гадоў пазбаўлення волі