Буйныя выданні пачалі блакаваць Internet Archive з‑за рызыкі плагіяту з боку АІ
Сярод іх — The Guardian і The New York Times.

Фота: Shutterstock
Некалькі буйных выданняў пачалі абмяжоўваць доступ Internet Archive да свайго кантэнту праз асцярогі, што боты кампаній, якія займаюцца распрацоўкай штучнага інтэлекту, могуць выкарыстоўваць вэб-сэрвіс для крадзяжу іх артыкулаў. Пра гэта піша Engadget.
Адно з такіх медыя — The Guardian. Кіраўнік аддзела бізнес-сувязяў і ліцэнзавання выдання Роберт Ган расказаў, што шмат кампаній у сферы ШІ шукаюць лёгкадаступныя і структураваныя базы даных, а прыкладны праграмны інтэрфейс Internet Archive дае ўсё неабходнае для «спампоўкі інтэлектуальнай уласнасці».
Аналагічны крок зрабіла The New York Times. Прадстаўнікі газеты кажуць, што лічбавы архіў Wayback Machine, які дазваляе праглядаць захаваныя копіі вэб-старонак, без дазволу дае неабмежаваны доступ да матэрыялаў NYT, у прыватнасці ШІ-кампаніям.
Доступ да свайго кантэнту таксама абмежавалі выданні Financial Times і сацыяльная платформа Reddit.
Раней журналіст The New York Times падаў у суд на xAI, Anthropic, Google, OpenAI і іншых тэхнагігантаў праз самавольнае выкарыстанне імі кніг, абароненых аўтарскім правам, для навучання сваіх ШІ-мадэляў.
Нагадаем, у кастрычніку 2025 года Internet Archive адзначыў захаванне аднаго трыльёна вэб-старонак, даступных праз сэрвіс Wayback Machine. Гэта найбольшы аб’ём архіваваных матэрыялаў у гісторыі інтэрнэту.
@bajmedia