The New York Times подає до суду на OpenAI та Microsoft за порушення авторських прав. Газета стверджує, що обидві компанії навчали своїх чат-ботів на мільйонах її статей. Це позбавило видання заробітку на підписках, рекламі та переглядах. Крім того, іноді моделі галюцинують і невірно відтворюють матеріали статей, що підриває довіру до NYT. А ще чат-боти без проблем обходять пейвол.
The New York Times, третє найбільш цитоване джерело в інтернеті, приєдналася до хвилі судових позовів проти розробників штучного інтелекту. Газета вимагає не просто грошову компенсацію — вона хоче, щоб ChatGPT і Copilot видалили весь її контент, тому що великі мовні моделі в їхній основі навчалися на її матеріалах. У позові зазначено, що чат-боти можуть генерувати вихідні дані, які дослівно відтворюють контент NYT, точно резюмують його та імітують його виразний стиль. На думку видавця, це підриває репутацію газети, забирає у неї читачів і позбавляє законного заробітку на своїх матеріалах і рекламі.
Окремо газета скаржиться на здатність чат-ботів обходити пейвол і отримувати доступ до ексклюзивних статей. Її представники стверджують, що це загрожує всім професійним журналістам: за масового використання ШІ люди перестануть читати їхні матеріали та платити за це.
Іноді чат-боти галюцинують, тобто вигадують нереальні факти або спотворюють інформацію. Це відбувається і під час роботи зі статтями: нейромережа може неправильно відтворити зміст матеріалу, який її просять резюмувати. У NYT вважають, що це завдає шкоди їхній репутації: користувачі схильні думати, що помилилися журналісти, а не нейромережа.
Відомо, що раніше OpenAI та Microsoft дійсно використовували статті NYT для навчання своїх моделей, принаймні їхніх ранніх версій, таких як GPT-3.5. Вони навчали їх на наборі даних Common Crawl, до якого входили матеріали газети. Представники видання 8 місяців вели переговори з розробниками, щоб отримати гідну компенсацію за працю, однак не змогли дійти згоди.
Представник OpenAI Ліндсі Гелд так прокоментувала ситуацію виданню the Verge: "Ми поважаємо права творців і власників контенту і прагнемо працювати з ними, щоб гарантувати, що вони отримають вигоду від технологій штучного інтелекту і нових моделей доходу. Наші переговори з New York Times були продуктивними та просувалися конструктивно, тому ми здивовані й розчаровані таким розвитком подій. Ми сподіваємося, що знайдемо взаємовигідний спосіб співпраці, як ми чинимо з багатьма іншими видавцями".