- Сообщения
- 4.590
- Реакции
- 5.049
Tumblr и WordPress вслед за Reddit будут продавать данные пользователей для обучения ИИ.
Компания Automattic, владеющая Tumblr и WordPress, уже ведет переговоры с Midjourney и OpenAI по продаже данных из сообщений пользователей для обучения систем искусственного интеллекта.
В отчете сайта 404 Media, который ссылается на анонимный источник, сказано, что подобные сделки неизбежны.
Automattic уже в ближайшее время должен запустить новую настройку, которая «позволит пользователям отказаться от обмена данными с третьими сторонами, включая компании ИИ».
Однако, судя по внутренним перепискам, компания собрала дамп, содержащий «весь публичный контент Tumblr, опубликованный пользователями между 2014 и 2023 годами» и, как предполагает The Verge, ошибочно - весь контент, добавленный в блоги, как непубличный.
OpenAI и Midjourney пока не комментировали соглашение, а Automattic еще во вторник обнародовала отчет под названием «Защита выбора пользователя», намекающая на партнерство с неназванными компаниями искусственного интеллекта.
«Пока что мы по умолчанию блокируем основные сканеры платформ искусственного интеллекта, в том числе от крупнейших технологических компаний, и обновляем списки, когда запускаются новые — говорится в отчете - Мы будем делиться только общедоступным содержимым, размещенным на WordPress.com и Tumblr от пользователей и сайтов, не изменивших настройки».
Далее компания отмечает, что уже «работает с некоторыми компаниями искусственного интеллекта, планы которых отвечают интересам сообщества».
Как известно, несколько крупных компаний уже заключили соглашение с разработчиками ИИ по предоставлению учебных данных: Reddit, к примеру, имеет годовое соглашение с Google на 60 миллионов долларов, а Shutterstock – с OpenAI.
Вторая новость еще фантастичнее. Open AI заявила, что газета New York Times (NYT) сломала робот ChatGPT, чтобы получить данные для иска об авторских правах.
Компания Open AI обратилась с просьбой в федеральный суд отклонить некоторые элементы иска газеты New York Times по авторским правам. По словам Open AI, NYT «взломала» ChatGPT и другие системы искусственного интеллекта, чтобы система выдавала результаты, нарушающие авторские права.
Open AI отмечает, что таким образом газета якобы хотела получить ложные данные для иска об авторских правах.
Еще в конце прошлого года (27 декабря) американское издание The New York Times подало в суд на компании Microsoft и OpenAI по обвинению в нарушении авторских прав. NYT считает, что инструменты ИИ применяют контент газеты без разрешения редакции.
В ответ производители «думающих» машин перешли к активной обороне. В частности, в компании утверждают, что NYT пыталась воспроизвести свой материал путем «обманчивых подсказок, явно нарушающих условия использования OpenAI».
«Обвинения, указанные в жалобе Times, не соответствуют известным строгим журналистским стандартам. Правда, которая станет известна в ходе этого дела, заключается в том, что Times заплатила кому-то, чтобы сломать продукты OpenAI» - говорят в компании.
Издание Reuters напоминает, что NYT описала в своей жалобе случаи, когда чат-боты OpenAI и Microsoft ответили пользователям присылали почти дословные отрывки материалов газеты.
В то же время Open AI акцентирует, что изданию нужно было бы предпринять «десятки тысяч попыток, чтобы получить крайне аномальные результаты». По заверению разработчиков, в обычных условиях невозможно использовать ChatGPT для предоставления статей New York Times по желанию».