Эти странные новые разумы: Как ИИ научился говорить и что это значит - Кристофер Саммерфилд
Чтобы не отставать, за последние несколько недель Google также выпустила впечатляющий мультимодальный инструмент под названием NotebookLM.[*5] Позиционируемый как «Ваш персональный ИИ-ассистент для исследований», NotebookLM представляет собой инструмент, в который можно загрузить сложный или технический документ (например, научную статью), а он поможет вам в нем разобраться. Самой увлекательной его функцией, безусловно, является «аудиообзор» (audio overview), позволяющий превратить исследовательскую статью в полноценный аудиоподкаст с участием двух синтезированных ведущих, которые в формате оживленного диалога постепенно раскладывают содержание по полочкам на простом и понятном языке. NotebookLM также позволяет «пообщаться с документом», задавая вопросы по тексту ИИ, обученному давать легкодоступные объяснения. Вполне вероятно, что подобные инструменты в ближайшем будущем станут привычной частью работы и учебы.
Эти новые технологические инструменты используют возможности генеративного ИИ — движка больших языковых моделей, о которых идет речь в книге, — для объединения информации из множества источников и модальностей. Это включает в себя создание новых форм синтетического медиаконтента, в том числе аудио и видео, а также расширение сферы действия ИИ за пределы окна чата — непосредственно в операционную систему компьютера. И хотя сегодняшние релизы все еще несколько ограничены и не до конца надежны, они позволяют краем глаза заглянуть в манящее будущее.
Вышли ли возможности ИИ на плато?
Несмотря на эти впечатляющие инновации, за последние десять месяцев возникло подозрение, что ИИ, возможно, «уперся в стену» — что ошеломляющий прежде рост возможностей моделей вышел на естественное плато. В самых разных областях, от ответов на вопросы паб-квизов до написания рабочего программного кода промышленного уровня, системы ИИ, похоже, достигли уровня компетентности и надежности, который превосходит показатели среднестатистического обывателя, но упрямо не дотягивает до уровня заядлых интеллектуалов, профессиональных программистов и прочих человеческих умников, гиков и эрудитов всех мастей. Мы все еще ждем прорыва, когда системы ИИ совершат нечто поистине выдающееся — например, переживут момент озарения, выдав нечто настолько новое, что это явно будет чем-то большим, нежели просто искусная перекомпиляция их обучающих данных. Эта риторика, разумеется, подлила масла в огонь тех негативистских аргументов, с которыми мы столкнулись в третьей части: мол, ИИ — это на самом деле всего лишь маркетинговый трюк, раздуваемый технологическими компаниями, желающими удерживать стоимость своих акций на стратосферно завышенном уровне.
Одна из возможностей заключается в том, что законы масштабирования — прямая зависимость между возможностями модели и её размером — справедливы только в мире, где обучающие данные теоретически безграничны, а мы приближаемся к моменту, когда модели будут обучены буквально на всем объеме цифрового контента, созданного и сохраненного человечеством.[*6] Размер интернета оценить трудно, но количество веб-сайтов исчисляется десятками миллиардов, а общий объем текста, изображений и видео в совокупности составляет, возможно, около 3000 триллионов входных токенов — гигантский, но конечный набор данных для обучения. Как я утверждаю в пятой части, представляется вероятным, что для продолжения неуклонного роста возможностей моделей нам понадобятся новые, более разнообразные и качественные источники человеческих данных. Подобно тому как человеческий ребенок, обучающийся исключительно по роликам на YouTube, знал бы массу полезных вещей, но при этом, вероятно, усвоил бы и весьма эксцентричные идеи, для правильного обучения систем ИИ нам нужно будет предоставить им доступ к тщательно отобранным данным, которые служат учебным материалом для ученых и других специалистов в школах, университетах и на курсах профессиональной подготовки. Разумеется, ИИ-компании это понимают и активно нанимают специалистов с докторской степенью для проведения высококачественных «уроков» для своих моделей.
Вред от ИИ тоже множится
К сожалению, ИИ уже широко используется как во благо, так и во вред. Есть две основные области, в которых злоупотребление ИИ за последний год резко возросло: финансовое мошенничество и неправомерное использование интимных изображений.
К несчастью, ИИ активно применяется для генерации материалов, содержащих сексуализированное насилие над детьми (CSAM), и создания порнографических дипфейков без согласия изображенных лиц. Британский фонд Internet Watch Foundation сообщил в июле 2024 года, что на форумах в даркнете можно найти тысячи созданных ИИ детских порнографических изображений, включая видеоролики, материалы категории А (наиболее тяжкие) и изображения несовершеннолетних публичных персон, например юных актеров.[*7] Еще больше подобных изображений легко доступны в открытом вебе (клирнете) через обычные поисковые системы вроде Google.[*8] В одном из таких случаев юная актриса Кейлин Хейман, звезда диснеевского шоу «Просто плыви по течению», выиграла судебный процесс против жителя Питтсбурга, который использовал её фотографию в двенадцатилетнем возрасте — взятую из её аккаунта в Instagram — для создания порнографического изображения.[*9] Общественное возмущение этим делом помогло заручиться поддержкой недавно принятого в Калифорнии закона, согласно которому создание подобных изображений карается тюремным заключением и штрафом до 100 000 долларов. К счастью, в Великобритании и ЕС материалы CSAM, созданные ИИ, уже находятся вне закона.
Взрослые тоже не застрахованы. Технологии генеративного ИИ, позволяющие менять лица или виртуально «раздевать» людей на фото, множатся, причем подавляющим большинством жертв становятся женщины и девочки. В августе 2024 года в американском судебном иске фигурировали шестнадцать таких сайтов; выяснилось, что за первую половину года их суммарно посетили 200 миллионов раз, а объем рекламы этих ресурсов за тот же период вырос в двадцать четыре раза. Многие обеспокоены тем, что технологические компании способствуют этому виду гендерного насилия — например, системы авторизации от Google, Apple и Discord до недавнего времени можно было использовать для входа на многие из этих сайтов для виртуального «раздевания».[*10] В настоящее время неясно, как предотвратить использование ИИ для подобной вредоносной деятельности, масштаб которой, судя по всему, будет расти как грибы по мере того, как технологии становятся все доступнее.
Использование ИИ для создания синтетического контента также облегчает мошенничество, особенно в финансовом секторе. В мае 2024 года сотрудник гонконгского офиса