Среди призраков. Рассуждение об эпохе метавселенной и генеративного искусственного интеллекта - Эрик Саден
Это не язык
Аура, которой наделен HAL – электронный мозг космического корабля в фильме «2001 год: Космическая одиссея», – зависит как от его кажущегося безграничным умения контролировать разом все параметры при управлении полетом и условиями жизни на борту, так и еще от одного качества, быть может более впечатляющего: он умеет говорить. Поддерживать связный и непринужденный разговор с членами экипажа, понимать их, давать им советы, улавливать эмоции и порой проявлять пугающую разумность. Он даже умеет украдкой (по движению губ) распознавать содержание их разговоров, чтобы в итоге манипулировать астронавтами. А какие непревзойденные качества отражены в его голосе, исполненном невозмутимости, знания дела, источающем чуть ли не дух превосходства, – это неизбежно внушает персонажам и зрителям ощущение чего-то необъяснимо-тревожного, смутный страх. Фильм Стенли Кубрика вышел в 1968 году – в то время подобный машинный язык казался запредельной мечтой.
Да, разработки уже велись (в основном под влиянием кибернетики, которая в конце 1950-х годов заявила, что едва ли не все когнитивные операции, совершаемые человеком, в конце концов смогут выполнять различные системы, да еще во сто крат быстрее и надежнее). С самого начала в них участвовали инженеры, программисты, математики, лингвисты. И все равно казалось, что выйти на уровень искусственного обращения со словом никак не получится. Вот почему решалась более скромная задача – разработка методов индексации, призванных находить в базах данных массивы информации по ключевым словам. Потребность в этом становилась все более настоятельной по мере цифровизации общества. И тем более выросла, как только всюду распространился интернет и появились первые поисковые системы. В тот же период направление автоматического перевода испытало качественный скачок; однако тогда еще системам было сложно учитывать все тонкости языка – такие, как контекстуализация лексики или смысловая неоднозначность некоторых оборотов речи. И вот, почти вопреки ожиданиям, на рубеже 2010-х годов удалось преодолеть технологический порог – и внезапно усовершенствовать те самые «нейронные сети». То есть состыковать отдельные вычислительные блоки, в параллельном режиме решавшие специфические комплексные задачи, и применить к ним логику взаимозависимости, что позволило проводить неисчислимо больше операций с одной и той же целью.
Это со всей очевидностью свидетельствовало об антропоморфическом повороте, совершенном одним из ответвлений технических наук, в котором человеческий мозг почитали за эталон, но с одной особенностью – исходили из того, что решения со сложной архитектурой будут все же несравнимо мощнее при выполнении некоторых операций. Постулат был особенно популярен в лабораториях, где, разумеется, примеривали к артефактам все больше наших когнитивных навыков. В результате возникло желание достичь вершины – наделить машины способностью к языковой генерации. Многие из выбранных методов продолжали нести в себе все ту же антропоморфную составляющую, подобно так называемым самообучающимся системам, – системам машинного обучения (machine learning), «которые учатся на своих ошибках», или тем, которых «дрессируют», как животных в цирке. Эти механизмы зависят от постоянно возрастающей мощности процессоров и от непрерывного усложнения алгоритмической науки – и потому пришли к результатам, совсем недавно казавшимся недостижимыми. Теперь есть умные колонки – голосовой интерфейс, выведенный на рынок в 2016 году, или автоматический перевод текстов, у которого очень высокая скорость и неизменно улучшается качество, так что с недавних пор он стал походить на профессиональный.
30 ноября 2022 года произошел резкий и довольно неожиданный технологический скачок – проще говоря, планету изрядно тряхнуло: открылся свободный онлайн-доступ к чат-боту ChatGPT, разработке компании OpenAI. Все тут же отметили, что система, призванная отвечать на письменные вопросы, делает это так, что невольно «открываешь рот»: и синтаксис правильный, и вообще все складно. Впрочем, все как будто ждали большего, подтверждая тем самым вопиющую слабость нашего критического мышления, и констатация сопровождалась оговоркой: результат, мол, еще несовершенен, предстоит долгий путь, чтобы сравняться с человеком. Именно в этом наше большое заблуждение. Мы полагаем, что речь идет о механизмах, использующих язык, похожий на наш. Хороший повод, – оставив дискурс, придуманный цифровой индустрией, который мы так часто принимаем за «чистую монету», – рассмотреть, как работают такие технологии. Что помогает им разобрать по косточкам весь свод текстов, доступных в базах данных или в интернете, и извлекать из них законы семантики. Сразу заметим, что получаемые высказывания – лишь продукт применения алгоритмов на основе статистического анализа, единственный «питающий источник» для них – уже существующие реестры, а фундамент – модели прогнозирования, состоящие в выборе события, которое с наибольшей вероятностью последует за предыдущим. И здесь нет ничего общего с тем, что предполагает, так сказать, «естественный» язык.
Неотъемлемое свойство человеческого языка в том, что это результат напряженности: с одной стороны – лексическое богатство, создаваемое словами и правилами грамматики, с другой – наша способность к формулировкам. Плюс связь со временем – и это не привязанность исключительно к прошлому, а динамичный процесс, сопряженный с настоящим и находящийся в постоянном становлении. Когда мы говорим или пишем, мы не перестаем черпать из фразеологического океана, индетерминированным образом подстраиваясь под специфичный каждый раз контекст. Любое выражение, написанное или сказанное, фонтанирует, прорываясь сквозь все заранее выстроенные схемы. Поль Валери писал: «Разум извергается каждый миг, а между тем, если память ему служит, в нем всегда есть та постоянная изменчивость, что связана с постоянной изменчивостью окружения»[133]. Именно этой чистой неопределенности момента недостает машинному слову, ведь оно результат вычисления параметров и отвечает конкретным законам. Видим ли мы, какая тут «под шумок» складывается цивилизационная модель? А ведь это результат двойной трансформации нашей связи с языком. С одной стороны, появляются примеры генеративного искусственного интеллекта, который наделен способностью к речи и на первый взгляд ничем нам не уступает, так что на него постепенно возложат многие наши текущие задачи и связи с другими людьми, – для этого он производит псевдоязык, напрочь лишенный сингулярности и творческого начала. Происходит явление, отнимающее у нас такую же способность, а это значит, что под видом упрощения наших будней технико-экономический комплекс отчуждает, отнимает нашу душу с такой силой, какой человеческая история еще не знала.
С другой стороны, – и это главное направление, – возникают технологии, которые щедро одаривают нас добрым словом с дружескими, задушевными интонациями, но считаются куда