Муза и алгоритм. Создают ли нейросети настоящее искусство? - Лев Александрович Наумов
Логотектон. Целеполагание в искусстве. Нейросеть как модель души
С формальной точки зрения рисующие нейросети представляют собой программный преобразователь “text-to-image”, то есть “текст-в-изображение”. Выше мы обсуждали, какие именно причины, связанные с историей возникновения моделей, лежат в основе подобного подхода и, если угодно, идеологии. Однако упомянутое обстоятельство хорошо согласуется с распространённым мнением, будто в центре любого произведения находятся некие “слова”.
Последний тезис можно трактовать с разных сторон. Для начала в очередной раз отметим, что огромная общая проблема в восприятии искусства (особенно в нашей стране) связана с вбиваемым в школах подходом, который зиждется на вопросе “Что хотел сказать автор?” Казалось бы, здесь тоже имеются в виду слова… Заниматься критикой данного вопроса можно едва ли не бесконечно, но фантом истины в нём маячит в силу единственного обстоятельства: отбросив первое слово, а также вопросительный знак в конце, мы получим ключевую причину возникновения любого произведения – она именно в том, что “автор хотел сказать”.
Режиссёр Стэнли Кубрик утверждал: “Всё, что может быть написано или придумано, может быть и снято”. Заметим, что последняя фраза вовсе не льёт воду на мельницу упомянутого школьного подхода. Во-первых, она о другом – её высказал кинематографист, большинство фильмов которого являются экранизациями литературных произведений. Во-вторых, каждая работа Кубрика вовсе не равна своей книжной первооснове, а порой обходится с последней достаточно вольно, используя текст лишь как отправную точку или набор портретов персонажей. В-третьих, сказанное режиссёром совершенно не значит, что снятое может быть потом написано. И, наконец, в-четвёртых, довольно глупо полагать, будто только написанное может быть снято.
Тем не менее людям нравится верить, что в центре каждого произведения находится некая “идея” или “мысль”. Разумеется, сразу возникает вопрос: а что такое идея? Отвечать на него мы не станем, важно другое: когда выше мы создавали картину “Вера” (см. илл. 18), мы не сообщали нейросети, в чём заключается идея веры. Более того, безусловно, модель организована так, что нельзя сказать, будто она ей известна. Искусственный интеллект лишь пытается сгенерировать изображение, соответствующее, с одной стороны, запросу, а с другой – ожиданиям, моде или вкусу. Картина рождалась вовсе не из идеи или мысли, а из того, что люди привыкли видеть как визуальное их воплощение.
Казалось бы, только что нам удалось объяснить словами, что стоит за конкретным произведением. Заметим, объяснение весьма своеобразное: оно помогает понять “как”, но не говорит “что”. В частности, в нём не фигурировали девочка, идея веры, идея картины веры, идея визуального воплощения идеи… И тем не менее найденные слова что-то да объясняют по поводу происхождения образа.
Множество полярных точек зрения, сталкивающихся взглядов и полемизирующих школ примиряет следующее суждение: за художественным произведением – вне зависимости от вида искусства и даже от того, создано оно человеком или нейросетью, – стоит… пусть не “идея”, но нечто, имеющее или по крайней мере могущее быть облачённым в форму текста или высказывания. Только опять-таки – что это за “текст” или “высказывание”?
Быть может, в центре – описание? Само по себе это похоже на правду, хотя есть существенное “но”: как правило, описание вторично по отношению к произведению. Оно появляется позже, не предшествует ему. И, разумеется, вновь возникает вопрос относительно того, сколь исчерпывающим или хотя бы репрезентативным описание может быть. Если обсуждать творчество де Кирико с нейрокритиком или искусствоведом-человеком, то они оба в первую очередь отметят в визуальном стиле итальянца римские аркады (хотя скорее греческие, поскольку художник впитал античность с молоком матери-гречанки), длинные тени, нелогичные перспективы… Это будут наиболее часто повторяющиеся слова. Примерно то же самое можно сказать и о следующей картине, которую трудно отнести к удачным работам нейросети (см. илл. 65). Кто-то добавит к описанию полотен де Кирико слова “метафизика”, “сюрреализм” (что на самом деле будет не совсем верно с точки зрения жанра), подчеркнёт геометричность форм, элементы античности, безжизненность, жгучий свет (не Солнце, а именно свет!), архитектурный аскетизм, однородность оттенков стен, статичность (в отличие от Дельво), одиночество, сочетание живого и неживого, где первое от второго едва ли отличимо, но… чем больше слов, тем труднее это всё представить. Так ли много перечисленное позволяет понять о стиле и особенностях художника? Если бы вы никогда не видели картины де Кирико (что, надеемся, вряд ли соответствует действительности), то смогли бы вообразить их себе, исходя из сказанного? А ведь в реальности его стиль узнаваем безошибочно! Работы итальянского мастера ни с кем другим невозможно спутать.
Впрочем, ладно: допустим, в определённых пределах, поразмыслив над перечисленными штрихами к описанию, представить (в значении “вообразить”) какие-то полотна удастся. Но, во-первых, “представить” – это одно, а “представить правильно” – это другое. А во-вторых, восприятие картины и фантазии о картине – это совершенно разные модусы. И последнее имеет куда большее отношение к творчеству и созданию.
Описание не исчерпывает произведение ни в каком смысле. Его функции не связаны с возникновением прецедента искусства, оно не является источником.
Продолжим с де Кирико и рассмотрим его полотно 1914 года “Тайна и меланхолия улицы (девушка работает с обручем)”. Описать эту работу словесно, не придерживаясь лапидарности и конкретики промпта, можно так: “Девушка катит обруч по залитой ярким светом улице меж двух аскетичных крупных зданий с аркадами. Небо при этом парадоксально тёмное. Жирные длинные тени устремлены ей навстречу. Стиль сюрреалистических архитектурных пейзажей в тёмно-изумрудной гамме”. При желании можно отметить также тень крупного мужчины, который как бы скрыт за углом, и то, что у ближнего здания стоит распряжённый цирковой вагончик с гостеприимно открытыми дверями[176], а на заднем плане развевается треугольный флаг. Каждый из читателей представит что-то своё, но в большей или меньшей степени под это описание попадают и все следующие картины, созданные четырьмя разными нейросетями (см. илл. 66). Нашей задачей в данном случае было вовсе не воспроизвести полотно де Кирико по вербальной инструкции, а показать (и, надеемся, это удалось), что почти все приведённые работы, согласуясь с описанием, достаточно интересны, будучи не похожими между собой.
Попробуем подключить к разговору нейрокритика “в лице” текстовой модели. Обсудив с ChatGPT эстетику де Кирико, мы получили множество формулировок в духе: “Его