с 01.01.2023 по настоящее время Москва, г. Москва и Московская область, Россия
ББК 85 Искусство. Искусствознание
Исследуются способы проектирования туристических комплексов в условиях автономного обитания. В ходе проведенного исследования была проведена работа с нейросетями и изучен метод концептуального проектирования и архитектурного формообразования с помощью нейросетей. В статье изложены полученные результаты.
эволюция, инновации, человек, технология, туристический комплекс, автономное обитание, нейросеть, проектирование, искусственный интеллект, архитектура невесомости
Стремительное развитие цифровых технологий привело к автоматизированному проектированию. Однако для того, чтобы извлечь выгоду из этого потенциала, необходимо уметь использовать компьютер в качестве интерактивного инструмента и понимать, что искусственный интеллект лишь содействует архитектору в творческом процессе [7].
Люди всегда стремились заглянуть в будущее. Так, художник Жан-Марк Коте к выставке в Париже в 1900 году создал серию футуристических открыток «Как будут жить люди в 2000 году» (рис. 1 а) [8]. Финский архитектор Матти Сууронен в 1960-х годах спроектировал и реализовал автономные дома Futuro (рис. 1 б) [11, 12]. Один из домов расположен на Домбае и сейчас служит гостиницей для туристов. Архитектор Галина Балашова создавала проекты и интерьеры космических кораблей (рис. 1 в) [9].
Для того чтобы получить новейшие данные об эволюции проектирования автономных туристических комплексов, была проведена практическая работа с пятью нейросетями и получены разные результаты. Эксперимент проводился с нейросетями для генерации изображений Dream Studio, Dream by Wombo, Midjourney, «Кандинский», «Шедеврум».
Цель исследования – создать проектно-экспериментальную модель автономного туристического комплекса, определить наиболее подходящую нейросеть для проектной работы архитектора. Был сформирован перечень из двенадцати текстовых запросов, которые соответствует необходимым требованиям для получения нужного результата по поставленной задаче. Первые текстовые команды представляли следующие словосочетания: «рекреационно-досуговый комплекс в условиях автономного обитания». В процессе работы по подбору команд было отмечено, что более точно нейросети генерировали изображения на текстовую инструкцию, которая начиналась с фразы: «автономный туристический комплекс (АТК)».
Далее потребовался подбор более конкретных сред: АТК на Луне, АТК на Марсе, АТК в космосе. После чего, для архитектурного формообразования в командной строке добавлялись архитектурные термины: АТК общий вид, АТК перспектива, АТК вид сверху, АТК план первого этажа, АТК план второго этажа, АТК план кровли, АТК разрез поперечный, АТК разрез продольный, АТК генплан, АТК фасад, АТК экстерьер, АТК интерьер, АТК фрагмент интерьера, АТК фрагмент экстерьера. Каждая текстовая инструкция была задана нейросетям, чтобы получить изображения. Однако не все программы распознавали формулировки задач корректно. Наиболее успешные результаты изложены в исследовании далее.
Разработка компании Stability AI пользовательский сервис Dream Studio [6] создана на основе нейросети Stable Diffusion. Инструмент не воспринимает текстовую команду на русском языке – в командной строке нужно вводить текст на английском языке. За одну итерацию можно сгенерировать от одного до десяти изображений. В работе создавалось по четыре варианта на один запрос. Формат иллюстраций может быть горизонтальным, квадратным или вертикальным. На текущий момент в этой программе есть 16 стилей, можно выбрать, в каком стиле выполнить изображение, и также отредактировать выбранный вариант. Данная нейросеть при нескольких итерациях запросов справлялась с поставленными задачами. Было сгенерировано девяносто изображений. Из них можно считать хорошими одиннадцать изображений. На иллюстрациях представлены лучшие результаты, полученные на следующие команды: «автономный туристический комплекс» (рис. 2 ж), «автономный туристический комплекс на Луне» (рис. 2 и), «автономный туристический комплекс на Марсе» (рис. 2 к).
Нейросеть Dream by Wombo генерирует иллюстрации по текстовому запросу на разных языках, в том числе и на русском [5]. Также можно задавать команды для обработки существующих изображений, предварительно загруженных в программу. Изображения могут быть разноформатными, программа предлагает 139 вариантов стилистического оформления. Можно задавать текстовые команды и загружать изображения. Генерация иллюстраций происходила после написания коротких предложений. За время работы было получено 85 изображений. Разрезы АТК не получилось создать с помощью этой нейросети. В процессе исследования (с точки зрения поставленных задач) результаты можно считать неудовлетворительными. В результате работы отобрано три изображения, которые получены из предварительно загруженных в программу изображений (рис. 1 а–в). После поставленной задачи: «автономный туристический комплекс» – нейросеть сгенерировала стилистически обработанные изображения (рис. 1 г–е).
Система на базе искусственного интеллекта Midjourney, как и ранее, не воспринимает текстовую команду на русском языке [10]. В командной строке вводились короткие предложения на английском языке. Последовательность ввода команд на протяжении всей работы остается неизменной. Нейросеть генерирует четыре варианта изображения. Можно выбрать «в доработку» или дать команду «сделать новые четыре варианта» по этой же команде. Программа генерирует изображения по текстовому заданию и путем загрузки изображений. Качество изображений выше, чем в предыдущих ИИ. Всего получено 29 иллюстраций. На каждой иллюстрации по четыре изображения. Среди них есть планы и разрезы. Данные изображения можно обрабатывать далее для получения более высокого результата. В статье представлен результат работы в виде трех отобранных изображений: Автономный туристический комплекс в космосе, вид сверху (рис. 2 л); АТК в космосе, разрез (рис. 2 м); АТК в космосе, интерьер (рис. 2 н).
«Кандинский 3.0» [1] – проект, сервис и приложение, с помощью которого пользователи могут генерировать изображение по текстовому описанию на русском языке с помощью нейросетей. Можно создать изображения согласно тексту, микшировать два изображения, соединять изображение и текстовое описание, стилистически переработав изображение. Результат можно оформить в 18 стилях. В этом приложении создано 28 изображений, которые довольно точно соответствовали тексту, вводимому в командной строке. Далее представлены изображения, полученные в результате введения следующих команд: «Автономный туристический комплекс (АТК) вид сверху», «АТК в космосе план первого этажа», «АТК в космосе план второго этажа», «АТК в космосе общий вид», «АТК в космосе перспектива», «АТК в космосе интерьер» (рис. 3 п, р, с, т, у, ф).
Также нейросеть «Кандинский 3.0» генерирует анимацию и видео по текстовому описанию. В работе с приложением необходимо подбирать словосочетания для получения нужного результата. В процессе работы было создано шесть анимационных роликов и восемь видео. Наиболее качественная и соответствующая заданию получается анимация. Видео имеет единое время 7 секунд. Анимационные ролики имеют более сложную систему настроек. Ролик создается с помощью «сцен». Одна сцена – это окно для текстовой команды и настроек. Работа с одной сценой в результате дает 4 секундный ролик. В исследовании анимационный ролик создавался из четырех сцен. В результате время анимационного ролика составляет шестнадцать секунд. Согласно заданию, в ролике получен автономный туристический комплекс, который представлен с разных сторон и в разное время суток. Анимация отличается по качеству и содержанию в зависимости от поставленных текстовых команд.
«Шедеврум» – это пятая нейросеть, с которой работали, проводя данное исследование [3]. В основе приложения лежит искусственный интеллект, который создает картинки или текст по описанию. Нейросеть воспринимает текстовую команду на русском языке. Работает через мобильное приложение. Генерирует два варианта изображения в формате квадрата. Всего сгенерировано 47 иллюстраций. В соответствии с поставленными задачами отобрано 6 изображений (рис. 4).
5 апреля 2024 года разработчиками был открыт общий доступ к функции генерации видео по текстовому описанию. Анимация позволяет увидеть архитектурный объект с разных точек, что дает дополнительные возможности проектировщику. Эта новая возможность была включена в исследование и созданы видеоролики по следующему текстовому описанию: «автономный туристический комплекс в открытом космосе». Создано три ролика, из них можно выделить один, который наиболее соответствует заданию.
***
Количество нейросетей, генерирующих изображения, стало больше, они становятся совершенней и удобней в работе. Не все нейросети воспринимают текстовую команду на русском языке. Способы работы и результаты с нейросетями различны. Для нужного результата надо изучать возможности приложений и правила работы, подбирать для нужных целей наиболее подходящий тип нейросети.
В данном исследовании более точные результаты получились при работе с нейросетями Midjourney, «Кандинский 3.0», «Шедеврум». Видеоролики можно создать при помощи «Кандинский 3.0» и «Шедеврум». За время данного исследования создано более 300 иллюстраций, 8 видео и шесть анимационных роликов. Необходимо провести более глубокое изучение возможностей нейросетей – объединять загружаемые изображения, применять разные стили, в задании конкретизировать условия автономного нахождения объекта. Эти приложения могут быть полезны в образовательных целях, так как дают дополнительные возможности для создания эскизов, с последующей обработкой и детализацией автором.
Мы переживаем переходный период в образовании, когда системы прошлого становятся все более нерелевантными для возможностей будущего [4]. Возможно, имеет смысл рассмотреть проведение архитектурных конкурсов для школьников, студентов и архитекторов с созданием проектов с применением нейросетей. В связи с развитием информационных технологий, которые трансформируют всю структуру коммуникативного опыта человека, некоторые формы предоставления информации и организации ее потребления могут быть внедрены при создании соответствующих объектов архитектуры в глобальной информационной системе [2].
1. Кандинский: official website. – URL: https://beta.dreamstudio.ai/generate
2. Сапрыкина, Н. А. Основы динамического формообразования в архитектуре / Н.А. Сапрыкина. – Москва : Курс, 2022.
3. Шедеврум: official website. – URL: https://shedevrum.ai/principles
4. Cambridge: official website. – URL: https://www.cambridge.org/elt/blog/2023/02/02/top-5-edtech-trends-for-2023/ (date of access: 07.02.2023).
5. Dream By Wombo: official website. – URL: https://dream.ai/
6. DreamStudio: official website. – URL: https://dreamstudio.ai/
7. Hemmerling, M. Digital Design Manual / М. Hemmerling, А. Tiggemann. – New edition. – Dom Publishers, 2020.
8. Ingvartsen, D. What people in 1900 thouqht the vear 2000 would look like By Jean-Marc / D. Ingvartsen // Theinspiration.com : website. – Published 2015.10.05. – URL: https://www.theinspiration.com/2015/10/people-1900-thought-year-2000-look-like-jean-marc/ (date of access: 04.11.2023).
9. Meuser, P. Galina Balashova. Architect of the Soviet Space Programme / P. Meuser. – Berlin: Dom Publishers, 2022.
10. Midjourney: official website. – URL: https://www.midjourney.com/home
11. thefuturohouse.com : cайт, посвященный документированию истории домов Футуро. – URL: https://thefuturohouse.com/futuro_house_locations_and_maps.html
12. Virtanen, M. Matti Suuronen / M. Virtanen // mfa.fi : website. – Published 2021.05.02. – URL: https://www.mfa.fi/kokoelmat/arkkitehdit/matti-suuronen/ (date of access: 15.10.2023).