Основная статья: Генеративный искусственный интеллект
2025
Разработка революционного метода, который резко ускоряет и упрощает генерирование реалистичных изображений и текстов
Команда российских исследователей из Московского физико-технического института, Иннополиса и Сколково создала инновационную технологию генеративного моделирования, которая кардинально ускоряет процесс создания реалистичных изображений с помощью искусственного интеллекта. Новый алгоритм под названием «оптимальное сопоставление потоков» позволяет получать качественные визуальные данные за существенно меньшее время по сравнению с традиционными методами нейронных сетей. О научном прорыве в области машинного обучения стало известно 22 сентября 2025 года.
Российские специалисты решили фундаментальную проблему современных генеративных моделей — неэффективность траекторий преобразования данных. Научные результаты были представлены в материалах международной конференции NeurIPS 2024, что подтверждает высокий уровень российских достижений в сфере искусственного интеллекта.
Основу технологии составляет метод сопоставления потоков, предназначенный для плавного преобразования одного распределения данных в другое. Процедура напоминает создание виртуальной «реки», по которой элементы информации перемещаются от начального к конечному состоянию, постепенно модифицируя свои характеристики. Предшествующие подходы формировали сложные извилистые маршруты, что существенно замедляло генерацию и требовало больших вычислительных мощностей.
По информации издания, принципиальное отличие российской разработки заключается в применении специализированных векторных полей, определяющих оптимальные прямолинейные траектории движения данных. Математическая основа метода связана с градиентами выпуклых функций, обеспечивающими точное направление трансформации информации без лишних отклонений от кратчайшего пути.[1]
На создание одного изображения с помощью ИИ требуется столько же энергии, сколько для полной зарядки смартфона
На создание одного изображения с помощью генеративного ИИ требуется столько же энергии, сколько нужно для полной зарядки среднестатистического смартфона. Об этом говорится в совместном исследовании американской компании Hugging Face и Университета Карнеги — Меллона, с результатами которого TAdviser ознакомился в середине мая 2025 года.
Цель работы заключалась в том, чтобы определить, какие ИИ-задачи требуют больше всего энергии, и, следовательно, приводят к наиболее значительным выбросам углекислого газа в атмосферу. Рассматривались десять наиболее распространенных операций, таких как ответы на вопросы, генерация текста, классификация, создание изображений и пр. Для выполнения этих задач были задействованы 88 различных ИИ-моделей, а для каждой из операций обрабатывались по 1000 запросов. Потребляемую энергию исследователи измеряли с помощью специально разработанного инструмента под названием Code Carbon. После этого рассчитывались выбросы СО2.
Специалисты пришли к выводу, что генерация изображений является самой энерго- и углеродоемкой ИИ-задачей из тех, которые были выбраны в рамках исследования. В частности, создание 1000 изображений с помощью мощной модели ИИ, такой как Stable Diffusion XL, приводит к выбросам такого же объема углекислого газа, что и поездка на расстояние в 6,56 км на среднестатистическом автомобиле с бензиновым двигателем.
С другой стороны, генерация текста требует относительно немного энергии: на обработку 1000 запросов требуется только 16% от энергии, расходуемой на полную зарядку смартфона. При этом объем выбросов CO2 сопоставим с их количеством при преодолении всего одного метра пути на автомобиле с ДВС. В целом, говорят авторы работы, ИИ-модели, оптимизированные под определенные задачи, потребляют меньше энергии, чем нейросети общего назначения при выполнении тех же операций.[2]
10 лучших инструментов для генерации изображений
В наибольшей степени трансформирующее влияние на экономику оказывает сегмент ГИИ в генерации изображений и видео. Здесь будут затронуты широкие сегменты:
- видеоигры,
- дизайн и искусство,
- кинематограф (в перспективе 3-4 лет), маркетинг и реклама, контент для медиа индустрии и социальных сетей, образование и обучение (интерактивные курсы).
В перспективе технологии могут быть применены в архитектуре, промышленном инжиниринге, медицине и т.д.
Актуальный список (на январь 2025) топовых инструментов по генерации изображений по тестам Spydell Finance:
1. FLUX
2. Midjourney
3. ImageFX от Google
4. Ideogram
5. Recraft
6. Playground
7. Dall-e
8. Artflow
9. Leonardo
10. Stable Diffusion
2024
Объем мирового рынка вычислительной фотографии достиг $15,2 млрд
В 2024 году расходы на глобальном рынке вычислительной фотографии составили $15,2 млрд. Более 40% от этой суммы пришлось на Азиатско-Тихоокеанский регион. Такие данные содержатся в обзоре Fortune Business Insights, опубликованном в начале ноября 2025 года.
Вычислительная фотография — это подход к созданию и обработке изображений с помощью цифровых вычислений. В частности, специальные алгоритмы автоматически корректируют экспозицию и баланс белого, устраняют шум и исправляют искажения. Технологии вычислительной фотографии позволяют применять различные эффекты, включая панорамы и HDR. В целом, такой подход дает возможность при помощи любительских камер и смартфонов получать снимки, сравнимые по детализации с профессиональным оборудованием.
Одним из основных драйверов рынка является искусственный интеллект. Нейросети способны анализировать сцену и объекты в кадре: на основе полученных данных применяются оптимальные настройки для достижения наилучшего результата. Алгоритмы ИИ используются для устранения шума, коррекции искажений и улучшения качества фотографий, полученных в условиях недостаточной освещенности. Генеративный ИИ предлагает качественно новые творческие возможности, например, изменение освещения сцены и редактирование фона. Технологии ИИ широко используются при обработке изображений в профессиональных областях, таких как медицинская визуализация и системы машинного зрения.
Положительное влияние на отрасль оказывает растущее проникновение смартфонов. Согласно данным Exploding Topics, обнародованным в середине июня 2025 года, в глобальном масштабе насчитывается 7,21 млрд смартфонов (многие люди владеют несколькими аппаратами). На этом фоне растет популярность мобильной фото- и видеосъемки. При этом вычислительная фотография обеспечивает распознавание сцен, автоматическую настройку экспозиции и коррекцию изображений на базе ИИ, что позволяет получать высококачественные снимки с минимальными усилиями.
Сдерживающим фактором авторы исследования называют значительные затраты, связанные с созданием и внедрением сложных технологий обработки изображений. Разработка передового аппаратного и программного обеспечения требует существенных финансовых ресурсов, однако в условиях сформировавшейся геополитической обстановки и макроэкономической ситуации многие компании вынуждены сокращать размер инвестиций.
В зависимости от сферы применения рынок сегментирован на 3D-визуализацию, виртуальную реальность, дополненную реальность, смешанную реальность, стандартную цифровую визуализацию и др. В 2024 году наибольшую долю выручки обеспечил первый из перечисленных секторов — 29%. При этом лидирует направление потребительской электроники, что связано с широким распространением смартфонов и другой техники со встроенными камерами. В географическом плане доминирует Азиатско-Тихоокеанский регион с 42,8% выручки, или $6,51 млрд. В глобальном масштабе крупными отраслевыми игроками являются:
- Apple;
- Samsung;
- Google (Alphabet);
- Huawei;
- Xiaomi;
- BBK Electronics;
- Sony;
- Nokia;
- Lenovo;
- LG Electronics;
- Honor;
- Qualcomm;
- MediaTek;
- Pelican Imaging;
- Nikon;
- Micron Technology;
- Nvidia;
- Infineon Technologies;
- Renesas Electronics;
- Applied Materials.
В 2025 году объем рынка вычислительной фотографии, как ожидается, достигнет $17,4 млрд. Аналитики Fortune Business Insights полагают, что в дальнейшем среднегодовой темп роста в сложных процентах (CAGR) составит 15,7%. Таким образом, к 2032 году затраты могут увеличиться до $48,38 млрд.[3]
Google представила бесплатную нейросеть Gemini 2.0 для создания ИИ-помощников
11 декабря 2024 года компания Google представила модель искусственного интеллекта следующего поколения — Gemini 2.0. Эта универсальная нейросеть способна генерировать изображения, текст и звук. Подробнее здесь
Выпущен бесплатный ИИ для создания 3D-моделей из фото. Разработка игр стала еще проще
В начале декабря 2024 года корпорация Microsoft представила новый сервис на основе искусственного интеллекта — платформу Trellis. Эта нейросеть с открытым исходным кодом предназначена для генерации 3D-моделей объектов по фотографии или текстовому описанию. Подробнее здесь.
Wildberries запустил генеративный ИИ-сервис для создания фотографий одежды на виртуальных моделях
Маркетплейс Wildberries 1 ноября 2024 года представил новый сервис «Виртуальная фотостудия», использующий генеративные нейросети для создания фотографий одежды на виртуальных моделях. Сервис доступен продавцам с подпиской «Джем» для 133 категорий мужской и женской одежды. Подробнее здесь.
Российские ученые создали «сомневающуюся» нейросеть, способную распознавать неизвестные объекты на фото
Студенты Университета МИСИС и МФТИ совместно с учеными некоммерческой лаборатории исследований искусственного интеллекта T-Bank AI Research предложили ансамблевую нейросеть SDDE (Saliency Diversified Deep Ensembles), которая с большей точностью определяет объекты на изображениях, не загруженных в базы данных. Об этом МИСИС сообщил 31 октября 2024 года. Подробнее здесь.
Запущен бесплатный сервис для замены фона на фото за 2 минуты
В конце октября 2024 года заработал бесплатный онлайновый сервис IC-Light V2, при помощи которого можно быстро заменить задний фон на фотографии. Кроме того, этот инструмент позволяет управлять освещением на изображениях. Подробнее здесь.
Маркетплейс «Сбера» запустил ИИ-генератор фотографий одежды на виртуальной модели
10 октября 2024 года стало известно о том, что маркетплейс «Мегамаркет», принадлежащий экосистеме «Сбер», представил инновационный сервис, использующий искусственный интеллект для генерации фотографий одежды на виртуальных моделях. Эта технология призвана упростить процесс создания контента для товарных карточек продавцов в сегменте Fashion. Подробнее здесь.
Запущена бесплатная нейросеть для генераций изображений Midjourney
В конце августа 2024 года стала доступна браузерная версия нейросети Midjourney, предназначенной для создания изображений по текстовому описанию. Определенное количество картинок можно генерировать бесплатно. Подробнее здесь
«Вкусвилл» начал генерировать дизайн упаковок с помощью нейросетей, чтобы ускорить выпуск продуктов
«Вкусвилл» начали использовать нейросети для генерирования дизайна упаковок, чтобы ускорить выпуск продуктов. Об этом 26 февраля 2024 года сообщается в официальном Telegram-канале ритейлера. Подробнее здесь.
2023
Adobe продает сгенерированные ИИ фотографии войны Израиля и ХАМАС. СМИ используют их и выдают их за настоящие
В начале ноября 2023 года стало известно о том, что Adobe продает сгенерированные искусственным интеллектом изображения, изображающие конфликт между Израилем и группировкой ХАМАС в секторе Газа. Эти иллюстрации имеют разную степень реалистичности; причем иногда СМИ выдают их за настоящие, не указывая явным образом, что они были созданы посредством нейросети. Подробнее здесь.
«Яндекс» выпустил нейросеть, способную создавать изображения по описанию
«Яндекс» выпустил генеративную нейросеть «Шедеврум», которая может создавать изображения по описанию. Об этом компания сообщила 5 апреля 2023 года. Подробнее здесь.
2022: Российские ученые представили метод классификации фотографий на базе квантовой нейросети
Российские физики лаборатории Квантовых информационных технологий Университета МИСИС, Российского квантового центра и МГУ имени М.В. Ломоносова впервые представили метод классификации фотографий с высокой точностью для 4-х классов изображений, основанный на архитектуре квантовой сверточной нейронной сети (QCNN). Об этом TAdviser сообщили представители НИТУ МИСИС 24 ноября 2022 года. Подробнее здесь.
2021: Применение ИИ в фотографической среде
Современный мир уже невозможно представить без нейросетей и все более впечатляющих разработок в области искусственного интеллекта. Эти сущности, еще лет 20 назад кажущиеся нам чем-то из области научной фантастики, сегодня проникли буквально в каждый дом. И нет, речь не идет о робототехнике и искусственном разуме, искусственный интеллект — это гораздо более широкое понятие.
Алгоритмы ИИ помогают нам начать день с прогноза погоды, далее построить оптимальный путь на работу в Google Maps, учитывая трафик на дорогах, а вечером любимый медиасервис предложит фильм по вкусу. Будьте уверены, даже реклама в браузере будет подобрана «им» специально под вас, учитывая предыдущие поисковые запросы.
Даже сферу искусства ИИ не обошел стороной. Например, у профессионалов и любителей фотографии все большее распространение получают методики, в основе которых лежат нейросети. В данной статье рассказывается о практическом применении инструментов искусственного интеллекта в фотографической среде.
2017: Алгоритм, ретуширующий фотографии в режиме реального времени
4 августа 2017 года стало известно о том, что инженеры корпорации Google в ходе совместного исследования с учеными из Массачусетского технологического института (MIT) создали алгоритм, ретуширующий фотографии в режиме реального времени.[4]
Разработчики всё чаще прибегают к так называемой «вычислительной» фотографии: различным алгоритмам и ИИ-технологиям, призванным улучшать снимки, сделанные с помощью смартфонов. По утверждению представителей Google и MIT, их технология не просто позволит качественно обрабатывать фотографии, но и получать результат, сопоставимый с тем, как если бы этим занимался профессиональный фотограф.
В ходе тестирования нейронной сети было выбрано пять фотографий, созданных Adobe и MIT. Каждое изображение было отретушировано пятью различными фотографами. Затем полученные снимки использовались для того, чтобы определить, как именно можно улучшить каждое изображение за счёт регулировки яркости, насыщенности и прочих параметров.
| | Изображения, которые снимают современные камеры, зачастую воспринимаются как сырой материал для фотографии. Перед тем, как загрузить фотографию в соцсети, даже те, кто снимают на телефон, тратят минуту или две, выравнивая цвет и контраст с помощью популярных приложений, — говорится в блоге MIT. | |
В основе алгоритма Google-MIT лежит «сверточная нейросеть». Вычислительная мощность современных мобильных устройств недостаточно высока для полноценной работы системы, но исследователи сумели обойти это ограничение — система выполняет большую часть вычислений на уменьшенной копии исходного изображения, а затем переносит результаты на фотографию в высоком разрешении.
Исследователи протестировали программу на обычном смартфоне (модель не указывается), и алгоритм смог в реальном времени выдавать на экран обработанное изображение с разрешением 1920×1080 и частотой обновления 40–50 Гц. Размер всего ПО не превышает размера одной цифровой фотографии и может использоваться для обработки снимков в различных стилях. По словам исследователей, нейронная сеть может быть «натренирована» на новом наборе изображений, чтобы имитировать стиль определённых фотографов.
Примечания
- ↑ [https://openreview.net/pdf?id=kqmucDKVcU Optimal Flow Matching: Learning Straight Trajectories in Just One Step]
- ↑ Making an image with generative AI uses as much energy as charging your phone
- ↑ Computational Photography Market Size, Share & Industry Analysis
- ↑ ИИ-алгоритм может заменить профессиональных фотографов








