Хочу рассказать чем я заменил для себя Midjourney с момента, как он стал платным. К сожалению, любой зарос в интернете на тему: "Бесплатная генерация изображений" выдаст вам кучу AI, которые бесплатны только на 5 изображений, дальше платите, но есть способ генерировать всегда бесплатно.
Речь пойдет про open-source разработку Fooocus с запуском в Google Colab

В оправдание всех платных сервисов скажу: генерация изображений, текста, видео - все это очень трудозатратный процесс, для того, чтобы сгенерировать изображение требуется мощная видеокарта и процессор, потребление электроэнергии. Поэтому предоставить бесплатно такой сервис - не каждый согласится. Но у нас есть замечательный Google, который позволяет использовать его мощности, хоть и ограниченные, но на личное использование хватит.
Итак, приступим. Запуск в Google Colab
Переходим в репозиторий Fooocus Colab. Вам потребуется аккаунт Google.
Google Colab — это бесплатный онлайн-сервис от Google, который позволяет писать и запускать код на Python прямо в браузере.
Нажимаем на кнопку "Open in Colab".

Соглашаемся с запуском и нажимаем на Play.

Нажимаем "Выполнить"

Запуск займет определенное время, пока подтянутся все зависимости и необходимые модели для запуска. Можете понаблюдать и заметить, что при запуске в Colab скорость скачивания доходит до 100 MB/s, что позволяет запускать AI модели достаточно резво, по сравнению с запуском локально.
Вам необходимо дождаться следующих строк:
[Fooocus Model Management] Moving model(s) has taken 0.66 seconds
2025-01-07 16:14:33.851434: E external/local_xla/xla/stream_executor/cuda/cuda_fft.cc:485] Unable to register cuFFT factory: Attempting to register factory for plugin cuFFT when one has already been registered
2025-01-07 16:14:33.882659: E external/local_xla/xla/stream_executor/cuda/cuda_dnn.cc:8454] Unable to register cuDNN factory: Attempting to register factory for plugin cuDNN when one has already been registered
2025-01-07 16:14:33.890594: E external/local_xla/xla/stream_executor/cuda/cuda_blas.cc:1452] Unable to register cuBLAS factory: Attempting to register factory for plugin cuBLAS when one has already been registered
2025-01-07 16:14:33.909464: I tensorflow/core/platform/cpu_feature_guard.cc:210] This TensorFlow binary is optimized to use available CPU instructions in performance-critical operations.
To enable the following instructions: AVX2 AVX512F FMA, in other operations, rebuild TensorFlow with the appropriate compiler flags.
2025-01-07 16:14:35.876132: W tensorflow/compiler/tf2tensorrt/utils/py_utils.cc:38] TF-TRT Warning: Could not find TensorRT
Started worker with PID 1581
App started successful. Use the app with http://127.0.0.1:7865/ or 127.0.0.1:7865 or https://362c95feb347123f8b.gradio.liveВам выдали ссылку на gradio.live - https://362c95feb347123f8b.gradio.live - это сервис, которые позволять запускать локальные проекты в интернете. Можете просто открывать. Загрузится вот такая страница.

Теперь можно начинать работу с генерацией изображений.
Начинаем генерировать
Вообще, достаточно ввести любой промт и нажать Generate, он возьмет дефолтные настройки и разрешение и сделает вам два изображения. Но я бы рекомендовал сначала выбрать стиль и поменять разрешение на нужное.
Нажимаем на чек-бокс Advanced и в Aspect Ratios выбираем нужный размер

Далее переходим в Styles, снимаем дефолтные галочки и выбираем нужный стиль. Когда вы наводите мышку на стиль, появляется превью, чтобы понять как это будет примерно выглядеть. Давайте для примера возьмем SAI 3D Model

Создаем промт
Вы, конечно, можете сами создать промт для генерации, но имейте ввиду, что он должен быть на английском языке. Если введете на русском, то он что-то сделает, но не всегда ожидаемо.
Для примера я сделал вот такой промт:
Create a highly detailed and realistic 3D model of an adorable kitten sitting on a smooth surface.
The kitten should have soft, fluffy fur with intricate details, expressive eyes, and a playful pose.
Add subtle subsurface scattering to the fur and skin for a lifelike effect. In the background,
incorporate a soft, glowing light source that creates a warm and inviting atmosphere, with
subtle bokeh effects to enhance depth. Ensure sharp focus on the kitten's face and body, while
the background gradually blurs to emphasize depth of field. Use realistic lighting and shadows
to add dimension and make the scene visually captivating. The overall style should be
photorealistic,with attention to fine details like whiskers, fur texture, and reflections in the eyesИ нажимаем Generate.

После запуска начнет генерация изображения. В зависимости от выбранного стиля запуск изначально может быть с разной временной задержкой, так как будут подгружаться новые модели.
По итогу у вас получится 2 изображения, которые можно скачать нажав на кнопку справа-вверху Download. Либо правой кнопкой мыши и скачать.

В Fooocus есть можество настроек
Данная статья про базовый запуск и ответ на "чем заменить Midjourney", поэтому тут я не буду рассказывать про все тонкости. Проста скажу, что есть возможность получать из изображения промт, редактировать только часть изображения, апскел, добавлять вариации, негативные промты и многое другое. Обязательно ознакомьтесь с разделом Features - в нем авторы рассказывают, какие использовать механизмы для получения классных изображений.
Итог
Если честно, мне не так часто приходится генерировать изображения, в основном я использую данную нейронку, когда необходимо сделать концепт изображения и передать его художнику, чтобы у него был референс моего видения работы, которую хотим увидеть по итогу, но из-под человеческого пера.
Хотел бы так же сказать, что Google Colab дает нам прекрасную возможность пользоваться инструментом для генерации бесплатно и практически без ограничений, но у них все равно есть лимиты на работу. Поэтому, используйте данную возможность для личного использования, тогда вы не столкнетесь с ограничениями, но если начнете вокруг этого делать всяких ботов, то Гугл вам вряд ли даст такую возможность. Поэтому не переусердствуйте.
Всем хорошего настроения и подписывайтесь.