shonenkov AI

сильно ждете “IF”?

готовлю в опенсорс фичи из прошлых опросов - оказалось, что IF в zeroshot’е (без дообучения) может делать:

👨‍🎨 перенос стиля/домена

🔧 контролировать степень переноса стиля/домена, как для генерации с нуля, так и для редактирования изображения

🎨 инпейнтинг

отредактировал свою аватарку: добавил НЛО и пурпурное облако в хорошем фотореализме. и селфи в GTA)

P.S. это результаты в текстовом zeroshot, а что же будет, если потюнить на искусстве, сделать смешивание двух картинок, а еще потренить аналогично новому InstructPix2Pix

🍿

@DeepFloydAI

Please open Telegram to view this post

VIEW IN TELEGRAM

Please open Telegram to view this post

VIEW IN TELEGRAM

9.2K views13:47

shonenkov AI

Forwarded from Нейроэстетика

9.2K views00:59

shonenkov AI

Forwarded from Love. Death. Transformers.

8.2K views05:37

shonenkov AI

что из мультимодального полезнее развивать [April 2023]?

Anonymous Poll

871 voters7.0K views12:43

shonenkov AI

Forwarded from DeepFloyd

⚡️ Our Astronomy Domine (Daria) and Interstellar Overdrive (Misha) shed light on the DeepFloyd IF's architecture and performance at the Weights & Biases MLOps virtual conference, Fully Connected 2023.

IF LARGE TEXT-TO-IMAGE MODELS WERE OPEN-SOURCE, Fully Connected 2023 (YouTube)

YouTube

Building The Next Large Model: DeepFloyd LLM + Text-to-Image = IF (Stability AI)

*From Fully Connected 2023*

Daria Bakshandeava and Misha Konstantinov of DeepFloyd discuss large language modeling for text-image models, with a focus on their soon-to-be open-source, state-of-the-art text-to-image diffusion model.

5.6K views21:34

shonenkov AI

Forwarded from Apolinário

good morning my deer owls!

4.2K views20:54

shonenkov AI

ГО тыкать IF? 👀

https://github.com/deep-floyd/IF

GitHub

GitHub - deep-floyd/IF

Contribute to deep-floyd/IF development by creating an account on GitHub.

4.1K views16:05

shonenkov AI

Forwarded from Мишин Лернинг 🇺🇦🇮🇱

👾 Мы DeepFloyd (Research AI Lab at StabilityAI) зарелизили лучшую Text-to-Image модель DeepFloyd IF

DeepFloyd IF это новая каскадная диффузионная модель основанная на идеи Imagen от Google:
— Текст кодируется T5 XXL v1.1
— Далее интерпретируется в пиксели через IF-I-XL (4.3B UNet), генерирующий изображения в 64х64
— IF-II-L (1.2B кастомный Optimal UNet) апскелит изображения 64х64 в 256х256, используя T5
— Для финальной картинки в 1024х1024, благодаря модульному подходу, можно использовать IF-III-L (пока не опенсорснут) или Stable x4

Благодаря тому, что:
— Модель параметризирована сильнее чем GLIDE, DALL-E 2, Imagen, eDiff-I: 2B против 4.3B у DeepFloyd IF
— Апскейлеры больше и имеют более оптимальную архитектуру в сравнение с Image и DALL-E 2

🏆 DeepFloyd IF выбивает Zero-Shot COCO@30K SOTA, тем самым являсь лучшей Text-to-Image моделью не только в опен-сорсе, но и вообще!

💻 Сайт лабы DeepFloyd
🤖 Страница нейроки DeepFloyd IF
👽 DeepFloyd Дискорд

🖥 GitHub
🤗 HuggingFace

👾 Генерить тут: Demo 👈

4.1K views16:31

shonenkov AI

Forwarded from A

4.7K views17:02

shonenkov AI

Forwarded from -

5.5K views17:44

2025/07/05 19:13:01
Back to Top

HTML Embed Code:

<iframe width="100%" src="https://www.bootg.com/buyppe/web?embed=1" title="Telegram Web" frameborder="0" allow="accelerometer; autoplay; clipboard-write; encrypted-media; gyroscope; picture-in-picture" allowfullscreen></iframe>