Мишин Лернинг 🇺🇦 1712

Мишин Лернинг 🇺🇦🇮🇱

что-то происходит

👉 twitter

X (formerly Twitter)

Misha Konstantinov (@_bra_ket) on X

soon = 5 #deepfloydif #deepfloyd @deepfloydai

6.0K views21:37

Мишин Лернинг 🇺🇦🇮🇱

Forwarded from Нейроэстетика

III

prompt: perfect cute face 35mm analog portrait of a beautiful asian girl in a diner, sitting near the window, short hairs, tate modern, oil art, detailed texture, realistic body. by lucian freud, by david hockney. contemporary art. oil art, large strokes. oil art photo realism. hyper realism.

5.6K views18:09

Мишин Лернинг 🇺🇦🇮🇱

🤗 HuggingChat доступен для всех

Удобный опенсорсный анлога ChatGPT на базе OpenAssistant (RLHF тюн LLaMa oasst-sft-6-llama-30b)

Потестил. Нейронку на numpy написало. Скажу, что OpenAssistant показывает очень неплохие результаты, хотя она и слабее ChatGPT. Не говоря уже про 4.

👉 https://huggingface.co/chat/

6.3K views09:30

Мишин Лернинг 🇺🇦🇮🇱

prompt: a sunny side up egg but the yolk is blue. blue round yolk. the colour of yolk is blue

Красота никогда не давалась легко

4.7K views11:47

Мишин Лернинг 🇺🇦🇮🇱

Forwarded from эйай ньюз

🔥DeepFloyd IF: новая text-2-image модель

StablityAI выпустили новую модель, которая очень похожа на Imagen от Google, но работает лучше и в open-source.

Архитектура IF, как и у Imagen состоит из трех диффузионных моделей, каждая из которых работает в пространстве RGB и прогрессивно увеличивают картинку. Сначала Text→64×64, затем (Text+64×64)→256×256, и наконец (Text+256×256)→1024×1024. А текст кодируется с помощью текстового энкодера T5.

Почему это круто?
— IF неплохо умеет генерировать текст (я даже генерил в канале ранее), явно лучше чем StableDiffusion XL

— Нормальная открытая имплементация по типу Imagen, которой до сих пор не было. Возможно с какими-то трюками, о которых мы узнаем, когда авторы выпустят блогпост

— FID скор измеряет похожесть снеренированных картинок на реальные. Это чуть ли не основная метрика для качества генерации. У IF FID=6.7, тогда как у Imagen 7.3. Меньше — лучше. Разрыв не космический, но приличный.

Код выложили, веса ждем тут. И ждем подробной статьи от авторов.

@ai_newz

4.3K views11:49

Мишин Лернинг 🇺🇦🇮🇱

Релизим DeepFloyd IF. Ждете?

Anonymous Poll

869 voters6.6K views11:14

Мишин Лернинг 🇺🇦🇮🇱

Пару минут

5.6K views13:22

Мишин Лернинг 🇺🇦🇮🇱

часов

ладно, один час

5.8K viewsedited 15:14

Мишин Лернинг 🇺🇦🇮🇱

👾 Мы DeepFloyd (Research AI Lab at StabilityAI) зарелизили лучшую Text-to-Image модель DeepFloyd IF

DeepFloyd IF это новая каскадная диффузионная модель основанная на идеи Imagen от Google:
— Текст кодируется T5 XXL v1.1
— Далее интерпретируется в пиксели через IF-I-XL (4.3B UNet), генерирующий изображения в 64х64
— IF-II-L (1.2B кастомный Optimal UNet) апскелит изображения 64х64 в 256х256, используя T5
— Для финальной картинки в 1024х1024, благодаря модульному подходу, можно использовать IF-III-L (пока не опенсорснут) или Stable x4

Благодаря тому, что:
— Модель параметризирована сильнее чем GLIDE, DALL-E 2, Imagen, eDiff-I: 2B против 4.3B у DeepFloyd IF
— Апскейлеры больше и имеют более оптимальную архитектуру в сравнение с Image и DALL-E 2

🏆 DeepFloyd IF выбивает Zero-Shot COCO@30K SOTA, тем самым являсь лучшей Text-to-Image моделью не только в опен-сорсе, но и вообще!

💻 Сайт лабы DeepFloyd
🤖 Страница нейроки DeepFloyd IF
👽 DeepFloyd Дискорд

🖥 GitHub
🤗 HuggingFace

👾 Генерить тут: Demo 👈

19.0K viewsedited 16:09

Мишин Лернинг 🇺🇦🇮🇱

Forwarded from DeepFloyd

This media is not supported in your browser

VIEW IN TELEGRAM

Soo... Finally! Meet IF – a state-of-the-art text-to-image model that can also generate 'I ❤️ DeepFloyd' on your mug

👀 https://huggingface.co/spaces/DeepFloyd/IF
🐱 https://github.com/deep-floyd/IF
🔻 https://deepfloyd.ai/

@deepfloydai

8.0K views16:36

2025/07/07 13:18:02
Back to Top

HTML Embed Code:

<iframe width="100%" src="https://www.bootg.com/buyppe/web?embed=1" title="Telegram Web" frameborder="0" allow="accelerometer; autoplay; clipboard-write; encrypted-media; gyroscope; picture-in-picture" allowfullscreen></iframe>