Мишин Лернинг 🇺🇦 1686

Мишин Лернинг 🇺🇦🇮🇱

⚛️ Все, что вы хотели знать о DeepFloyd IF, но боялись спросить

tl;dr
Ребята из команды DeepFloyd натренили SOTA Text-to-Image диффузионную модель DeepFloyd IF (Zero-Shot FID COCO@30K = 6.66), уделывающую Imagen, Parti, Muse, eDiff-I и прочие text-to-image модели! И эта SOTA готовится к Open-Source, soon

Мы с Дашей из команды психоделического AI ресерча DeepFloyd:

— Миша (aka Мишин Лернинг) Interstellar Overdrive at DeepFloyd [мой twitter, telegram]
— Леша (aka ShonenkovAI) Sr Saucerful of Secrets at DeepFloyd
[twitter, telegram]
— Даша (aka Gugutse) Astronomy Domine at DeepFloyd
[twitter]
— Ксю (aka Susiaiv) The Great Gig in the Sky at DeepFloyd
[twitter]

выступили на конфе Fully Connected 2023, где рассказали все детали IF. Кстати, у нас было классное соседство:
— VP, OpenAI
— Jeremy Howard, Founder FastAI
— CEO, W&B
— Principal, Nvidia
— Stella Biderman, CEO EleutherAI
etc

Если еще не посмотрели наше выступление, то запись уже выложена на YouTube, и ждет вас.

👉 DeepFloyd IF, W&B YouTube

❤44🔥29❤‍🔥5👍3💔2💘2

9.4K views15:08

Мишин Лернинг 🇺🇦🇮🇱

Google решил заменить классический поиск искусственным интеллектом Magi (аналогом GPT-4). Сейчас над Magi работают 160 человек full-time!

🤘https://www.nytimes.com/2023/04/16/technology/google-search-engine-ai.html

🔥63🌚15😢5😍5👾2❤1

7.44K viewsedited 15:28

Мишин Лернинг 🇺🇦🇮🇱

deepmind 👋
(deepmind объединился с google, c google brian)

увы

😢53💊8😁3👨‍💻2❤1

6.22K views21:03

Мишин Лернинг 🇺🇦🇮🇱

что-то происходит

👉 twitter

X (formerly Twitter)

Misha Konstantinov (@_bra_ket) on X

soon = 5 #deepfloydif #deepfloyd @deepfloydai

🔥22👎14👍3❤‍🔥2

5.98K views21:37

Мишин Лернинг 🇺🇦🇮🇱

Forwarded from Нейроэстетика

III

prompt: perfect cute face 35mm analog portrait of a beautiful asian girl in a diner, sitting near the window, short hairs, tate modern, oil art, detailed texture, realistic body. by lucian freud, by david hockney. contemporary art. oil art, large strokes. oil art photo realism. hyper realism.

❤21👍4👌4👾4👎3❤‍🔥1🌚1🍓1🦄1

5.59K views18:09

Мишин Лернинг 🇺🇦🇮🇱

🤗 HuggingChat доступен для всех

Удобный опенсорсный анлога ChatGPT на базе OpenAssistant (RLHF тюн LLaMa oasst-sft-6-llama-30b)

Потестил. Нейронку на numpy написало. Скажу, что OpenAssistant показывает очень неплохие результаты, хотя она и слабее ChatGPT. Не говоря уже про 4.

👉 https://huggingface.co/chat/

❤30🔥8👍4👌1🗿1

6.31K views09:30

Мишин Лернинг 🇺🇦🇮🇱

prompt: a sunny side up egg but the yolk is blue. blue round yolk. the colour of yolk is blue

Красота никогда не давалась легко

❤40🔥6👍4😁3🤯3👎1

4.67K views11:47

Мишин Лернинг 🇺🇦🇮🇱

Forwarded from эйай ньюз

🔥DeepFloyd IF: новая text-2-image модель

StablityAI выпустили новую модель, которая очень похожа на Imagen от Google, но работает лучше и в open-source.

Архитектура IF, как и у Imagen состоит из трех диффузионных моделей, каждая из которых работает в пространстве RGB и прогрессивно увеличивают картинку. Сначала Text→64×64, затем (Text+64×64)→256×256, и наконец (Text+256×256)→1024×1024. А текст кодируется с помощью текстового энкодера T5.

Почему это круто?
— IF неплохо умеет генерировать текст (я даже генерил в канале ранее), явно лучше чем StableDiffusion XL

— Нормальная открытая имплементация по типу Imagen, которой до сих пор не было. Возможно с какими-то трюками, о которых мы узнаем, когда авторы выпустят блогпост

— FID скор измеряет похожесть снеренированных картинок на реальные. Это чуть ли не основная метрика для качества генерации. У IF FID=6.7, тогда как у Imagen 7.3. Меньше — лучше. Разрыв не космический, но приличный.

Код выложили, веса ждем тут. И ждем подробной статьи от авторов.

@ai_newz

🔥40❤2👍2👎2

4.31K views11:49

2025/07/10 23:24:24
Back to Top

HTML Embed Code:

<iframe width="100%" src="https://www.bootg.com/buyppe/web?embed=1" title="Telegram Web" frameborder="0" allow="accelerometer; autoplay; clipboard-write; encrypted-media; gyroscope; picture-in-picture" allowfullscreen></iframe>