Telegram Web Link
8👍3
👍95
9👍6
Обученный на 5 миллиардном датасете, 400м модель guided diffusion

Collab 💫

Promt: a robot holding a sign that reads: "This is weird"
🔥9
релизнуть? 👀
26👍3🔥2
Forwarded from Kali Novskaya (Tatiana Shavrina)
Некоторые репозитории sberbank-ai работают с переадресацией, ничего менять не нужно.

Всё наши открытые модели: ruGPT3, ruDALL-E, зоопарк трансформеров, — останутся в открытом доступе.

Ушла готовить для вас новый релиз. 🗿
Stay tuned!
https://github.com/ai-forever/
Сделал релиз, теперь можно с помощью моделей ruDALLE генерить изображения с произвольным соотношением сторон

Обучать не нужно, все работает в zero-shot

Идея супер-простая: динамически менять размер контекстного окна пропорционально текущей позиции, чтобы попытаться хоть как-то сохранить правильную геометрию. Работает, черри-пикать тоже нужно, как и всю рудалю. А для горизонтальных картинок (из-за низкой скорости) пришлось оставить статическое контекстное окно - но получается тоже весьма неплохо - генерил себе шапки для NFT коллекций

Также, чтобы немного сгладить геометрию, затюнил модельку на сюрреализме, веса прикладываю ruDALLE Surrealist XL

Kaggle и Colab рабочие тоже собрал 🤝

Paper | Github | Weights | Colab | Kaggle | Twitter
👍23🔥52
есть рабочая идея как сделать динамическое контекстное окно одновременно по двум осям 😈🔥 ожидается дополнительный эффект super-resolution + более быстрая генерация горизонтальных изображений

мне вчера скинули колаб от @neverix, где довольно круто работает кеширование 🤝
🔥5👍2
скрестил свою идею rudalle-aspect-ratio с кешированием @neverix , о котором писал в предыдущем посте - посмотрите первые результаты генераций 1024x1024 рудалей only, ожидаемый эффект super-resolution выглядит сладко 😋😋😋 в след посте сделаю что-то с сюрреализмом 😈

вопрос:

1. делать релиз и забить на arxiv, начать вести свои тех-репорты на google drive? 😂

2. или все же как-то поспамить твиттер arxiv’а за отклонение тех-репорта с причиной: “недостаточно значимый научный результат”? тут, конечно, до результатов openai DALLE-2 далеко, но не отклонять же теперь все другие работы … 😳

[Twitter]
🔥151👍1
Forwarded from Kali Novskaya (Tatiana Shavrina)
Вместе с командой AGI NLP выпустили mGPT: GPT-3 на 61 языке мира

mGPT: Few-Shot Learners Go Multilingual

- Модель HuggningFace
- Репа
- Google Colab с примерами генерации, тюнинга
- Arxiv: подробнее о всей процедуре оценки и обучении

https://habr.com/ru/post/662195/
🔥6👍2
“лицо девушки” rudalle-aspect-ratio 48x48 sequence (384x384 px) - без realesrgan 😋
🔥10
“горное озеро” 2048x2048px (256x256) - на А100 генерилось 1 час 20 мин 😋 какая прорисовка и геометрия 😋 оригинальный файл закинул в комменты к посту, можно поразглядывать
🔥162
2025/07/09 05:31:56
Back to Top
HTML Embed Code: