Telegram Web Link
IndexTTS: An Industrial-Level Controllable and Efficient Zero-Shot Text-To-Speech System

Голосовой движок от Qwen
Говорит на английском и китайском
Есть контроль эмоций, контроль произношения/акцента

Работает на 4Гб VRAM

Пишут что не дотягивает до Zonos, но превосходит другие типа Spark, XTTS

Код
Веса
Видео туториал

#voicecloning #text2speech #tts
👍5
WORLDMEM: Long-term Consistent World Simulation with Memory

Очередная бродилка по генеративным игровым мирам. Но на этот раз с памятью. Он запоминает где что было, уходите, возвращаетесь - все на месте. С реалистичными сценами тоже работает. И даже демка есть. Есть и минус, она не интерактивная, действия вводятся промптом перед генерацией

Код
Демо

#gaming #image2world
👍42
В репозиторий FramePack добавлен инсталлятор для Windows

Скачиваем, распаковываем, запускаем сначала update.bat (важно), потом run.bat

спасибо @Skubidoo

Инсталлятор

#text2video #image2video #windows
6🔥5👍1🤔1
This media is not supported in your browser
VIEW IN TELEGRAM
Krea Stage

У Krea AI опять обновка.
Добавили функцию генерации 3D сцен

#image2scene #imageto3d #text2scene #textto3d
👍112
DICEPTION: A Generalist Diffusion Model for Vision Perception

Единая модель создает технические карты на уровне SOTA. Умеет делать глубину, нормали, позу? разные виды сегментации.

Сохраняет мелкие детали сегментации, такие как волосы.

Код ждем
Демо

Спасибо @m_franz

#conditioning #image2mask #image2normal #image2depth #image2pose #segmentation
👍10
This media is not supported in your browser
VIEW IN TELEGRAM
Опубликован код ReCamMaster, модели для изменения траектории камеры в видео.
Родную модель t2v использовать нельзя, но они прикрутили Wan2.1

Обещают онлайн сервис, новости ждем на сайте Kling

Код
Воркфлоу
Видеотуториал

#cameracontrol #novelview #video2video #stabilization #workflow #tutorial
🔥18👍1
SkyReels V2

Новая версия видеогенератора, умеет делать "бесконечные" видео

Выпущены модели 1.3B / 5B / 14B и код

Первая модель с открытым весом, конкурирующая с Sora, Kling и Veo2 на VBench и human evals


Генерация сюжета, генерация видео по картинке, управление камерой (эта модель будет позже), синтез видео из заданных элементов

Гитхаб
Веса
Попробовать (попробуйте создать новый аккаунт если на старом нет кредитов)
————————————

SkyCaptioner-V1

Кэпшнер от SkyReels - модель для структурного текстового описания видео

Веса
Демо ждем

#text2video #image2video #video2text #captioning #text2movie
🔥13👍21
2025/07/10 21:23:10
Back to Top
HTML Embed Code: