This media is not supported in your browser
VIEW IN TELEGRAM
Luma Modify Video
Обновка видеогенератора Ray2.
• Позволяет стилизовать видео длиной до 10 секунд с сохранением динамики персонажей, лицевой анимации и деталей фона.
• Можно изолировать отдельные элементы, такие как одежда, лица и предметы
• Позволяет подавать визуальные референсы
Доступно на тарифах Unlimited и Enterprise.
#videoediting #stylize
Обновка видеогенератора Ray2.
• Позволяет стилизовать видео длиной до 10 секунд с сохранением динамики персонажей, лицевой анимации и деталей фона.
• Можно изолировать отдельные элементы, такие как одежда, лица и предметы
• Позволяет подавать визуальные референсы
Доступно на тарифах Unlimited и Enterprise.
#videoediting #stylize
Media is too big
VIEW IN TELEGRAM
TIGER: Time-frequency Interleaved Gain Extraction and Reconstruction for Efficient Speech Separation
Легковесная китайская модель для разделения речи, музыки, эффектов
Хвастаются что бьют #SOTA модель TF-GridNet
Код
#audioseparation #demix #unmix
Легковесная китайская модель для разделения речи, музыки, эффектов
Хвастаются что бьют #SOTA модель TF-GridNet
Код
#audioseparation #demix #unmix
This media is not supported in your browser
VIEW IN TELEGRAM
MMaDA - Open-Sourced Multimodal Large Diffusion Language Models
Рассуждающая визуально-языковая модель
Умеет генерировать картинки по тексту? понимать их и рассуждать
Код
Демо
#vlm #reasoning
Рассуждающая визуально-языковая модель
Умеет генерировать картинки по тексту? понимать их и рассуждать
Код
Демо
#vlm #reasoning
Media is too big
VIEW IN TELEGRAM
Sky
Агент-ассистент для #Mac
Может выполнять действия и отвечать на вопросы для любого окна и любого приложения, открытого на вашем Mac
Под капотом GPT 4.1 или Claude. Умеет пользоваться MCP
Большой обзор
Записаться в вейтлист
#agent
Агент-ассистент для #Mac
Может выполнять действия и отвечать на вопросы для любого окна и любого приложения, открытого на вашем Mac
Под капотом GPT 4.1 или Claude. Умеет пользоваться MCP
Большой обзор
Записаться в вейтлист
#agent
This media is not supported in your browser
VIEW IN TELEGRAM
DCM: Dual-Expert Consistency Model for Efficient and High-Quality Video Generation
Ускорение видеогенерации в 10 раз с сохранением качества. Лучше чем LCM и PCM
Прикручено к HunyuanVideo и WAN2.1
Код
Веса
#optimization #text2video
Ускорение видеогенерации в 10 раз с сохранением качества. Лучше чем LCM и PCM
Прикручено к HunyuanVideo и WAN2.1
Код
Веса
#optimization #text2video
This media is not supported in your browser
VIEW IN TELEGRAM
FLAIR: Flow-Based Latent Alignment for Image Restoration
Инверсное восстановление и редактирование изображений на основе потока
Код
Демо
#imageediting #imagerestoration
Инверсное восстановление и редактирование изображений на основе потока
Код
Демо
#imageediting #imagerestoration
Brie's FramePack Lazy Repose workflow
Управляем позой в FramePack
+ еще какие-то воркфлоу для WAN и VACE
#pose2video #image2video #workflow
Управляем позой в FramePack
+ еще какие-то воркфлоу для WAN и VACE
#pose2video #image2video #workflow
This media is not supported in your browser
VIEW IN TELEGRAM
FlowMo: Variance-Based Flow Guidance for Coherent Motion in Video Generation
Улучшение согласованности движения для видеогенераторов без дообучения
Прикручено к Wan2.1 и CogVideo
Код
#text2video
Улучшение согласованности движения для видеогенераторов без дообучения
Прикручено к Wan2.1 и CogVideo
Код
#text2video
This media is not supported in your browser
VIEW IN TELEGRAM
Mirage Studio
Сервис говорящих аватаров от Captions уехал на отдельный сайт и дает бесплатно 600 кредитов, 1 секунда видео обойдется в 10 кредитов.
Создает видео говорящего блогера по тексту или аудио.
Можно настроить мимику, движения, эмоции, голос и фон
Попробовать
#humananimation #speech2video #humanavatar
Сервис говорящих аватаров от Captions уехал на отдельный сайт и дает бесплатно 600 кредитов, 1 секунда видео обойдется в 10 кредитов.
Создает видео говорящего блогера по тексту или аудио.
Можно настроить мимику, движения, эмоции, голос и фон
Попробовать
#humananimation #speech2video #humanavatar
IEAP: Image Editing As Programs with Diffusion Models
И еще один метод редактирования изображений на диффузных трансформерах
Разбивает сложные инструкции на последовательность простых операций. Операции программируются агентом на основе VLM
Код
Демо
#imageediting #inpainting
И еще один метод редактирования изображений на диффузных трансформерах
Разбивает сложные инструкции на последовательность простых операций. Операции программируются агентом на основе VLM
Код
Демо
#imageediting #inpainting
Media is too big
VIEW IN TELEGRAM
ElevenLabs v3
Пользоваться этим сервисом - слишком попоболь, но вдруг вы мазохист или не россиянин - для вас выкатили самую выразительную модель озвучки текста.
- Поддерживает 70+ языков
- многоголосовой режим
- аудио-теги, которые задают интонацию, эмоции и паузы в речи.
- Считывает эмоциональные переходы, реагирует на контекст, меняет тон в процессе речи.
Весь июнь дают 80% скидки на генерацию.
Промпт-гайд для v3
#tts #text2pseech
Пользоваться этим сервисом - слишком попоболь, но вдруг вы мазохист или не россиянин - для вас выкатили самую выразительную модель озвучки текста.
- Поддерживает 70+ языков
- многоголосовой режим
- аудио-теги, которые задают интонацию, эмоции и паузы в речи.
- Считывает эмоциональные переходы, реагирует на контекст, меняет тон в процессе речи.
Весь июнь дают 80% скидки на генерацию.
Промпт-гайд для v3
#tts #text2pseech
Voyager: Long-Range and World-Consistent Video Diffusion for Explorable 3D Scene Generation
Видеогенератор создает по одной картинке объемно согласованный мир, последовательность облаков точек с заданной пользователем траекторией камеры. Якобы пригоден для 3D реконструкции с согласованноыми RGB и глубиной
Короче, это не рандомные шевеления, а правильные шевеления, как надо шевеления картинки
Код ждем
#image2video
Видеогенератор создает по одной картинке объемно согласованный мир, последовательность облаков точек с заданной пользователем траекторией камеры. Якобы пригоден для 3D реконструкции с согласованноыми RGB и глубиной
Короче, это не рандомные шевеления, а правильные шевеления, как надо шевеления картинки
Код ждем
#image2video