OmniAvatar: Efficient Audio-Driven Avatar Video Generation with Adaptive Body Animation
Оживлятор персонажей по звуку речи от Alibaba.
С липсинком, естественно. Есть контроль эмоций, фона, управление жестами и их амплитудой. Даже взимодействие с объектами умеет делать
Есть веса для WAN 1.3B и WAN 14B
Код
#portraitanimation #characteranimation #lipsync
Оживлятор персонажей по звуку речи от Alibaba.
С липсинком, естественно. Есть контроль эмоций, фона, управление жестами и их амплитудой. Даже взимодействие с объектами умеет делать
Есть веса для WAN 1.3B и WAN 14B
Код
#portraitanimation #characteranimation #lipsync
👍9👎2🤔1
ComfyUI-nunchaku
Нода nunchaku v0.3.3 теперь поддерживает FLUX Kontext
Скачивайте 4-битные кванты
воркфлоу с 8-step FLUX.1-Turbo LoRA
#workflow #comfyui
Нода nunchaku v0.3.3 теперь поддерживает FLUX Kontext
Скачивайте 4-битные кванты
воркфлоу с 8-step FLUX.1-Turbo LoRA
#workflow #comfyui
🔥11👍1
This media is not supported in your browser
VIEW IN TELEGRAM
Songscription
Преобразует аудиозапись в ноты и midi файлы. Это избавляет от необходимости вручную разбирать композицию.
Поддерживает транскрибацию нескольких инструментов, модель для фортепиано пока самая надёжная. В будущем планируют добавить гитарные табулатуры и аранжировки для ансамблей
Piano roll тоже может сделать
Экспорт транскрипций в форматах PDF, MIDI и MusicXML
На вход принимает youtube ссылки
Фримиум
#music2midi #music2notation #notation #audio2midi
Преобразует аудиозапись в ноты и midi файлы. Это избавляет от необходимости вручную разбирать композицию.
Поддерживает транскрибацию нескольких инструментов, модель для фортепиано пока самая надёжная. В будущем планируют добавить гитарные табулатуры и аранжировки для ансамблей
Piano roll тоже может сделать
Экспорт транскрипций в форматах PDF, MIDI и MusicXML
На вход принимает youtube ссылки
Фримиум
#music2midi #music2notation #notation #audio2midi
👍21😱1
Пара новостей от универсального агента Kortix Suna
1. Даже на бесплатном тарифе теперь Sonnet 4
2. Сохам Парех своим успехом обязан Suna (если не врут)
#agent #news
1. Даже на бесплатном тарифе теперь Sonnet 4
2. Сохам Парех своим успехом обязан Suna (если не врут)
#agent #news
😱4👍1
This media is not supported in your browser
VIEW IN TELEGRAM
Hunyuan-A13B
Новая LLM от Hunyuan / Tencent
Архитектура совет экспертов (#MoE)
Оптимизирована на агентские задачи
Контекст 256K
13 B активных параметров из общего числа в 80 B
Поддержка гибридного рассуждения: позволяет выбирать между быстрым и медленным режимами мышления
Попробовать где-то здесь
API
HF
Гитхаб
#assistant #agent #reasoning
Новая LLM от Hunyuan / Tencent
Архитектура совет экспертов (#MoE)
Оптимизирована на агентские задачи
Контекст 256K
13 B активных параметров из общего числа в 80 B
Поддержка гибридного рассуждения: позволяет выбирать между быстрым и медленным режимами мышления
Попробовать где-то здесь
API
HF
Гитхаб
#assistant #agent #reasoning
❤6👍4
Нейронавт | Нейросети в творчестве
Объявляю сброс мемов, накопилось #humor
А вот и продолжение
Забавно что уже сегодня ИИ лучше ставит диагнозы чем в среднем человеки-врачи.
*Без негатива к врачам
#humor #news
Забавно что уже сегодня ИИ лучше ставит диагнозы чем в среднем человеки-врачи.
*Без негатива к врачам
#humor #news
😁9🔥2👍1
😁6👍2❤1🔥1
Media is too big
VIEW IN TELEGRAM
EX-4D: EXtreme Viewpoint 4D Video Synthesis via Depth Watertight Mesh
Генератор видео от ByteDance с возможностью управления камерой из одноглазого (монокулярного) входного сигнала. Модель особенно эффективна при работе с экстремальными точками зрения.
Представляет собой LoRa на 1% параметров😏
Код
Демо ждем
#cameracontrol #novelview
Генератор видео от ByteDance с возможностью управления камерой из одноглазого (монокулярного) входного сигнала. Модель особенно эффективна при работе с экстремальными точками зрения.
Представляет собой LoRa на 1% параметров😏
Код
Демо ждем
#cameracontrol #novelview
🔥7👍1🤔1