Нейронавт | Нейросети в творчестве 7381

MultiTalk: Let Them Talk: Audio-Driven Multi-Person Conversational Video Generation

Новый липсинк. Модель для создания видео с диалогами на основе аудиозаписей.

- несколько говорящих
- до 15 секунд в 480p и 720p
- контроль персонажей текстом
- генерация мультфильмов и видео с пением и другими типами речи

Код
Веса 10 Гб
ComfyUI Kijai перед отпуском сделал
Колаб на A100

#Lipsync #potraitanimation #speech2video #comfyUI #humananimation

1.9K views09:11

Нейронавт | Нейросети в творчестве

1:04

This media is not supported in your browser

VIEW IN TELEGRAM

Google Magenta RT

модель создания музыки в реальном времени.

Впервые Google представили Magenta еще в 2016 году. С тех пор появился плагин к Ableton кроме всего прочего. И вот новая рилтаймовая модель

Генерирует музыку на ходу по текстовым запросам и/или аудиосэмплам

Модель основана на архитектуре MusicLM и использует блок-авторегрессию для генерации непрерывного потока музыки

Оперирует двухсекундными отрывками, поэтому из сэмпла может забрать только 2 секунды для образца стиля. Задержка 2 секунды - можно уменьшить для большей реактивности.

Собственный контекст - всего 10 секунд, поэтому не рассчитывайте на длинные музыкальные структуры.

Не умеет создавать песни, ибо на лирике не обучался.

Обещают добавить локальный запуск и кастомизацию

Код
HF
Колаб

#text2music #music2music #audio2music #musicediting #realtime #dj

1.5K viewsedited 06:22

Нейронавт | Нейросети в творчестве

0:48

This media is not supported in your browser

VIEW IN TELEGRAM

Rodin add-on for Blender

отвлечемся от потока хайлуовщины.
Deemos выпустили полноценный плагин для Блендера. Создать модель по картинке в один клик, панель ассетов, 3D контролнет, все дела

скачать - впишите в окошко цены 0 или другую сумму которую хотите заплатить

#blender #imageto3d

1.6K views09:12

Нейронавт | Нейросети в творчестве

1:29

Media is too big

VIEW IN TELEGRAM

OmniGen2: Exploration to Advanced Multimodal Generation

Новая версия редактора-генератора-персонализатора изображений

Создает картинки по описанию, редактирует их по инструкциям, переносит объекты из одной картинки в другую.

Есть режим с рефлексией: модель понимает, что изображено на картинке, и может улучшать свои результаты, анализируя их

Код

Демоспейсы, большинство из них скоро умрет:
https://huggingface.co/spaces/OmniGen2/OmniGen2
https://8f10329141d53b6884.gradio.live/
https://110863cb06c6c44bd2.gradio.live/
https://981758b17b4197aea7.gradio.live/
https://981758b17b4197aea7.gradio.live/

С чатом:
https://9315447fc78ef638e3.gradio.live/
https://abe054be89543e4cef.gradio.live/
https://4aa913765db00bbe51.gradio.live/
https://f28a8718565627d2cb.gradio.live/

#personalization #imageediting #text2image #image2image #referencing

1.5K viewsedited 09:42

Нейронавт | Нейросети в творчестве

1:06

This media is not supported in your browser

VIEW IN TELEGRAM

11ai

Персональный голосовой ассистент от Elevenlabs с поддержкой #MCP

Интегрируется с perplexity, linear, SlackHQ и др

У меня ссылка не открывается, я же гражданин неправильной страны 😡

#assistant #voicemode

Please open Telegram to view this post

VIEW IN TELEGRAM

1.5K views10:13

Нейронавт | Нейросети в творчестве

2:08

Media is too big

VIEW IN TELEGRAM

SongBloom

Генератор полных музыкальных композиций с согласованной структурой и гармоничными инструментальными и вокальными элементами.

Модель использует комбинированный подход, объединяющий авторегрессионное моделирование и диффузионные процессы для создания музыки. Возможности модели:

- Постепенное расширение музыкального эскиза от короткого к длинному.

- Уточнение деталей от общих до более тонких.

- Интеграция семантического и акустического контекста для управления процессом генерации.

Код
Веса

#text2music #music #musicediting

1.7K views10:43

Нейронавт | Нейросети в творчестве

FluxZayn: FLUX LayerDiffuse Extension for Stable Diffusion WebUI Forge

Народная версия layerdiffusion с Flux под капотом вместо SD. Создает картинки с альфа-каналом (прозрачностью)

расширение для Forge
LayerDiffuse-Flux - оригинальный код

Для #ComfyUI есть ComfyUI_FluxLayerDiffuse

#extension #forge #text2image #flux #RGBA

1.7K views13:16

Нейронавт | Нейросети в творчестве

Гудини, что с лицом?

1.5K views18:10

Нейронавт | Нейросети в творчестве

Forwarded from Psy Eyes

0:59

This media is not supported in your browser

VIEW IN TELEGRAM

Горячие опенсорсные девушки!

Контроль пламени с помощью масок в Wan. Залипательно.

А Midjourney так может?

Автор

1.4K views18:10

Нейронавт | Нейросети в творчестве

ComfyUI Nodes for SongBloom

Ноды вчерашнего генератора музыки

Спасибо @MaxKhtv

#text2music #music #musicediting #comfyui

GitHub

GitHub - fredconex/ComfyUI-SongBloom

Contribute to fredconex/ComfyUI-SongBloom development by creating an account on GitHub.

1.5K viewsedited 06:30

Нейронавт | Нейросети в творчестве

заработал демоспейс мобильного генератора речи и подкастов vui

По-русски ни бельмес

Демо

#tts #text2speech #voicecloning #conversation #mobile #podcast

0:25

Нейронавт | Нейросети в творчестве

fluxions AI vui

Небольшие разговорные модели речи, которые могут запускаться на устройстве

Это опенсорсный конкурент notebooklm

Голосовая модель 100М параметров

Умеет клонировать голос

модели могут издавать различные неречевые звуки. Добавляйте в текст…

1.4K views07:07

Нейронавт | Нейросети в творчестве

astra.app

"Первый в мире" креативный апскейлер видео от Topaz Labs вышел из стадии раннего доступа и доступен для всех... от $39 в месяц

#upscalevideo #upscale #frameinterpolation

1.3K views07:41

Нейронавт | Нейросети в творчестве

2:00

Media is too big

VIEW IN TELEGRAM

Claude Code for VSCode

На прошлой неделе Anthropic запустил плагин для интеграции своего инструмента в IDE

Бонус:
Claudia - интерфейс и набор инструментов для Claude Code

Работает на Windows, macOS и Linux.

Опенсорс, запускается локально.

#coding #assistant

1.4K views08:11

2025/07/07 11:59:15
Back to Top

HTML Embed Code:

<iframe width="100%" src="https://www.bootg.com/buyppe/web?embed=1" title="Telegram Web" frameborder="0" allow="accelerometer; autoplay; clipboard-write; encrypted-media; gyroscope; picture-in-picture" allowfullscreen></iframe>