Нейронавт | Нейросети в творчестве 6873

Forwarded from Santry's Singularity blog

Король умер, да здравствует король!

Протестировал новую версию китайского 3D-генератора Hunyuan 2.5.

Итак, лягушка. Первое, на что бросается в глаза — адаптивная детализация, полигонов больше там, где они действительно нужны. Сетка отлично следует за формой — это особенно заметно по сердцу и орнаменту. Впервые на моей памяти нейронка так хорошо построила рельеф. Модель получилась симметричной, без видимых артефактов вроде дыр и пересечений. Только на лапе почему-то появилась неуместная ямка.

Текстура выглядит хуже. Задняя часть представляет собой сплошной визуальный шум, и даже спереди на сердце видны артефакты.

У предыдущих поколений image-to-3D моделей ворон либо получался неровным, либо симметричным, но с раздвоенным клювом. Просто отзеркалить фигурку по вертикальной оси нельзя, однако Hunyuan 2.5 в основном справляется: укладка перьев симметричная, при этом голова выглядит вполне естественно. Впрочем, на затылке рельеф отсутствует, а на правой лапе обнаружился лишний палец. Текстуры тоже далеки от идеала и не передают особенностей оригинальной картинки.

Фигурка Ктулху также приятно удивляет детализацией и симметричностью. Сетка немного хаотичная, но органические формы переданы реалистично. Текстура покрыта шумными деталями, однако судя по бликам, roughness map удался неплохо.

Подведем итоги. Сравнение с предыдущей серией экспериментов (8 моделей, Tripo3d, TRELLIS) говорит само за себя. Прирост в качестве значительный. Лягушку и Ктулху можно спокойно печатать на 3D-принтере без постобработки. Такими темпами вскоре придется обновлять тест, добавляя сложные формы, например, скульптуры людей.

Сейчас этот генератор доступен онлайн по адресу 3d.hunyuan.tencent.com (осторожно, интерфейс на китайском) и позволяет создавать до 20 моделей в день. А еще есть надежда на релиз в open source. По крайней мере, версия 2.0 представлена в pinokio и запускается на достаточно широком наборе конфигураций железа.
#нейронки #imageto3d #DIY

👍5❤3🤯1

1.1K views12:26

Нейронавт | Нейросети в творчестве

0:45

This media is not supported in your browser

VIEW IN TELEGRAM

0:29

This media is not supported in your browser

VIEW IN TELEGRAM

Hummingbird-0

Ну логично, видеоаватары уже есть, должно быть нетрудно адаптировать для липсинка.

Hummingbird-0 от Tavus делает реалистичную, сохраняющую индивидуальность синхронизацию губ из любого MP3 + MP4. Дообучение не требуется

Говорят, что SOTA (самая лучшая модель)

Попробовать

#lipsync

👍9😐2

1.73K views13:12

Нейронавт | Нейросети в творчестве

Hunyuan3D 2.5 Новая версия 3D-генератора, 10B параметров. Авториг, многоракурсная генерация 3D, PBR текстуры Попробовать - можно войти по имейлу #imageto3d #textto3d

Ахаха! Белая плесень

Ладно, сделал мне копеечный пластиковый сувенир вместо технологичного робота

😁7🥴1

1.46K views13:43

Нейронавт | Нейросети в творчестве

2:30

Media is too big

VIEW IN TELEGRAM

Lyria 2

Генератор музыки от Deepmind
Все серьезно и очень продуктово.

Детализация жанровых нюансов, генерация инструментальных партий по текстовым описаниям, расширение композиций, редактирование стиля. Можно менять темп, тональность или полностью переосмыслить трек

Записаться в вейтлист
————————

Lyria RealTime

А это тот же генератор в реальном времени, есть кнопка попробовать (не для россиян)

Ну что, суно/удио бояться, батя вышел на поляну.

#music #text2music #music2music

🔥6🤷‍♂1

1.83K viewsedited 14:07

Нейронавт | Нейросети в творчестве

1:05

This media is not supported in your browser

VIEW IN TELEGRAM

MusicGPT

Еще один генератор-редактор музыки/песен/звука

Можно делать инструментал, можно с вокалом

Делает ремиксы, умеет преобразовывать звуки, в том числе изменять голос. Ах да, есть TTS, может создать речь из вашего текста

И какой позор что их презентационное видео в твиттере залито БЕЗ ЗВУКА!

Я вам сам потыкал в ТОП 50 с сайта, наслаждайтесь

На старте дают 500 кредитов - это примерно на 10 музыкальных треков. За приглашение друзей докидывают еще по 500 кредитов. Но коммерческое использование музыки все равно только на платном тарифе

#music #text2music #text2sound #music2music #tts #text2speech

🔥9🤮1

2.03K views14:36

Нейронавт | Нейросети в творчестве

0:01

This media is not supported in your browser

VIEW IN TELEGRAM

0:36

This media is not supported in your browser

VIEW IN TELEGRAM

Seurat: From Moving Points to Depth

Еще один трекер точек/генератор глубины для видео. Глубину предсказывает по траекториям точек, не по картинке как обычно делают остальные модели

Код ждем
Демо ждем

#trtacking #video2depth

❤3

1.79K views15:46

Нейронавт | Нейросети в творчестве

Пересмотрел старый фильм, навеяло

#neuronaut_art #humor

😁25❤7👍2👎1

1.86K views19:14

Нейронавт | Нейросети в творчестве

0:05

This media is not supported in your browser

VIEW IN TELEGRAM

0:28

This media is not supported in your browser

VIEW IN TELEGRAM

0:05

This media is not supported in your browser

VIEW IN TELEGRAM

0:31

This media is not supported in your browser

VIEW IN TELEGRAM

CausVid: From Slow Bidirectional to Fast Autoregressive Video Diffusion Models

Это не просто быстрый видеогенератор, это видеогенератор в реальном времени от MIT и Adobe, основанный на WAN

9.4 кадра в секунду на одном GPU (вероятнее всего, речь о H100)

Обещают взять более качественный датасет и обучить модель с лучшим качеством

Код

#text2video #image2video #realtime

😱10👍5🔥5😐3💩2

2.38K views20:28

Нейронавт | Нейросети в творчестве

Время мемов и рефлексии

#humor

😁18💩3❤2🤡2🤮1

1.76K views14:58

2025/07/09 09:11:24
Back to Top

HTML Embed Code:

<iframe width="100%" src="https://www.bootg.com/buyppe/web?embed=1" title="Telegram Web" frameborder="0" allow="accelerometer; autoplay; clipboard-write; encrypted-media; gyroscope; picture-in-picture" allowfullscreen></iframe>