HeyGem
Опенсорсная альтернатива HeyGen. Ну можно было и по названию догадаться
- Аватар в 4K по отрывку видео 1 секунда (???)
- Клонирование лица и голоса
- Запускается на 1080Ti +
Код
#lipsync #humanavatar #vocecloning #avatar #
Опенсорсная альтернатива HeyGen. Ну можно было и по названию догадаться
- Аватар в 4K по отрывку видео 1 секунда (???)
- Клонирование лица и голоса
- Запускается на 1080Ti +
Код
#lipsync #humanavatar #vocecloning #avatar #
😐8🔥7👍3
Опубликован код и веса видеореставратора SeedVR2
Одна H100-80G может обрабатывать видео с разрешением 100x720x1280. 4 штуки H100-80G - дополнительно поддерживают видео 1080p и 2K.
Но обещают в будущем Tile-VAE и Progressive Aggregation Sampling
Код
Веса
#videorestoration
Одна H100-80G может обрабатывать видео с разрешением 100x720x1280. 4 штуки H100-80G - дополнительно поддерживают видео 1080p и 2K.
Но обещают в будущем Tile-VAE и Progressive Aggregation Sampling
Код
Веса
#videorestoration
Telegram
Нейронавт | Нейросети в творчестве
SeedVR2: One-Step Video Restoration via Diffusion Adversarial Post-Training
Метод одношаговой реставрации видео с помощью диффузии
Код ждем
#videorestoration
Метод одношаговой реставрации видео с помощью диффузии
Код ждем
#videorestoration
👍6😱2
Выпущена новая версия Pinokio 3.9.0
Исправили проблему с "Discover" страницей.
#news
Исправили проблему с "Discover" страницей.
Теперь мы используем URL GitHub Pages напрямую, чтобы не только исправить текущую проблему с доменом, но и убедиться, что такие проблемы не возникнут в будущем даже в самом худшем случае.
Размещая сайт полностью на GitHub Pages и используя URL GitHub Pages напрямую (вместо использования пользовательского домена, который требует обслуживания), мы можем быть уверены, что даже в худшем случае приложение продолжит работать (если только GitHub не отключится).
#news
GitHub
Releases · pinokiocomputer/pinokio
AI Browser. Contribute to pinokiocomputer/pinokio development by creating an account on GitHub.
👍3😁1
This media is not supported in your browser
VIEW IN TELEGRAM
PartCrafter: Structured 3D Mesh Generation via Compositional Latent Diffusion Transformers
3D-генератор от ByteDance, синтезирует набор семантически значимых 3D-сеток из одного изображения. Короче, создает не единую сетку, а модель состоящую из частей
Код и демо ждем
#imageto3d
3D-генератор от ByteDance, синтезирует набор семантически значимых 3D-сеток из одного изображения. Короче, создает не единую сетку, а модель состоящую из частей
Код и демо ждем
#imageto3d
👍7
This media is not supported in your browser
VIEW IN TELEGRAM
MIDI: Multi-Instance Diffusion for Single Image to 3D Scene Generation
Генератор 3D-сцен из одного изображения с помощью многообъектной диффузионной модели от VAST AI. Позволяет одновременно генерировать несколько 3D объектов с точными пространственными отношениями и высокой степенью обобщения
Нейминг конечно божественный
Код
Демо
#imageto3d #imagetoscene
Генератор 3D-сцен из одного изображения с помощью многообъектной диффузионной модели от VAST AI. Позволяет одновременно генерировать несколько 3D объектов с точными пространственными отношениями и высокой степенью обобщения
Нейминг конечно божественный
Код
Демо
#imageto3d #imagetoscene
👍5
Self Forcing: Bridging the Train-Test Gap in Autoregressive Video Diffusion
Метод ускорения видеогенерации через какие-то там трюки на обучении.
Модель генерирует высококачественные видео с разрешением 480P с начальной задержкой ~ 0,8 секунды, после чего кадры генерируются в потоковом режиме со скоростью ~ 16 кадров в секунду на одной H100 и ~ 10 кадров в секунду на одной 4090 с некоторой оптимизацией.
Уже работает #comfyui нативно и в враппере, просто нужна модель от HF.
Это модель 1.3B T2V, но в враппере ее можно использовать с модулем Vace для дополнительных входов.
Есть 3 модели, нужна только одна, dmd, кажется, работает хорошо...
Это малошаговая модель, вероятно, быстрее, чем использование Causvid lora (на модели 1.3b)
Используйте LCM SAMPLER
Код
воркфлоу
#text2video #optimization #realtime
Метод ускорения видеогенерации через какие-то там трюки на обучении.
Модель генерирует высококачественные видео с разрешением 480P с начальной задержкой ~ 0,8 секунды, после чего кадры генерируются в потоковом режиме со скоростью ~ 16 кадров в секунду на одной H100 и ~ 10 кадров в секунду на одной 4090 с некоторой оптимизацией.
Уже работает #comfyui нативно и в враппере, просто нужна модель от HF.
Это модель 1.3B T2V, но в враппере ее можно использовать с модулем Vace для дополнительных входов.
Есть 3 модели, нужна только одна, dmd, кажется, работает хорошо...
Это малошаговая модель, вероятно, быстрее, чем использование Causvid lora (на модели 1.3b)
Используйте LCM SAMPLER
Код
воркфлоу
#text2video #optimization #realtime
❤10
This media is not supported in your browser
VIEW IN TELEGRAM
Topaz Labs Astra
"Первый в мире" (ага) креативный апскейлер видео. Предлагают апскейлить сгенерарованные нейросетками видео до 4K, "с улучшением качества и добавлением мельчайших деталей". Под капотом новые модели Starlight
Умеет делать интерполяцию кадров, то есть добавлять кадры меж существующих (для слоумоушена)
Чтобы поклянчить доступ ставьте лайк официальному твиту и там в комментах напишите "Astra"
Или идем на офсайт и жмем кнопку Get early access
#upscalevideo #upscale #frameinterpolation
"Первый в мире" (ага) креативный апскейлер видео. Предлагают апскейлить сгенерарованные нейросетками видео до 4K, "с улучшением качества и добавлением мельчайших деталей". Под капотом новые модели Starlight
Умеет делать интерполяцию кадров, то есть добавлять кадры меж существующих (для слоумоушена)
Чтобы поклянчить доступ ставьте лайк официальному твиту и там в комментах напишите "Astra"
Или идем на офсайт и жмем кнопку Get early access
#upscalevideo #upscale #frameinterpolation
❤7😈1
Опубликован код нвидиевского GEN3C
Говорят, что 48ГБ VRAM не хватает
Только линукс
Код
#image2video #cameracontrol
Говорят, что 48ГБ VRAM не хватает
Только линукс
Код
#image2video #cameracontrol
👍5🔥2❤1🤯1
Magistral
Новая рассуждающая модель от Mistral.
Быстрый. Справляется с задачами, требующими специфических знаний, прозрачности и мультиязычности. Понимает русский
• Small - опенсорс.
• Medium - более крупная модель для корпоративных клиентов. Тянется к уровню DeepSeek R1. Превью можно потестить в Le Chat.
Веса Small на HF
LeChat - Попробовать Medium
#assistant #reasoning
Новая рассуждающая модель от Mistral.
Быстрый. Справляется с задачами, требующими специфических знаний, прозрачности и мультиязычности. Понимает русский
• Small - опенсорс.
• Medium - более крупная модель для корпоративных клиентов. Тянется к уровню DeepSeek R1. Превью можно потестить в Le Chat.
Веса Small на HF
LeChat - Попробовать Medium
#assistant #reasoning
👍7
This media is not supported in your browser
VIEW IN TELEGRAM
Krea 1
Новый генератор картинок от Krea AI
Пока еще не в общем доступе
- способty создавать изображения с фотореалистичными текстурами кожи и продвинутой цветопередачей;
- предлагает возможность работы с экстремальными ракурсами камеры;
- умеет воспроизводить визуальные эффекты, такие как зёрно, блики и размытие;
- отличается высокой визуальной сложностью генерируемых изображений;
- позволяет создавать художественные и выразительные рендеры, включая ультрареалистичный сюрреализм;
- совместим с Krea Train, что позволяет обучать модель на пользовательских изображениях для воспроизведения определённого стиля, объектов или лиц.
Попросить ранний доступ
#text2image #imageediting
Новый генератор картинок от Krea AI
Пока еще не в общем доступе
- способty создавать изображения с фотореалистичными текстурами кожи и продвинутой цветопередачей;
- предлагает возможность работы с экстремальными ракурсами камеры;
- умеет воспроизводить визуальные эффекты, такие как зёрно, блики и размытие;
- отличается высокой визуальной сложностью генерируемых изображений;
- позволяет создавать художественные и выразительные рендеры, включая ультрареалистичный сюрреализм;
- совместим с Krea Train, что позволяет обучать модель на пользовательских изображениях для воспроизведения определённого стиля, объектов или лиц.
Попросить ранний доступ
#text2image #imageediting
👍8💩4
This media is not supported in your browser
VIEW IN TELEGRAM
Triangle Splatting for Real-Time Radiance Field Rendering
Новый способ представления и рендера объемных сцен от DeepMind и Ко на треугольных сплатах. Конец гегемонии гауссовых сплатов?
- Высокая визуальная точность. В отличие от гауссиан сохраняет четкость в мелких деталях
- Быстрая сходимость
- Скорость. Более 2400 FPS при разрешении 1280×720 на RTX4090
- Совместим с традиционными пайплайнами
Код
#rendering #news #trisplat #photogrammetry
Новый способ представления и рендера объемных сцен от DeepMind и Ко на треугольных сплатах. Конец гегемонии гауссовых сплатов?
- Высокая визуальная точность. В отличие от гауссиан сохраняет четкость в мелких деталях
- Быстрая сходимость
- Скорость. Более 2400 FPS при разрешении 1280×720 на RTX4090
- Совместим с традиционными пайплайнами
Код
#rendering #news #trisplat #photogrammetry
🔥5
😁14👍3