This media is not supported in your browser
VIEW IN TELEGRAM
MotionPro: A Precise Motion Controller for Image-to-Video Generation
Контроль движения объектов и камеры на видео от HiDream. Этот сделан на SVD
Код
Веса
#motioncontrol #cameracontrol #image2video
Контроль движения объектов и камеры на видео от HiDream. Этот сделан на SVD
Код
Веса
#motioncontrol #cameracontrol #image2video
❤4
Topaz Bloom
Новsq апскейлер изображений от Topaz Labs.
Креативное увеличениt ИИ-изображений (а другие нельзя?) до 8 раз, с добавлением деталей и в то же время точное.
5 режимов креативности от Subtle до Max, 4 вариации за раз.
сегодня до полуночи (по их времени) всем бесплатный Bloom апскейл
Напишите "Bloom Day" в комментариях к официальному твиту для раннего доступа - будет действовать до полуночи. Не забудьте открыть личку для сообщений
#upscale
Новsq апскейлер изображений от Topaz Labs.
Креативное увеличениt ИИ-изображений (а другие нельзя?) до 8 раз, с добавлением деталей и в то же время точное.
5 режимов креативности от Subtle до Max, 4 вариации за раз.
сегодня до полуночи (по их времени) всем бесплатный Bloom апскейл
Напишите "Bloom Day" в комментариях к официальному твиту для раннего доступа - будет действовать до полуночи. Не забудьте открыть личку для сообщений
#upscale
❤6👍2👎2😭1
Chain-of-Zoom: Extreme Super-Resolution via Scale Autoregression and Preference Alignment
Новый апскейлер картинок от KAIST AI. Неплохо?
Принцип работы такой:
CoZ использует уже обученную модель для повышения разрешения, разбивая процесс на несколько этапов.
На каждом этапе модель применяет текстовые подсказки, сгенерированные специальной моделью, чтобы улучшить качество изображения при увеличении.
Это позволяет достигать экстремальных уровней увеличения (например, от 16x до 256x) с сохранением деталей и качества изображения.
Под капотом - #SD3, Qwen2.5-VL-3B-Instruct и какая-то модель RAM. Говорят, что 24 ГБ должно хватать, но рекомендуют 2 GPU
Код
Демо
Спасибо @asleephidden
#upscale
Новый апскейлер картинок от KAIST AI. Неплохо?
Принцип работы такой:
CoZ использует уже обученную модель для повышения разрешения, разбивая процесс на несколько этапов.
На каждом этапе модель применяет текстовые подсказки, сгенерированные специальной моделью, чтобы улучшить качество изображения при увеличении.
Это позволяет достигать экстремальных уровней увеличения (например, от 16x до 256x) с сохранением деталей и качества изображения.
Под капотом - #SD3, Qwen2.5-VL-3B-Instruct и какая-то модель RAM. Говорят, что 24 ГБ должно хватать, но рекомендуют 2 GPU
Код
Демо
Спасибо @asleephidden
#upscale
👍10❤3🔥2🤔2
Sora бесплатно
Но только в мобильном приложении Bing
Устанавливаем Bing, в настройках Bing выставляем регион United States. Илем на экран со всеми сервисами и выбираем Video Creator. Если там нет интерфейса для создания видео, включаем впн.
Дают 10 бесплатных быстрых генераций, на обычные лимита нет. Не дают меня соотношения сторон и хронометраж, жёстко 9:16, 5 секунд
IOS / Android
#mobile #iOS #android #text2video
Но только в мобильном приложении Bing
Устанавливаем Bing, в настройках Bing выставляем регион United States. Илем на экран со всеми сервисами и выбираем Video Creator. Если там нет интерфейса для создания видео, включаем впн.
Дают 10 бесплатных быстрых генераций, на обычные лимита нет. Не дают меня соотношения сторон и хронометраж, жёстко 9:16, 5 секунд
IOS / Android
#mobile #iOS #android #text2video
👍4
This media is not supported in your browser
VIEW IN TELEGRAM
PlayDiffusion
Редактирование речи - инпейнтинг звука речи на основе диффузии от Play HT / Play AI или как их там...
Сохраняет окружающий контекст, обеспечивая плавные переходы и согласованные характеристики говорящего.
Принимает на вход аудио до 50 секунд, файл до 50Мб
Попробовать на офсайте
Демо на HF
Веса
Код
Еще из новинок сервиса: липсинк
#audioinpainting #speech2speech #speechediting #tts #lipsync #text2speech
Редактирование речи - инпейнтинг звука речи на основе диффузии от Play HT / Play AI или как их там...
Сохраняет окружающий контекст, обеспечивая плавные переходы и согласованные характеристики говорящего.
Принимает на вход аудио до 50 секунд, файл до 50Мб
Попробовать на офсайте
Демо на HF
Веса
Код
Еще из новинок сервиса: липсинк
#audioinpainting #speech2speech #speechediting #tts #lipsync #text2speech
👍8
This media is not supported in your browser
VIEW IN TELEGRAM
У Suno опять обновки
Обновленный Song Editor: редактируйте все, что только можете себе представить. Меняйте порядок, переписывайте и переделывайте свой трек фрагмент за фрагментом — прямо из формы сигнала.
#musicediting
Обновленный Song Editor: редактируйте все, что только можете себе представить. Меняйте порядок, переписывайте и переделывайте свой трек фрагмент за фрагментом — прямо из формы сигнала.
#musicediting
👍8❤1
This media is not supported in your browser
VIEW IN TELEGRAM
OpenAudio S1
полностью кастомный ИИ-диктор от Fish Audio
Говорят что занял первое место на TTS-арене - не нашел
Клонирует голос за 15 секунд.
Можно выбирать любые эмоции, паузы, вздохи, шепот, крики, акценты и стили озвучки вашего текста.
Подходит для озвучки видео, аудиокниг, подкастов и так далее.
Поддерживает русский язык
#tts #text2speech #voicecloning
полностью кастомный ИИ-диктор от Fish Audio
Говорят что занял первое место на TTS-арене - не нашел
Клонирует голос за 15 секунд.
Можно выбирать любые эмоции, паузы, вздохи, шепот, крики, акценты и стили озвучки вашего текста.
Подходит для озвучки видео, аудиокниг, подкастов и так далее.
Поддерживает русский язык
#tts #text2speech #voicecloning
❤11🤔1
Google AI Edge Gallery
Экспериментальное приложение Гугла для локального запуска ИИ-моделей на смартфоне
Основные возможности:
- Генерация изображений
- ИИ-чат без интернета
- Написание и редактирование кода
- Анализ изображений ("Ask Image")
- Prompt Lab с готовыми шаблонами для различных задач
- Поддержка моделей Google Gemma 3n и других
- AI Chat: участвуйте в многопользовательских беседах.
- Анализ производительности: тесты в реальном времени (TTFT, скорость декодирования, задержка).
- Загрузите свою собственную модель: протестируйте местные .taskмодели LiteRT.
- Ресурсы для разработчиков: быстрые ссылки на карточки моделей и исходный код.
Android
iOS ждем
#mobile #android #assistant #tools
Экспериментальное приложение Гугла для локального запуска ИИ-моделей на смартфоне
Основные возможности:
- Генерация изображений
- ИИ-чат без интернета
- Написание и редактирование кода
- Анализ изображений ("Ask Image")
- Prompt Lab с готовыми шаблонами для различных задач
- Поддержка моделей Google Gemma 3n и других
- AI Chat: участвуйте в многопользовательских беседах.
- Анализ производительности: тесты в реальном времени (TTFT, скорость декодирования, задержка).
- Загрузите свою собственную модель: протестируйте местные .taskмодели LiteRT.
- Ресурсы для разработчиков: быстрые ссылки на карточки моделей и исходный код.
Android
iOS ждем
#mobile #android #assistant #tools
❤8
Wan2.1-VACE Native Support and Ace-Step Workflow Refined
Нативная поддержка редактора видео VACE в #ComfyUI
+ обновка воркфлоу генератора музыки Ace-Step
Воркфлоу по ссылке в заголовке
а еще они придумали как сшивать картинки в коллаж для сборки в Flux Kontext
#workflow #text2music #videoediting #imageediting #text2image #vibeediting
Нативная поддержка редактора видео VACE в #ComfyUI
+ обновка воркфлоу генератора музыки Ace-Step
Воркфлоу по ссылке в заголовке
а еще они придумали как сшивать картинки в коллаж для сборки в Flux Kontext
#workflow #text2music #videoediting #imageediting #text2image #vibeediting
👍7
У кого не открывается сайт pinokio.computer держите инструкцию от подписчика
Спасибо Oleg K
#tutorial
Нам нужно отредактировать файл hosts, чтобы перенаправить запросы к сайту Pinokio на рабочий IP-адрес.
Сначала открываем Блокнот обязательно от имени администратора - это критически важно! Нажимаем Win+R, вводим 'notepad', и запускаем через Ctrl+Shift+Enter.
Теперь в Блокноте идем в 'Файл' - 'Открыть' и вводим путь: C:\Windows\System32\drivers\etc\hosts. Не забудьте изменить тип файлов на 'Все файлы', иначе hosts не будет виден.
В самый конец файла добавляем две строки:
3.75.10.80 portal.pinokio.computer
3.75.10.80 pinokio.computer
Сохраняем файл ! Кстати, разработчики также предоставили альтернативный адрес https://pinokio-home.netlify.app, который тоже можно использовать для загрузки приложений."
Финальный штрих - очищаем DNS-кэш. Открываем командную строку от имени администратора и выполняем: ipconfig /flushdns
Спасибо Oleg K
#tutorial
pinokio.co
AI Browser
🔥6
This media is not supported in your browser
VIEW IN TELEGRAM
Chatterbox TTS
Генератор речи в опенсорсе от Resemble AI
#SOTA в клонировании голоса без обучения? клонирует по 5-секундному образцу
Под капотом 0.5B Llama.
Уникальный контроль выразительности.
Водяные знаки на выходе.
Легкий скрипт для конверсии голоса.
Превосходит ElevenLabs.
Есть в Pinokio
Код
Демо - по русски не понимает, генерирует эльфийский
Веса
#tts #text2speech #voicecloning
Генератор речи в опенсорсе от Resemble AI
#SOTA в клонировании голоса без обучения? клонирует по 5-секундному образцу
Под капотом 0.5B Llama.
Уникальный контроль выразительности.
Водяные знаки на выходе.
Легкий скрипт для конверсии голоса.
Превосходит ElevenLabs.
Есть в Pinokio
Код
Демо - по русски не понимает, генерирует эльфийский
Веса
#tts #text2speech #voicecloning
👍7❤3👎1
WanGP
Инструмент для запуска видеогенераторов на GPU от 6 ГБ VRAM
Позволяет генерировать видео длительностью более 10 секунд с разрешением 720p на RTX 4090 и 480p с менее чем 12 ГБ VRAM.
Поддерживает Wan, Hunyuan Video и LTV Video/ Добавили поддержку Phantom 14Bб Wan CausVidб VACE
- Поддержка старых графических процессоров (RTX 10XX, 20xx, ...)
-Интегрированные инструменты для облегчения создания видео: редактор масок, усилитель подсказок, временная и пространственная генерация
- Поддержка лор
- Очередь заданий
#tools #text2video #image2video #video2video #optimization
Инструмент для запуска видеогенераторов на GPU от 6 ГБ VRAM
Позволяет генерировать видео длительностью более 10 секунд с разрешением 720p на RTX 4090 и 480p с менее чем 12 ГБ VRAM.
Поддерживает Wan, Hunyuan Video и LTV Video/ Добавили поддержку Phantom 14Bб Wan CausVidб VACE
- Поддержка старых графических процессоров (RTX 10XX, 20xx, ...)
-Интегрированные инструменты для облегчения создания видео: редактор масок, усилитель подсказок, временная и пространственная генерация
- Поддержка лор
- Очередь заданий
#tools #text2video #image2video #video2video #optimization
GitHub
GitHub - deepbeepmeep/Wan2GP: Wan 2.1 for the GPU Poor
Wan 2.1 for the GPU Poor. Contribute to deepbeepmeep/Wan2GP development by creating an account on GitHub.
❤2