VLIPP: Towards Physically Plausible Video Generation with Vision and Language Informed Physical Prior
генерация физически корректных видео
Код ждем
#text2video #image2video #simulation
генерация физически корректных видео
Код ждем
#text2video #image2video #simulation
👍6🔥2
Remove/Replace ANYTHING with VACE+Wan2.1
Связку VACE/Wan2.1 уже используют для замены или удаления объектов на видео
Удаление объектов
Civitai
Видео
Замена объектов
Civitai
Видео
#video2video #videoediting #objectremoval #objectreplacement #cleanup #inpainting #tutorial #workflow
Связку VACE/Wan2.1 уже используют для замены или удаления объектов на видео
Удаление объектов
Civitai
Видео
Замена объектов
Civitai
Видео
#video2video #videoediting #objectremoval #objectreplacement #cleanup #inpainting #tutorial #workflow
🔥8
Liquid: Language Models are Scalable and Unified Multi-modal Generators
Единая языковая модель в качестве мультимодального генератора без костылей типа CLIP. В данном случае картинки/текст, 7B параметров
Код
Демо
Веса
#llm #mlm #text2image#image2text #text2text
Единая языковая модель в качестве мультимодального генератора без костылей типа CLIP. В данном случае картинки/текст, 7B параметров
Код
Демо
Веса
#llm #mlm #text2image#image2text #text2text
🔥4👍1
Media is too big
VIEW IN TELEGRAM
Krisp
Голосовой шумодав (тот который встроен в дискорд) научился убирать из речи акцент. Пока только индийский акцент. В будущем добавят и другие
Можно использовать бесплатно, с лимитами
#speech2speech #deaccent #speechcorrection
Голосовой шумодав (тот который встроен в дискорд) научился убирать из речи акцент. Пока только индийский акцент. В будущем добавят и другие
Можно использовать бесплатно, с лимитами
#speech2speech #deaccent #speechcorrection
😁23👍2
Media is too big
VIEW IN TELEGRAM
Anthropic выпустили свой Deep Research
Доступен только в некоторых странах и только для платных подписанов
Умеет искать не только в интернете, но и в ваших личных данных через интеграцию в Google Workspace. Да, это тоже новая анонсированная фича. Еще анонсировали голосовой режим
Anthropic
#assistant #voicemode #deepresearch #search
Доступен только в некоторых странах и только для платных подписанов
Умеет искать не только в интернете, но и в ваших личных данных через интеграцию в Google Workspace. Да, это тоже новая анонсированная фича. Еще анонсировали голосовой режим
Anthropic
#assistant #voicemode #deepresearch #search
👍3
This media is not supported in your browser
VIEW IN TELEGRAM
FireBase Studio
ИИ-программист приложений от Google в браузере. Построен на базе Code OSS (форк Visual Studio Code)
Прошло уже несколько дней как я дал ему задание, но что-то результата нет. Хотя задание было непростое. В общем, пробуйте сами
Кстати, можно начать проект не с нуля, а с загрузки уже существующего проекта, например из гитхаба
Дают бесплатно 3 проекта (это неточно, могу ошибаться)
#coding #online
ИИ-программист приложений от Google в браузере. Построен на базе Code OSS (форк Visual Studio Code)
Прошло уже несколько дней как я дал ему задание, но что-то результата нет. Хотя задание было непростое. В общем, пробуйте сами
Кстати, можно начать проект не с нуля, а с загрузки уже существующего проекта, например из гитхаба
Дают бесплатно 3 проекта (это неточно, могу ошибаться)
#coding #online
👍3
В Krea.ai завезли вчерашний Kling 2.0
На бесплатном аккаунте не потестить, разве что на новом если при регистрации дают приветственные кредиты
#text2video #image2video #text2image
На бесплатном аккаунте не потестить, разве что на новом если при регистрации дают приветственные кредиты
#text2video #image2video #text2image
👍4
OpenAI выпустили новые модели o3 и o4-mini
o3 самая мощная
o4-mini быстрая и дешевая
Модели "думают с картинками" - интегрируют визуальную информацию в процесс рассуждений
Самостоятельно используют все инструменты ChatGPT (веб-поиск, Python, генерацию изображений)
Решают сложные многоэтапные задачи без помощи человека
Доступ сначала дадут платным подписанам и разрабам в API
#news #assistant
o3 самая мощная
o4-mini быстрая и дешевая
Модели "думают с картинками" - интегрируют визуальную информацию в процесс рассуждений
Самостоятельно используют все инструменты ChatGPT (веб-поиск, Python, генерацию изображений)
Решают сложные многоэтапные задачи без помощи человека
Доступ сначала дадут платным подписанам и разрабам в API
#news #assistant
❤3👍3
В инпейнтер картинок LanPaint добавлена поддержка генератора картинок HiDream
Для установки в #ComfyUI следуйте инструкции
Гитхаб
#inpainting #image2image
Для установки в #ComfyUI следуйте инструкции
Гитхаб
#inpainting #image2image
Telegram
Нейронавт | Нейросети в творчестве
LanPaint
Точный инпейнтинг, заставляющий модель "думать" перед итерациями денойза.
Не требует дообучения.
Работает с любой моделью SD, в том числе с лорами
Есть ноды #ComfyUI
Гитхаб
Воркфлоу
#inpainting #image2image
Точный инпейнтинг, заставляющий модель "думать" перед итерациями денойза.
Не требует дообучения.
Работает с любой моделью SD, в том числе с лорами
Есть ноды #ComfyUI
Гитхаб
Воркфлоу
#inpainting #image2image
👍3
HiDream-I1_fp8/fp16
Квантизованная версия
Веса fp8
Веса на ComfyUI fp8/fp16
ComfyUI_examples
#comfyUI #text2image
Квантизованная версия
Веса fp8
Веса на ComfyUI fp8/fp16
ComfyUI_examples
#comfyUI #text2image
👍4❤2👎1🎃1
HiDream-I1-Dev-gguf
Еще квантизованные версии
Работает на RTX3060 с SageAttention и Torch Complie, 768x1344 100s 18steps
Веса
GGUF Loader
TEXT Encoders
VAE
workflow
#workflow #text2image
Еще квантизованные версии
Работает на RTX3060 с SageAttention и Torch Complie, 768x1344 100s 18steps
Веса
GGUF Loader
TEXT Encoders
VAE
workflow
#workflow #text2image
👍8❤1🔥1