4D LangSplat: 4D Language Gaussian Splatting via Multimodal Large Language Models
Слыхали про 4D-языковые поля? Я не слыхал, а они есть.
Служат, по видимому, для сегментации объектов на видео
Код
#video2mask #segmentation #gaussian
Слыхали про 4D-языковые поля? Я не слыхал, а они есть.
Служат, по видимому, для сегментации объектов на видео
Код
#video2mask #segmentation #gaussian
👍7❤1
Дайджест интересного о чем не успел написать отдельным постом
Free AI background remover: бесплатное удаление фона онлайн от Adobe #backgroundremoval
MANUS: хайповый автономный агент (записаться в вейтлист) для выполнения задач на компе, собранный из 29 инструментов. Есть расширения Chrome и Edge, аппки Android / IOS и приложения для ПК но бесплатно они мало что могут #agent
ANUS: MANUS клонировал сам себя в опенсорс #agent
OpenManus: ANUS, но рабочий. спасибо @Qwinty
Mirage от Captions: генератор видеоблогеров. За ваши $199 генерит и шевелит поясной портрет, а не только голову
Pika: добавили эффекты для превращения в ребёнка, героя, принцессу, или музейный экспонат. Pikaswaps и Pikadditions теперь генерят в 1080p. #image2video
WAN effects/LoRAs: тем временем подобные же эффекты в опенсорсе #image2video
SkyReels: добавили липсинк к своему генератору видео. Демо. #lipsync
FLARE: получение новых видов сцены или её 3D геометрии из несшитых рандомных фоток. Код / Демо #image2mesh #novelview #imageto3d
CTRL-D: редактирование видео промтом. Код #videoediting #video2video
Ideogram: выпустили Ideogram 2a и версию Turbo, для более быстрой и дешевой генерации картинок. Также улучшились тексты на них. #text2image
Light-a-Video: для релайтера видео появилось ComfyUI #relighting #comfyUI
Tight Inversion SDXL: редактирование картинок промтом. #imageediting
Free AI background remover: бесплатное удаление фона онлайн от Adobe #backgroundremoval
MANUS: хайповый автономный агент (записаться в вейтлист) для выполнения задач на компе, собранный из 29 инструментов. Есть расширения Chrome и Edge, аппки Android / IOS и приложения для ПК но бесплатно они мало что могут #agent
ANUS: MANUS клонировал сам себя в опенсорс #agent
OpenManus: ANUS, но рабочий. спасибо @Qwinty
Mirage от Captions: генератор видеоблогеров. За ваши $199 генерит и шевелит поясной портрет, а не только голову
Pika: добавили эффекты для превращения в ребёнка, героя, принцессу, или музейный экспонат. Pikaswaps и Pikadditions теперь генерят в 1080p. #image2video
WAN effects/LoRAs: тем временем подобные же эффекты в опенсорсе #image2video
SkyReels: добавили липсинк к своему генератору видео. Демо. #lipsync
FLARE: получение новых видов сцены или её 3D геометрии из несшитых рандомных фоток. Код / Демо #image2mesh #novelview #imageto3d
CTRL-D: редактирование видео промтом. Код #videoediting #video2video
Ideogram: выпустили Ideogram 2a и версию Turbo, для более быстрой и дешевой генерации картинок. Также улучшились тексты на них. #text2image
Light-a-Video: для релайтера видео появилось ComfyUI #relighting #comfyUI
Tight Inversion SDXL: редактирование картинок промтом. #imageediting
Adobe
Free AI Background Remover | Adobe Express
Remove backgrounds from your images quickly and easily with the free AI background remover from Adobe Express. Upload your image to the AI background remover and download your new image in seconds.
👍7🔥3❤1
Command A
Наследник Command R+ на 111B параметров, контекстное окно 256k
Ориентирован на агентные, мультиязычные, программистские задачи
Веса
API
#assistant #coding #agent
Наследник Command R+ на 111B параметров, контекстное окно 256k
Ориентирован на агентные, мультиязычные, программистские задачи
Веса
API
#assistant #coding #agent
🔥3
This media is not supported in your browser
VIEW IN TELEGRAM
Thera: Aliasing-Free Arbitrary-Scale Super-Resolution with Neural Heat Fields
Новая SOTA в апскейле любого разрешения со встроенным антиалайасингом
Код
Демо (до 600х600 на вход)
#upscale #enhance
Новая SOTA в апскейле любого разрешения со встроенным антиалайасингом
Код
Демо (до 600х600 на вход)
#upscale #enhance
👍5👎1
Mistral-Small-3.1
Производительная ( 150 токенов в секунду) мультимодалка от Mistral на 24B параметров, контекст 128K.
Мультиязычная, платформа для продвинутых рассуждений. Визуальные задачи, агентные.
В квантизованном виде влезет на RTX 4090 или 32GB RAM MacBook
Веса Base
Веса Instruct
API
#assistant #reasoning #vlm
Производительная ( 150 токенов в секунду) мультимодалка от Mistral на 24B параметров, контекст 128K.
Мультиязычная, платформа для продвинутых рассуждений. Визуальные задачи, агентные.
В квантизованном виде влезет на RTX 4090 или 32GB RAM MacBook
Веса Base
Веса Instruct
API
#assistant #reasoning #vlm
👍13🔥4
VideoPainter: Any-length Video Inpainting and Editing with Plug-and-Play Context Control
Инпейнтинг видео любой длины с контролем контекста. От Tencent.
Умеет не только заполнять заданные области, но и заменять объекты по текстовому промпту.
Судя по сравнениям уделывает ProPainter одной левой. Но зачем они выставили кейс с заменой девушки на Энн Хэтеуэй, ведь это провал?
Код
Веса
#inpainting #videoediting
Инпейнтинг видео любой длины с контролем контекста. От Tencent.
Умеет не только заполнять заданные области, но и заменять объекты по текстовому промпту.
Судя по сравнениям уделывает ProPainter одной левой. Но зачем они выставили кейс с заменой девушки на Энн Хэтеуэй, ведь это провал?
Код
Веса
#inpainting #videoediting
👍4❤1🔥1
DDCM: Compressed Image Generation with Denoising Diffusion Codebook Models
Метод генерации и реставрации изображений
Код ждем
Демо
#text2image #imagerestoration #enhance #facerestoration #upscale #image2image
Метод генерации и реставрации изображений
Код ждем
Демо
#text2image #imagerestoration #enhance #facerestoration #upscale #image2image
👍2
Forwarded from CGIT_Vines (Marvin Heemeyer)
Andrew Price затестил текущие модели для генерации 3D. Тест не идеальный, так как некоторые игроки не представлены на тестах. Но, тем не менее, это дает представление о текущем положении дел.
Главное — помнить, что где-то использовались PRO-версии генераторов, которые, как я подозреваю, просто наваливают больше геометрии, и точность вырастает именно из-за этого. Стоит ли пользоваться или переживать — решать вам.
Главное — помнить, что где-то использовались PRO-версии генераторов, которые, как я подозреваю, просто наваливают больше геометрии, и точность вырастает именно из-за этого. Стоит ли пользоваться или переживать — решать вам.
👍7🔥1👏1