ReCamMaster: Camera-Controlled Generative Rendering from A Single Video
Изменяем траекторию камеры для видео, получаем то же видео с другого ракурса.
Применимо для 4D реконструкций, стабилизации видео, обучения роботов и автопилотов
Код ждем (но это неточно)
Демо - сюда загружаем свое видео, ждем пока его обработают и пришлют вам на почту.
Варианты движения камеры такие:
1 Pan Right
2 Pan Left
3 Tilt Up
4 Tilt Down
5 Zoom In
6 Zoom Out
7 Translate Up (with rotation)
8 Translate Down (with rotation)
9 Arc Left (with rotation)
10 Arc Right (with rotation)
#cameracontrol #novelview #video2video #stabilization
Изменяем траекторию камеры для видео, получаем то же видео с другого ракурса.
Применимо для 4D реконструкций, стабилизации видео, обучения роботов и автопилотов
Код ждем (но это неточно)
Демо - сюда загружаем свое видео, ждем пока его обработают и пришлют вам на почту.
Варианты движения камеры такие:
1 Pan Right
2 Pan Left
3 Tilt Up
4 Tilt Down
5 Zoom In
6 Zoom Out
7 Translate Up (with rotation)
8 Translate Down (with rotation)
9 Arc Left (with rotation)
10 Arc Right (with rotation)
#cameracontrol #novelview #video2video #stabilization
👍9
Gemini Image Editing NextJS Quickstart
Официальный шаблон интеграции в ваш сервис редактора/генератора картинок Gemini 2.0 Flash
Вот например в Freepik уже прикручено
Демо, и даже без впн
Код
#assistant #mlm #vlm #imageediting #text2image
Официальный шаблон интеграции в ваш сервис редактора/генератора картинок Gemini 2.0 Flash
Вот например в Freepik уже прикручено
Демо, и даже без впн
Код
#assistant #mlm #vlm #imageediting #text2image
❤4🔥1
Проверьте почту если записывались в вейтлист Mago
Не уверен что такой перенос стиля на видео будет актуален при всех возможностях видеогенераторов которые нам уже доступны.
Но посмотрим что сможет предложить Mago
#news #styletransfer
Не уверен что такой перенос стиля на видео будет актуален при всех возможностях видеогенераторов которые нам уже доступны.
Но посмотрим что сможет предложить Mago
#news #styletransfer
👍1
This media is not supported in your browser
VIEW IN TELEGRAM
Stable Virtual Camera (Seva): Multi-View Video Generation with 3D Camera Control
Генератор видео по картинке с контролем камеры от Stability AI. На вход от 1 до 32 картинок. Камера идет по заданной пользователем траектории
1.3B параметров
Обещают консисентность вплоть до бесшовного зацикливания если камера возвращается в ту же точку. Причем 1000 кадров как с куста
Код
Демо
#cameracontrol #image2video #image2scene #novelview
Генератор видео по картинке с контролем камеры от Stability AI. На вход от 1 до 32 картинок. Камера идет по заданной пользователем траектории
1.3B параметров
Обещают консисентность вплоть до бесшовного зацикливания если камера возвращается в ту же точку. Причем 1000 кадров как с куста
Код
Демо
#cameracontrol #image2video #image2scene #novelview
🔥8👍4❤1
This media is not supported in your browser
VIEW IN TELEGRAM
gemini-codrawing
Вангую что таких демок будет много.Сертифицированная точность вангования как всегда 50/50
#sketch2image #text2image #text2drawing #text2sketch
Вангую что таких демок будет много.
#sketch2image #text2image #text2drawing #text2sketch
❤9💯2
This media is not supported in your browser
VIEW IN TELEGRAM
Gemini Canvas
В чатбот Гугла прикрутили Canvas для работы с кодом, коллаборациями (и наверно чем-то еще)
Бонусом, сделали Audio Overview - подкаст-обзор на основе загруженных документов. Короче, похоже, просто прикрутили NotebookLM
Попробовать - притворитесь что вы не в РФ
#text2podcast #coding #canvas #assistant
В чатбот Гугла прикрутили Canvas для работы с кодом, коллаборациями (и наверно чем-то еще)
Бонусом, сделали Audio Overview - подкаст-обзор на основе загруженных документов. Короче, похоже, просто прикрутили NotebookLM
Попробовать - притворитесь что вы не в РФ
#text2podcast #coding #canvas #assistant
🔥8😎2
This media is not supported in your browser
VIEW IN TELEGRAM
Lluminate
Интересная работа
Нейросетки хороши в выдаче усредненного результата, поэтому часто выдают однотипные результаты при одном и том же промпте.
Lluminate решает проблему однообразия, выдавая более разнообразные и неожиданные результаты.
Алгоритм использует умный промптинг и анализ новизны с помощью CLIP.
Запускает множество вариантов для оценки их разнообразия.
Самые необычные варианты используются для новых генераций с усложнением и добавлением неочевидных элементов.
Тестировали на шейдерах, архитектуре и генерации часов.
Вместо стандартных результатов типа "неоновые спирали" и "футуристические башни", получаются уникальные и неожиданные вещи.
Код
#text2image
Интересная работа
Нейросетки хороши в выдаче усредненного результата, поэтому часто выдают однотипные результаты при одном и том же промпте.
Lluminate решает проблему однообразия, выдавая более разнообразные и неожиданные результаты.
Алгоритм использует умный промптинг и анализ новизны с помощью CLIP.
Запускает множество вариантов для оценки их разнообразия.
Самые необычные варианты используются для новых генераций с усложнением и добавлением неочевидных элементов.
Тестировали на шейдерах, архитектуре и генерации часов.
Вместо стандартных результатов типа "неоновые спирали" и "футуристические башни", получаются уникальные и неожиданные вещи.
Код
#text2image
👍7❤3
Personalize Anything (for Free with Diffusion Transformer)
Персонализация одного или нескольких объектов без дообучения.
Протестировано с #Flux и Hunyuan
В колаб ноутбуках Flux
Код
Колаб inpainting-outpainting
Колаб персонализация одного объекта
Колаб реконструкция объекта, создает новые позы/виды
#personalization #inpainting #outpainting #image2image
Персонализация одного или нескольких объектов без дообучения.
Протестировано с #Flux и Hunyuan
В колаб ноутбуках Flux
Код
Колаб inpainting-outpainting
Колаб персонализация одного объекта
Колаб реконструкция объекта, создает новые позы/виды
#personalization #inpainting #outpainting #image2image
👍8🔥3❤1
From Parts to Whole: A Unified Reference Framework for Controllable Human Image Generation
Еще одна работа тех же авторов, уже несвежая.
Создает изображения людей в различных позах по любому количеству референсов частей человека
Код
#referencing #image2image #personalization
Еще одна работа тех же авторов, уже несвежая.
Создает изображения людей в различных позах по любому количеству референсов частей человека
Код
#referencing #image2image #personalization
👀4👍2🔥1
Media is too big
VIEW IN TELEGRAM
Amodal3R: Amodal 3D Reconstruction from Occluded 2D Images
Реконструкция частично видимых 3D объектов по картинке
Код ждем
Демо
#imageto3d
Реконструкция частично видимых 3D объектов по картинке
Код ждем
Демо
#imageto3d
👍3🔥1
Grok в Телеграм, не реклама
В тг появился бот @GrokAI, вероятно официальный
В юзернейме нет обязательного для пользовательских ботов "_bot", кроме того, Дуров в твиттере намекал на интеграцию
Похоже что это не Grok3, а Grok2.
Картинки рисовать отказывается, вот вам ascii art Бендер
Для пользователей ТГ премиум доступ неограниченный, и то не у всех работает. С остальными отказывается общаться🧐
#news #bot #assistant #тестбендера
В тг появился бот @GrokAI, вероятно официальный
В юзернейме нет обязательного для пользовательских ботов "_bot", кроме того, Дуров в твиттере намекал на интеграцию
Похоже что это не Grok3, а Grok2.
Картинки рисовать отказывается, вот вам ascii art Бендер
Для пользователей ТГ премиум доступ неограниченный, и то не у всех работает. С остальными отказывается общаться
#news #bot #assistant #тестбендера
Please open Telegram to view this post
VIEW IN TELEGRAM
👍4
Krea Video Styles
Безобразие. Теперь можно обучать свои лоры Wan на Krea AI. Движение там, объекты, стили
За ваши деньги, конечно
#personalization #training #lora #text2video #image2video
Безобразие. Теперь можно обучать свои лоры Wan на Krea AI. Движение там, объекты, стили
За ваши деньги, конечно
#personalization #training #lora #text2video #image2video
🔥9