Telegram Web Link
ReCamMaster: Camera-Controlled Generative Rendering from A Single Video

Изменяем траекторию камеры для видео, получаем то же видео с другого ракурса.

Применимо для 4D реконструкций, стабилизации видео, обучения роботов и автопилотов

Код ждем (но это неточно)
Демо - сюда загружаем свое видео, ждем пока его обработают и пришлют вам на почту.

Варианты движения камеры такие:

1 Pan Right
2 Pan Left
3 Tilt Up
4 Tilt Down
5 Zoom In
6 Zoom Out
7 Translate Up (with rotation)
8 Translate Down (with rotation)
9 Arc Left (with rotation)
10 Arc Right (with rotation)

#cameracontrol #novelview #video2video #stabilization
👍9
Gemini Image Editing NextJS Quickstart

Официальный шаблон интеграции в ваш сервис редактора/генератора картинок Gemini 2.0 Flash

Вот например в Freepik уже прикручено

Демо, и даже без впн
Код

#assistant #mlm #vlm #imageediting #text2image
4🔥1
Проверьте почту если записывались в вейтлист Mago

Не уверен что такой перенос стиля на видео будет актуален при всех возможностях видеогенераторов которые нам уже доступны.

Но посмотрим что сможет предложить Mago

#news #styletransfer
👍1
This media is not supported in your browser
VIEW IN TELEGRAM
Stable Virtual Camera (Seva): Multi-View Video Generation with 3D Camera Control

Генератор видео по картинке с контролем камеры от Stability AI. На вход от 1 до 32 картинок. Камера идет по заданной пользователем траектории

1.3B параметров

Обещают консисентность вплоть до бесшовного зацикливания если камера возвращается в ту же точку. Причем 1000 кадров как с куста

Код
Демо

#cameracontrol #image2video #image2scene #novelview
🔥8👍41
This media is not supported in your browser
VIEW IN TELEGRAM
gemini-codrawing

Вангую что таких демок будет много. Сертифицированная точность вангования как всегда 50/50

#sketch2image #text2image #text2drawing #text2sketch
9💯2
This media is not supported in your browser
VIEW IN TELEGRAM
Gemini Canvas

В чатбот Гугла прикрутили Canvas для работы с кодом, коллаборациями (и наверно чем-то еще)

Бонусом, сделали Audio Overview - подкаст-обзор на основе загруженных документов. Короче, похоже, просто прикрутили NotebookLM

Попробовать - притворитесь что вы не в РФ

#text2podcast #coding #canvas #assistant
🔥8😎2
This media is not supported in your browser
VIEW IN TELEGRAM
Lluminate

Интересная работа

Нейросетки хороши в выдаче усредненного результата, поэтому часто выдают однотипные результаты при одном и том же промпте.

Lluminate решает проблему однообразия, выдавая более разнообразные и неожиданные результаты.
Алгоритм использует умный промптинг и анализ новизны с помощью CLIP.

Запускает множество вариантов для оценки их разнообразия.
Самые необычные варианты используются для новых генераций с усложнением и добавлением неочевидных элементов.

Тестировали на шейдерах, архитектуре и генерации часов.
Вместо стандартных результатов типа "неоновые спирали" и "футуристические башни", получаются уникальные и неожиданные вещи.

Код

#text2image
👍73
Personalize Anything (for Free with Diffusion Transformer)

Персонализация одного или нескольких объектов без дообучения.
Протестировано с #Flux и Hunyuan
В колаб ноутбуках Flux

Код
Колаб inpainting-outpainting
Колаб персонализация одного объекта
Колаб реконструкция объекта, создает новые позы/виды

#personalization #inpainting #outpainting #image2image
👍8🔥31
From Parts to Whole: A Unified Reference Framework for Controllable Human Image Generation

Еще одна работа тех же авторов, уже несвежая.
Создает изображения людей в различных позах по любому количеству референсов частей человека

Код

#referencing #image2image #personalization
👀4👍2🔥1
Wan2GP v2

Обновился Wan2.1 GP, много улучшений
Удобная установка в Pinokio

#text2video #image2video
👍8🔥1
Media is too big
VIEW IN TELEGRAM
Amodal3R: Amodal 3D Reconstruction from Occluded 2D Images

Реконструкция частично видимых 3D объектов по картинке

Код ждем
Демо

#imageto3d
👍3🔥1
Grok в Телеграм, не реклама

В тг появился бот @GrokAI, вероятно официальный
В юзернейме нет обязательного для пользовательских ботов "_bot", кроме того, Дуров в твиттере намекал на интеграцию

Похоже что это не Grok3, а Grok2.
Картинки рисовать отказывается, вот вам ascii art Бендер

Для пользователей ТГ премиум доступ неограниченный, и то не у всех работает. С остальными отказывается общаться 🧐

#news #bot #assistant #тестбендера
Please open Telegram to view this post
VIEW IN TELEGRAM
👍4
Krea Video Styles

Безобразие. Теперь можно обучать свои лоры Wan на Krea AI. Движение там, объекты, стили

За ваши деньги, конечно

#personalization #training #lora #text2video #image2video
🔥9
2025/07/12 19:22:19
Back to Top
HTML Embed Code: