Telegram Web Link
DanceGRPO

Метод создания изображений и видео по тексту, видео по картинке от ByteDance

Совместим с Stable Diffusion, HunyuanVideo, FLUX, SkyReel-I2V.

Код ждем

#text2image #text2video #image2video #tools
ComfyUI-VideoUpscale_WithModel

ComfyUI ноды для увеличения разрешения видео с использованием недиффузных моделей, таких как ESRGAN.

Работает с моделями из базы https://openmodeldb.info/

#ComfyUI #upscalevideo
This media is not supported in your browser
VIEW IN TELEGRAM
GenGaze

Создание изображений в ComfyUI с использованием направления взгляда пользователя.

Код ждем

#imageediting #tools
This media is not supported in your browser
VIEW IN TELEGRAM
KEEP

Официальный аккаунт Gradio пишет что реставратор - апскейлер лиц на видео KEEP это новая SOTA.

В репозитории две новые модели

Код
Демо

#restoration #enhance #facerestoration #upscale #SOTA
Video Overviews

Google тизерит новую функцию, которая станет частью проекта Illuminate. Функция создает короткие видеоролики продолжительностью от 1 до 3 минут

Видео генерируются единой моделью, способной синхронизировать видео и аудио.

Ту же модель планируют прикрутить в NotebookLM

Твиттер

#videoediting #assistant #news
#оффтоп #hardware

Друзья, посоветуйте wifi адаптер на десктоп Win 10.
Есть свободный слот PCI E, так что лучше видимо его чем USB

Требования: дешево и качественно. Ну а что мне хотеть дорого и некачественно что ли?

А еще посоветуйте чего не брать
This media is not supported in your browser
VIEW IN TELEGRAM
Jules

Агент-программист от Гугл.
"Берет на себя задачи которыми вы не хотите заниматься"

Используя Gemini 2.0, интегрируется с GitHub.
Копипует ваш код в облачную виртуальную машину и проверяет его там.
Покажет вам план, обоснует, предложит изменения.

Записаться в вейтлист
Документация

#coding #assistant
Вы пробовали пользоваться NotebookLM на телефоне? Я пробовал. Все криво-косо

Но они выпустили мобильные приложения, теперь жить стало легче в правильных странах

iOS
Android

#text2podcast #podcast #mobile
Please open Telegram to view this post
VIEW IN TELEGRAM
Speech-02-HD

Minimax скинул Open AI и ElevenLabs с трона #TTS - преобразователей текста в речь (первый скриншот)

Но это неточно, минимакс ссылку на арену не приложил и мне не удалось найти арену на которой он рулит. Вот например на этой арене он шестой (второй скриншот)

Энивей, инструмент достойный внимания

#text2speech #news #leaderboard
This media is not supported in your browser
VIEW IN TELEGRAM
Hunyuan Game

Tencent представил ИИ-движок для создания графики в играх.

• AI Art Pipeline: Полный цикл создания арта — от идеи до финальной 3D-проекции — в одном окне.
• Холст в реальном времени: Ты рисуешь — ИИ сразу показывает, как будет выглядеть финальная версия.
• Генератор 2D-графики: ИИ точно понимает, что ты хочешь - без искажённых промптов.
• Мультиракурсы персонажей: ИИ автоматически создаёт вид спереди, сбоку, сзади + 360°-просмотр.

Записаться в вейтлист

#gamedev #3d
Magentic-UI

Агентная система от Microsoft Research на AutoGen

• Планирует вместе с тобой: Агент предлагает пошаговый план действий, который можно изменить, утвердить или уточнить.
• Показывает, что делает: Все действия видны — клики, ввод текста, навигация.
• Спрашивает разрешение перед важными действиями: Агент не будет нажимать на кнопки "удалить" или "оплатить" без согласия.
• Обучается на успешных сценариях: Завершил задачу? Теперь этот план можно переиспользовать в будущем.

Где это может пригодиться?
• Заполнение длинных форм и анкет
• Автоматизация рутинных действий в браузере
• Создание умных пользовательских сценариев
• Обучение и настройка собственных браузерных агентов

Устанавливается через Docker

Код

#agent #assistant
This media is not supported in your browser
VIEW IN TELEGRAM
Генерация видео LTXV 13b в реальном времени (почти) на H100

Воркфлоу в комментариях

Реддит

#text2video #image2video #realtime #workflow
2025/07/04 03:31:33
Back to Top
HTML Embed Code: