Telegram Web Link
MAGI-1 4.5B

На HF появились веса средней модели видеогенератора. Вероятно, запустится на RTX 4090

#text2video #image2video
👍42🤔1
This media is not supported in your browser
VIEW IN TELEGRAM
3D inpainting

Для тех кто готов поколупаться с запуском ячеек в Google Colab

1. Запустите весь подготовительный код - каждая ячейка занимает около 10 минут и может завершиться сбоем во время выполнения, проследите чтобы каждая ячейка отработала.

2. Загрузите свой меш .ply и референсное изображение. Работает лучше всего, если изображение представляет собой измененный снимок экрана или визуализацию вашей модели. Тогда это с меньшей вероятностью приведет к появлению пробелов в модели.

3. Перемещайте и масштабируйте модель и область инпейнтинга.

реддит

#inpainting3d #colab #3dto3d
👍31
Media is too big
VIEW IN TELEGRAM
3DGUT: Enabling Distorted Cameras and Secondary Rays in Gaussian Splatting

Рендер сцен на гауссианах от Nvidia

В отличие от оригинального 3DGS, поддерживает фишай (очень широугольные обеъективы), корректно реконструирует сцены по видео, снятому с роллинг шаттером, позволяет воспроизводить оптические преломления и отражения

Код

#gaussian #video2scene #rendering #novelview #fisheye
🔥6
Media is too big
VIEW IN TELEGRAM
В яндекс браузер прикрутили дубляж с сохранением голоса и интонаций говорящего. До сих пор все дублировалось одним механическим голосом

Пока еще работает не для всех видео, вот здесь например уже новый дубляж

#dubbing #speech2speech
👍183🔥1
Я наконец собрал свою работу за несколько лет. Нейросетки здесь не представлены.

Ищу работу/заказы

Если хотите сделать мне доброе дело, насыпьте комментов на ютубе, закиньте знакомым эйчарам.
За репост отдельная благодарность🤝

Enjoy!

#showreel
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥338
Qwen 3

Alibaba выпустили две #MoE-модели (совет экспертов) и шесть Dense models (плотные модели), размером от 0.6B до 235B параметров.

Qwen3-30B-A3B, например, превосходит QwQ-32B, при количестве параметров в 10 раз меньше.

Все модели поддерживают два режима: с рассуждениями и без. Режим размышления активируется при обработке сложных задач

Поддерживает 119 языков, включая русский.

Попробовать
Гитхаб
HF
GGUF зоопарк

#assistant
👍8🔥4
Media is too big
VIEW IN TELEGRAM
FantasyTalking: Realistic Talking Portrait Generation via Coherent Motion Synthesis

Говорящий аватар / оживлятор портретов от Alibaba с контролем интенсивности движения. работает с разными крупностями кадра и позами, с разными типами персонажей

Сравнение с конкурентами впечатляет.

Построен на базе Wan2.1

Код

#portraitanimation #image2video #speech2video #humananimation #lipsync #talkinghead
👍9
PixVerse v4 / App 2.0

Видеогенератор PixVerse выпустил модель v4 и новую версию мобильного приложения с функциями Transition, AI Dance Templates, AI Style Live (Переход, Шаблоны танцев, ИИ-стиль)

На сайте сейчас ежедневно раздают по 60 кредитов за вход

iOS
Android

А также запустили конкурс короткометражек на Dzine (бывший Stylar) с призами
🥇$500 (2 победителя)
🥈$250 (2 победителя)
🥉$100 (2 победителя)

Для участия нужно

1) запостить видео на TikTok, Instagram, Twitter/X, Youtube, и т д с тегом #PixVerse #Dzine или #PixVerseDzine

2) заполнить форму

#mobile #ios #android #contest #text2video #video2video #stylize #motioncontrol #videoediting
👍2🤡1
This media is not supported in your browser
VIEW IN TELEGRAM
Krea Stage + GPT-4o

Говорят, GPT-4o в Krea AI помогает рендерить Stages с консистентными персонажами и окружением

#novelview #rendering #imageediting #personalization
👍8🤔1
Step1X-Edit: A Practical Framework for General Image Editing

Редактор картинок текстовыми указаниями от Stepfun AI

Для локального запуска официальной модели понадобится от 26Гб VRAM
для FP8 от 18Гб

HF
FP8
Гитхаб

#imageediting
👍71
Perplexity атакует

Выкатили голосового ассистента на #iOS

Официальный бот в Whatsapp +1 (833) 436-3285

Бот в телеграм @askplexbot- не уверен что официальный

Прикрутили Grok 3, and o4-mini, GPT Image Generation - говорят что бесплатно и без ограничений ❗️

Perplexity предустанавливают на все новые смартфоны Motorola

#assistant #voicemode
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
👍8
Media is too big
VIEW IN TELEGRAM
Сервис гугла NotebookLM для превращения любых источников в подкаст научился говорить по-русски (и еще на 50 языках)

Попробовать - притворитесь что вы не в России

#text2voice #pdf2voice #text2podcast
😁10👍52
HiDream-E1

Тренд продолжается.
Редактор картинок текстовыми указаниями на основе HiDream-I1

Демо
Попробовать на офсайте

#imageediting
👍5
F-Lite

Генератор картинок от Freepik
10B параметров

F Lite - базовая модель
F Lite-Texture - вариант F Lite, который создает лучшие текстуры и эстетику, но плохо работает с короткими промптами и менее эффективен для векторной графики (что?)

Гитхаб
Веса
Демо F Lite
Демо F Texture
ComfyUI

#text2image #ComfyUI #workflow
👍3
2025/07/09 18:46:40
Back to Top
HTML Embed Code: