Telegram Web Link
Qwen 3

Alibaba выпустили две #MoE-модели (совет экспертов) и шесть Dense models (плотные модели), размером от 0.6B до 235B параметров.

Qwen3-30B-A3B, например, превосходит QwQ-32B, при количестве параметров в 10 раз меньше.

Все модели поддерживают два режима: с рассуждениями и без. Режим размышления активируется при обработке сложных задач

Поддерживает 119 языков, включая русский.

Попробовать
Гитхаб
HF
GGUF зоопарк

#assistant
Media is too big
VIEW IN TELEGRAM
FantasyTalking: Realistic Talking Portrait Generation via Coherent Motion Synthesis

Говорящий аватар / оживлятор портретов от Alibaba с контролем интенсивности движения. работает с разными крупностями кадра и позами, с разными типами персонажей

Сравнение с конкурентами впечатляет.

Построен на базе Wan2.1

Код

#portraitanimation #image2video #speech2video #humananimation #lipsync #talkinghead
PixVerse v4 / App 2.0

Видеогенератор PixVerse выпустил модель v4 и новую версию мобильного приложения с функциями Transition, AI Dance Templates, AI Style Live (Переход, Шаблоны танцев, ИИ-стиль)

На сайте сейчас ежедневно раздают по 60 кредитов за вход

iOS
Android

А также запустили конкурс короткометражек на Dzine (бывший Stylar) с призами
🥇$500 (2 победителя)
🥈$250 (2 победителя)
🥉$100 (2 победителя)

Для участия нужно

1) запостить видео на TikTok, Instagram, Twitter/X, Youtube, и т д с тегом #PixVerse #Dzine или #PixVerseDzine

2) заполнить форму

#mobile #ios #android #contest #text2video #video2video #stylize #motioncontrol #videoediting
This media is not supported in your browser
VIEW IN TELEGRAM
Krea Stage + GPT-4o

Говорят, GPT-4o в Krea AI помогает рендерить Stages с консистентными персонажами и окружением

#novelview #rendering #imageediting #personalization
Step1X-Edit: A Practical Framework for General Image Editing

Редактор картинок текстовыми указаниями от Stepfun AI

Для локального запуска официальной модели понадобится от 26Гб VRAM
для FP8 от 18Гб

HF
FP8
Гитхаб

#imageediting
Perplexity атакует

Выкатили голосового ассистента на #iOS

Официальный бот в Whatsapp +1 (833) 436-3285

Бот в телеграм @askplexbot- не уверен что официальный

Прикрутили Grok 3, and o4-mini, GPT Image Generation - говорят что бесплатно и без ограничений ❗️

Perplexity предустанавливают на все новые смартфоны Motorola

#assistant #voicemode
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
Media is too big
VIEW IN TELEGRAM
Сервис гугла NotebookLM для превращения любых источников в подкаст научился говорить по-русски (и еще на 50 языках)

Попробовать - притворитесь что вы не в России

#text2voice #pdf2voice #text2podcast
HiDream-E1

Тренд продолжается.
Редактор картинок текстовыми указаниями на основе HiDream-I1

Демо
Попробовать на офсайте

#imageediting
F-Lite

Генератор картинок от Freepik
10B параметров

F Lite - базовая модель
F Lite-Texture - вариант F Lite, который создает лучшие текстуры и эстетику, но плохо работает с короткими промптами и менее эффективен для векторной графики (что?)

Гитхаб
Веса
Демо F Lite
Демо F Texture
ComfyUI

#text2image #ComfyUI #workflow
RealisDance: Equip controllable character animation with realistic hands

Оживлятор персонажей по образцу движения. Для богопротивных тиктоков должно подойти.

Но как же хорошо выглядят их видео, при том что файлам в репозитории уже по 5-7 месяцев. Я даже сомневаюсь что это мне показывают результаты, а не образцы движения

Умеет делать взаимодествие с предметами, стилизацию, необычные позы, сложные жесты и мультиперсонажку - есть примеры анимации двух персонажей

Позы и исходные картинки кодируются Wan-2.1 VAE

В коде ссылки на Open-Animate Anyone, Moore-Animate Anyone, MusePose.

Код

#image2video #humananimation #characteranimation #pose2video
2025/07/07 11:41:05
Back to Top
HTML Embed Code: