Telegram Web Link
Media is too big
VIEW IN TELEGRAM
Krisp

Голосовой шумодав (тот который встроен в дискорд) научился убирать из речи акцент. Пока только индийский акцент. В будущем добавят и другие

Можно использовать бесплатно, с лимитами

#speech2speech #deaccent #speechcorrection
😁23👍2
Media is too big
VIEW IN TELEGRAM
Anthropic выпустили свой Deep Research

Доступен только в некоторых странах и только для платных подписанов

Умеет искать не только в интернете, но и в ваших личных данных через интеграцию в Google Workspace. Да, это тоже новая анонсированная фича. Еще анонсировали голосовой режим

Anthropic

#assistant #voicemode #deepresearch #search
👍3
This media is not supported in your browser
VIEW IN TELEGRAM
FireBase Studio

ИИ-программист приложений от Google в браузере. Построен на базе Code OSS (форк Visual Studio Code)

Прошло уже несколько дней как я дал ему задание, но что-то результата нет. Хотя задание было непростое. В общем, пробуйте сами

Кстати, можно начать проект не с нуля, а с загрузки уже существующего проекта, например из гитхаба

Дают бесплатно 3 проекта (это неточно, могу ошибаться)

#coding #online
👍3
В Krea.ai завезли вчерашний Kling 2.0

На бесплатном аккаунте не потестить, разве что на новом если при регистрации дают приветственные кредиты

#text2video #image2video #text2image
👍4
OpenAI выпустили новые модели o3 и o4-mini

o3 самая мощная
o4-mini быстрая и дешевая

Модели "думают с картинками" - интегрируют визуальную информацию в процесс рассуждений
Самостоятельно используют все инструменты ChatGPT (веб-поиск, Python, генерацию изображений)
Решают сложные многоэтапные задачи без помощи человека

Доступ сначала дадут платным подписанам и разрабам в API

#news #assistant
3👍3
HiDream-I1_fp8/fp16

Квантизованная версия

Веса fp8
Веса на ComfyUI fp8/fp16
ComfyUI_examples

#comfyUI #text2image
👍42👎1🎃1
HiDream-I1-Dev-gguf

Еще квантизованные версии

Работает на RTX3060 с SageAttention и Torch Complie, 768x1344 100s 18steps

Веса
GGUF Loader
TEXT Encoders
VAE
workflow

#workflow #text2image
👍81🔥1
Nunchaku v0.2.0

Обновился движок для запуска 4-битных диффузных моделей
Добавлена поддержка нескольких лор и контролнета

На 3060 12gb Flux Dev выдает 1024x1024 30 шагов euler за 14-15 секунд

Код
Демо
ComfyUI
Туториал (youtube)

#text2image #optimization #tutorial
👍125
Media is too big
VIEW IN TELEGRAM
FramePack

Метод генерации длинных (1000+ кадров) видео от звезды опенсорсных моделей lllyasviel

480p @ 30 FPS на 6 ГБ VRAM, Hunyuan 13B

Поддерживает PyTorch, xformers, flash-attn, sage-attention

Ждем однокликовый установщик для Windows, возможно даже завтра

Код

#optimization #text2video #image2video
24🔥2👍1🤔1
InstantCharacter : Personalize Any Characters with a Scalable Diffusion Transformer Framework

Персонализотор картинок по одному образцу от Tencent

Прикручено к Flux, работает с лорами

Код
Демо

#personalization #text2image #image2image
🔥10
2025/07/08 16:14:23
Back to Top
HTML Embed Code: