Telegram Web Link
Новости автоматизации

Имейте ввиду, что устанавливать MCP из непроверенных источников небезопасно

image-gen MCP

ИИ прикручивают к ИИ. На сей раз агента прикрутили к интерфейсу генерации картинок Forge / AUTOMATIC-1111

————————————
AbletonMCP
MCP к музыкальной станции Ableton

————————————
Народ массово сооружает свои MCP к Cursor просто потому что это легко

————————————
https://mcpify.ai
Онлайн сервис для создания своего MCP

————————————
Галереи MCP серверов

https://github.com/punkpeye/awesome-mcp-servers/
https://portkey.ai/mcp-servers
https://mcp.so
https://mcp.composio.dev
https://glama.ai/mcp/servers

————————————
https://modelcontextprotocol.io/introduction
Введение в MCP

#agent #text2music #text2image #imageediting #musicediting #mcp #coding #text2agent
1👍113
Ideogram 3.0

Обновка за обновкой.
3 версия генератора картинок Ideogram хвастается модными Canvas, remix, удержанием стиля, заменой фона, реализмом, точностью генерации текста, пакетной генерацией и т д.

стабильно превосходит другие модели преобразования текста в изображение


Попробовать
iOS

#text2image
👍5🔥1
This media is not supported in your browser
VIEW IN TELEGRAM
Step-Video-TI2V

Открыт доступ к генератору видео по картинке/тексту от Stepfun, в том числе онлайн на сайте. Авторизация по российскому номеру телефона НЕ работает

Попробовать
Веса

#image2video
👍9
This media is not supported in your browser
VIEW IN TELEGRAM
Inference-Time Scaling for Flow Models via Stochastic Generation and Rollover Budget Forcing

Решает проблему генерации заданного количества объектов и их расположения в кадре для Flux и подобных моделей

Код ждем

#text2image
👍62
This media is not supported in your browser
VIEW IN TELEGRAM
FirePlace: Geometric Refinements of LLM Common Sense Reasoning for 3D Object Placement

Разработка DeepMind. Осмысленное размещение языковыми моделями объектов в 3D сцене с учётом геометрии и констрейнов

А я думал, Клод с MCP уже намного больше может

Кода нет

#mlm #assistant #3d
👍6
This media is not supported in your browser
VIEW IN TELEGRAM
Immersity 4.0

Leia Inc выпустили обновку.
Immersity это онлайн сервис, где можно немного подвигать картинку натянув карту глубины, бывший Leiapix. Так вот, теперь оно работает лучше. Но на бесплатном тарифе вам не отдадут карту глубины. А что отдадут будет с вотермаркой

Еще умеет делать из обычного видео 3D видео для XR девайсов, опять же через карту глубины. На бесплатном тарифе:

3D Motion
3D Image
3D Video Simple

#image2depth #image2video #monoculardepth #parallax
👍4
This media is not supported in your browser
VIEW IN TELEGRAM
Self-Supervised Learning of Motion Concepts by Optimizing Counterfactuals

Ура, новый трекер группы точек от Стэнфорда.

Несмотря на то что все они неточные, они мне уже пригождались там где все планарные и точечные трекеры оказывались бессильны

Код
Колаб

#tracking #opticalflow
🔥5👍3
LLM Arena: Бенчмарк LLM моделей на русском языке

Арена русскоязычных моделей.
А вот на днях еще и запустили приложение в тг

#arena #leaderboard #llm
👍5🥴4👎2
This media is not supported in your browser
VIEW IN TELEGRAM
Qwen2.5 Omni голос / видео

Мультимодальная обновка китайского ассистента. Теперь умеет общаться в голосовом режиме и в режиме видеочата

Поддерживает английский и китайский

Одновременно и думает и поддерживает разговор


7B параметров. Обещают выпустить и другие версии.

Попробовать
Гитхаб
HF

#assistant #voicemode #videochat
👍7🔥1
Hi3DGen: High-fidelity 3D Geometry Generation from Images via Normal Bridging

Генератор 3D моделей по изображению через оценку нормалей

Файнтюн Trellis

Код ждем
Демо

#imageto3d #image2normal
👍8🔥5
2025/07/11 18:38:09
Back to Top
HTML Embed Code: