Новости автоматизации
Имейте ввиду, что устанавливать MCP из непроверенных источников небезопасно
image-gen MCP
ИИ прикручивают к ИИ. На сей раз агента прикрутили к интерфейсу генерации картинок Forge / AUTOMATIC-1111
————————————
AbletonMCP
MCP к музыкальной станции Ableton
————————————
Народ массово сооружает свои MCP к Cursor просто потому что это легко
————————————
https://mcpify.ai
Онлайн сервис для создания своего MCP
————————————
Галереи MCP серверов
https://github.com/punkpeye/awesome-mcp-servers/
https://portkey.ai/mcp-servers
https://mcp.so
https://mcp.composio.dev
https://glama.ai/mcp/servers
————————————
https://modelcontextprotocol.io/introduction
Введение в MCP
#agent #text2music #text2image #imageediting #musicediting #mcp #coding #text2agent
Имейте ввиду, что устанавливать MCP из непроверенных источников небезопасно
image-gen MCP
ИИ прикручивают к ИИ. На сей раз агента прикрутили к интерфейсу генерации картинок Forge / AUTOMATIC-1111
————————————
AbletonMCP
MCP к музыкальной станции Ableton
————————————
Народ массово сооружает свои MCP к Cursor просто потому что это легко
————————————
https://mcpify.ai
Онлайн сервис для создания своего MCP
————————————
Галереи MCP серверов
https://github.com/punkpeye/awesome-mcp-servers/
https://portkey.ai/mcp-servers
https://mcp.so
https://mcp.composio.dev
https://glama.ai/mcp/servers
————————————
https://modelcontextprotocol.io/introduction
Введение в MCP
#agent #text2music #text2image #imageediting #musicediting #mcp #coding #text2agent
1👍11❤3
Нейронавт | Нейросети в творчестве
Grok в Телеграм, не реклама В тг появился бот @GrokAI, вероятно официальный В юзернейме нет обязательного для пользовательских ботов "_bot", кроме того, Дуров в твиттере намекал на интеграцию Похоже что это не Grok3, а Grok2. Картинки рисовать отказывается…
👍10🥴6👎2😐1
Ideogram 3.0
Обновка за обновкой.
3 версия генератора картинок Ideogram хвастается модными Canvas, remix, удержанием стиля, заменой фона, реализмом, точностью генерации текста, пакетной генерацией и т д.
Попробовать
iOS
#text2image
Обновка за обновкой.
3 версия генератора картинок Ideogram хвастается модными Canvas, remix, удержанием стиля, заменой фона, реализмом, точностью генерации текста, пакетной генерацией и т д.
стабильно превосходит другие модели преобразования текста в изображение
Попробовать
iOS
#text2image
👍5🔥1
This media is not supported in your browser
VIEW IN TELEGRAM
Step-Video-TI2V
Открыт доступ к генератору видео по картинке/тексту от Stepfun, в том числе онлайн на сайте. Авторизация по российскому номеру телефона НЕ работает
Попробовать
Веса
#image2video
Открыт доступ к генератору видео по картинке/тексту от Stepfun, в том числе онлайн на сайте. Авторизация по российскому номеру телефона НЕ работает
Попробовать
Веса
#image2video
👍9
This media is not supported in your browser
VIEW IN TELEGRAM
Inference-Time Scaling for Flow Models via Stochastic Generation and Rollover Budget Forcing
Решает проблему генерации заданного количества объектов и их расположения в кадре для Flux и подобных моделей
Код ждем
#text2image
Решает проблему генерации заданного количества объектов и их расположения в кадре для Flux и подобных моделей
Код ждем
#text2image
👍6❤2
AvatarArtist: Open-Domain 4D Avatarization
Создает 4D аватар по одному портрету
От авторов Follow-Your-Emoji
Код
Демо ждем
#image2avatar #head
Создает 4D аватар по одному портрету
От авторов Follow-Your-Emoji
Код
Демо ждем
#image2avatar #head
👍6❤1
This media is not supported in your browser
VIEW IN TELEGRAM
FirePlace: Geometric Refinements of LLM Common Sense Reasoning for 3D Object Placement
Разработка DeepMind. Осмысленное размещение языковыми моделями объектов в 3D сцене с учётом геометрии и констрейнов
А я думал, Клод с MCP уже намного больше может
Кода нет
#mlm #assistant #3d
Разработка DeepMind. Осмысленное размещение языковыми моделями объектов в 3D сцене с учётом геометрии и констрейнов
А я думал, Клод с MCP уже намного больше может
Кода нет
#mlm #assistant #3d
👍6
This media is not supported in your browser
VIEW IN TELEGRAM
Immersity 4.0
Leia Inc выпустили обновку.
Immersity это онлайн сервис, где можно немного подвигать картинку натянув карту глубины, бывший Leiapix. Так вот, теперь оно работает лучше. Но на бесплатном тарифе вам не отдадут карту глубины. А что отдадут будет с вотермаркой
Еще умеет делать из обычного видео 3D видео для XR девайсов, опять же через карту глубины. На бесплатном тарифе:
3D Motion
3D Image
3D Video Simple
#image2depth #image2video #monoculardepth #parallax
Leia Inc выпустили обновку.
Immersity это онлайн сервис, где можно немного подвигать картинку натянув карту глубины, бывший Leiapix. Так вот, теперь оно работает лучше. Но на бесплатном тарифе вам не отдадут карту глубины. А что отдадут будет с вотермаркой
Еще умеет делать из обычного видео 3D видео для XR девайсов, опять же через карту глубины. На бесплатном тарифе:
3D Motion
3D Image
3D Video Simple
#image2depth #image2video #monoculardepth #parallax
👍4
This media is not supported in your browser
VIEW IN TELEGRAM
AccVideo: Accelerating Video Diffusion Model with Synthetic Dataset
Очередной метод ускорения видеогенерации.
Быстрее Hunyuan в 8.5 раз
Код
HF
#distillation #text2video
Очередной метод ускорения видеогенерации.
Быстрее Hunyuan в 8.5 раз
Код
HF
#distillation #text2video
🔥5❤1👍1
This media is not supported in your browser
VIEW IN TELEGRAM
Self-Supervised Learning of Motion Concepts by Optimizing Counterfactuals
Ура, новый трекер группы точек от Стэнфорда.
Несмотря на то что все они неточные, они мне уже пригождались там где все планарные и точечные трекеры оказывались бессильны
Код
Колаб
#tracking #opticalflow
Ура, новый трекер группы точек от Стэнфорда.
Несмотря на то что все они неточные, они мне уже пригождались там где все планарные и точечные трекеры оказывались бессильны
Код
Колаб
#tracking #opticalflow
🔥5👍3
LLM Arena: Бенчмарк LLM моделей на русском языке
Арена русскоязычных моделей.
А вот на днях еще и запустили приложение в тг
#arena #leaderboard #llm
Арена русскоязычных моделей.
А вот на днях еще и запустили приложение в тг
#arena #leaderboard #llm
👍5🥴4👎2
This media is not supported in your browser
VIEW IN TELEGRAM
Qwen2.5 Omni голос / видео
Мультимодальная обновка китайского ассистента. Теперь умеет общаться в голосовом режиме и в режиме видеочата
Поддерживает английский и китайский
Одновременно и думает и поддерживает разговор
7B параметров. Обещают выпустить и другие версии.
Попробовать
Гитхаб
HF
#assistant #voicemode #videochat
Мультимодальная обновка китайского ассистента. Теперь умеет общаться в голосовом режиме и в режиме видеочата
Поддерживает английский и китайский
Одновременно и думает и поддерживает разговор
7B параметров. Обещают выпустить и другие версии.
Попробовать
Гитхаб
HF
#assistant #voicemode #videochat
👍7🔥1
DiffPortrait360: Consistent Portrait Diffusion for 360 View Synthesis
Вид головы с любой стороны по одному входному портрету.
Код ждем
Демо ждем
#head #novelview
Вид головы с любой стороны по одному входному портрету.
Код ждем
Демо ждем
#head #novelview
👍8
Hi3DGen: High-fidelity 3D Geometry Generation from Images via Normal Bridging
Генератор 3D моделей по изображению через оценку нормалей
Файнтюн Trellis
Код ждем
Демо
#imageto3d #image2normal
Генератор 3D моделей по изображению через оценку нормалей
Файнтюн Trellis
Код ждем
Демо
#imageto3d #image2normal
👍8🔥5
This media is not supported in your browser
VIEW IN TELEGRAM
DAI: Dereflection Any Image with Diffusion Priors and Diversified Data
Удаление отражений с изображений
В этой области помню только StableDelight
Код
Демо
Колаб
#reflectionremoval #image2image
Удаление отражений с изображений
В этой области помню только StableDelight
Код
Демо
Колаб
#reflectionremoval #image2image
👍12