👍5
This media is not supported in your browser
VIEW IN TELEGRAM
OWL: Optimized Workforce Learning for General Multi-Agent Assistance in Real-World Task Automation
Бесплатная альтернатива агента-автоматизатора MANUS
#agent
Бесплатная альтернатива агента-автоматизатора MANUS
#agent
👍4💩1
VCtrl: Enabling Versatile Controls for Video Diffusion Models
Унифицированный контролнет для видеогенераторов, не требует дообучения. На примерах показаны Canny / Pose / Mask
Код
#controlnet #video2video #motioncontrol #text2video
Унифицированный контролнет для видеогенераторов, не требует дообучения. На примерах показаны Canny / Pose / Mask
Код
#controlnet #video2video #motioncontrol #text2video
👍7😐3
This media is not supported in your browser
VIEW IN TELEGRAM
Grok Edit Image
Вслед за Gemini, в Grok добавили функцию редактирования картинок текстовыми указаниями
Идем в Grok, ищем кнопку Edit Image
#assistant #mlm #vlm #imageediting #text2image
Вслед за Gemini, в Grok добавили функцию редактирования картинок текстовыми указаниями
Идем в Grok, ищем кнопку Edit Image
#assistant #mlm #vlm #imageediting #text2image
🔥12👍5😭1
DeepSeek-V3-0324
Обновка занозы в багажнике OpenAI, лицензия MIT
Что-то там быстрее, умнее, дешевле
Умелец уже запустил локально на M3 Mac Studio с 512 ГБ памяти
Попробовать тут
#assistant #reasoning
Обновка занозы в багажнике OpenAI, лицензия MIT
Что-то там быстрее, умнее, дешевле
Умелец уже запустил локально на M3 Mac Studio с 512 ГБ памяти
Попробовать тут
#assistant #reasoning
👍5❤3
Аттракцион невиданной щедрости от Deemos
Они выложили в твиттере API ключ полного доступа к своему 3D генератору Rodin
API Key:
API
———————————————
Если вы спрашиваете что делать с халявным ключом, то вот еще новость
BlenderMCP поженили с Rodin. Твит
#coding #textto3d #imageto3d #api
Они выложили в твиттере API ключ полного доступа к своему 3D генератору Rodin
API Key:
vibecoding
API
———————————————
Если вы спрашиваете что делать с халявным ключом, то вот еще новость
BlenderMCP поженили с Rodin. Твит
#coding #textto3d #imageto3d #api
🔥9👍5❤1
This media is not supported in your browser
VIEW IN TELEGRAM
У генератора музыки Riffusion обновки и весьма интересные
- Можно загрузить свой трек для препарирования и переделки
- Swap Sound - заменяем инструментальные партии/жанры, вокал остается
- Swap Vocal - заменяем вокал, оставляя инструменты
- Get Stems - делим композицию на партии и скачиваем
- Trim - обрезаем, оставляя нужный кусок, и работаем от него
- Ghostwriter - пишет тексты
#text2music #music2music #audio2music
- Можно загрузить свой трек для препарирования и переделки
- Swap Sound - заменяем инструментальные партии/жанры, вокал остается
- Swap Vocal - заменяем вокал, оставляя инструменты
- Get Stems - делим композицию на партии и скачиваем
- Trim - обрезаем, оставляя нужный кусок, и работаем от него
- Ghostwriter - пишет тексты
#text2music #music2music #audio2music
👍13
G-Assist
Игровой помощник Nvidia уже доступен в NVIDIA App.
Анализирует игры, подсказывает настройки, билды для боссов и героев, помогает с итембилдами, переключает громкость в Spotify. Поддерживает локальную модель без интернета и API Gemini. Понимает текст и голос
Обновляем NVIDIA App, открываем в приложении главную страницу, пролистываем до "Интересное" ("Discover"), ищем там Project G-Assist, устанавливаем
#gaming #news #assistant
Игровой помощник Nvidia уже доступен в NVIDIA App.
Анализирует игры, подсказывает настройки, билды для боссов и героев, помогает с итембилдами, переключает громкость в Spotify. Поддерживает локальную модель без интернета и API Gemini. Понимает текст и голос
Обновляем NVIDIA App, открываем в приложении главную страницу, пролистываем до "Интересное" ("Discover"), ищем там Project G-Assist, устанавливаем
#gaming #news #assistant
😁8❤3⚡1👍1
Gemini 2.5 Pro
Мультимодальная рассуждалка. Но пока без генерации картинок.
По нескольким бенчам всех превзошел, взлетел наверх арены.
Контекст миллион токенов, обещают два.
Сегодня гугл всех побил. Надолго ли?
Пробовать в AI Studio
#assistant #reasoning #coding
Мультимодальная рассуждалка. Но пока без генерации картинок.
По нескольким бенчам всех превзошел, взлетел наверх арены.
Контекст миллион токенов, обещают два.
Сегодня гугл всех побил. Надолго ли?
Пробовать в AI Studio
#assistant #reasoning #coding
👍10🤯6
4o Image Generation
Говорят, GPT-4o теперь подобно Gemini и Grok умеет редактировать картинки и даже генерить видео через Sora, подписка не нужна. Дают 3 видео в сутки.
Мне сначала сказал вот, готово, а картинку не отдал. Теперь совсем отказывается, говорит не умею
Видео
#imageediting
Говорят, GPT-4o теперь подобно Gemini и Grok умеет редактировать картинки и даже генерить видео через Sora, подписка не нужна. Дают 3 видео в сутки.
Мне сначала сказал вот, готово, а картинку не отдал. Теперь совсем отказывается, говорит не умею
Видео
#imageediting
🤯8👍1😈1
Языковые модели подминают под себя задачи с обработкой изображений. Скоро флюкс и МЖ станут не нужны. Чем ответят авторы картиночных нейросеток?
🤔11👎5😈1
Aether: Geometric-Aware Unified World Modeling
Видеогенератор с пониманием пространственной геометрии с тремя ключевыми способностями:
- Динамическая реконструкция в формате 4D
- Прогнозирование видео на основе действия
- Визуальное планирование на основе цели
Умеет восстанавливать динамические облака точек по видео, оценивая глубину и ракурс.
Код ждем
Демо ждем
#video2video #novelview #cameracontrol #motioncontrol
Видеогенератор с пониманием пространственной геометрии с тремя ключевыми способностями:
- Динамическая реконструкция в формате 4D
- Прогнозирование видео на основе действия
- Визуальное планирование на основе цели
Умеет восстанавливать динамические облака точек по видео, оценивая глубину и ракурс.
Код ждем
Демо ждем
#video2video #novelview #cameracontrol #motioncontrol
👍12