Нейронавт | Нейросети в творчестве 7076

Нейронавт | Нейросети в творчестве

Hunyuan Image 2.0

Tencent выкатил генератор картинок 2.0
Генерит мгновенно!
Высокая реалистичность.
Dual-Canvas Studio - редактор с холстом позволяет смешивать слои.

Как пользоваться - непонятно, все на китайском. Для начала надо войти по имейлу. Вот куда-то ткнул, сделал котика. Первая картинка с котиком - моя, просто по запросу Cat, непонятно новой моделью или старой.

Вообще выглядит впечатляюще

#text2image #realtime #imageediting

1.9K views12:40

Нейронавт | Нейросети в творчестве

Короче, надо ткнуть в 1, потом в 2, потом нажать кнопку 3, появится всплывающее окошко и надо успеть ткнуть в нем на кнопку, она почему-то сразу исчезает, тогда появится сообщение что мол ждите приглашение на почту

А мой кот был из старой версии, получается

1.5K views12:45

Нейронавт | Нейросети в творчестве

This media is not supported in your browser

VIEW IN TELEGRAM

так видимо выглядит работа с холстом

1.4K views12:47

Нейронавт | Нейросети в творчестве

BLIP3-o

Мультимодальная модель от Salesforce. Сочетает в себе авторегрессионную силу рассуждений и инструкций с генеративной силой диффузионных моделей. Есть 4B и 8B параметров

Понимает картинки и умеет отвечать на вопросы как минимум

Демо
Код
Веса

#multimodal #image2text #instruct

1.5K views13:16

Нейронавт | Нейросети в творчестве

2:30

This media is not supported in your browser

VIEW IN TELEGRAM

LightLab: Controlling Light Sources in Images with Diffusion Models

Гугл в соавторстве создали модель для управления видимыми источниками света на изображениях. Увы кода нет. На сайте проекта можно интерактивно потыкать картинки

#relighting

1.5K views13:47

Нейронавт | Нейросети в творчестве

0:17

This media is not supported in your browser

VIEW IN TELEGRAM

Marigold: Generative Computer Vision

Опа, Marigold прокачался
Там теперь не только глубина а целая пачка пассов: нормали, альбедо, какой-то intrinsic. RollingDepth на нем сделан.

Есть в Diffusers, гайд

Код
Демо глубина
Демо нормали
Демо интринсик

#image2depth #image2normal #image2albedo

1.8K views14:47

Нейронавт | Нейросети в творчестве

Не угадали! Codex норм название

#coding #vibecoding #assistant

Нейронавт | Нейросети в творчестве

Альтман опять что-то спойлерит, неизвестно что.
Делаем ставки

👍 - придумают нормальное название продукта
👎 - как всегда, будет бессмысленное цифро-буквенное обозначение

#news

1.5K viewsedited 16:21

Нейронавт | Нейросети в творчестве

Forwarded from Сиолошная

https://openai.com/index/introducing-codex/

— Codex — AI-агент-программист у вас в браузере
— может работать над несколькими задачами
— под капотом модель Codex-1 , основанная на o3
— можно подключать свой GitHub аккаунт, чтобы давать доступ агенту
— Plus юзеры пока не получат доступ, выкатят скоро.
— For developers building with codex-mini-latest (МИНИ), the model is available on the Responses API and priced at $1.50 per 1M input tokens and $6 per 1M output tokens, with a 75% prompt caching discount. Модель основана на o4-mini и заточена под работу в Codex CLI
— иногда (не ясно, как часто) модель при внесении исправлений добавляет тесты, которыми проверяет новую или исправленную функциональность, и итерируется до тех пор, пока тест не пройдет

YouTube

A research preview of Codex in ChatGPT

Greg Brockman, Jerry Tworek, Joshua Ma, Hanson Wang, Thibault Sottiaux, Katy Shi, and Andrey Mishchenko introduce and demo Codex in ChatGPT.

1.2K views16:21

Нейронавт | Нейросети в творчестве

Залил для вас вчерашний стрим Hunyian Image 2.0 на ютуб, включайте в Яндекс браузере дубляж и смотрите часовое видео если хотите все подробности

Если хотите коротко, то держите подкаст на чистом русском из NotebookLM. Вот оказывается для чего он нужен

Нейронавт | Нейросети в творчестве

1.8K viewsedited 08:51

Нейронавт | Нейросети в творчестве

Tencent Hunyuan Image 2_0 Release.wav

17.6 MB

1.7K views08:51

Нейронавт | Нейросети в творчестве

This media is not supported in your browser

VIEW IN TELEGRAM

Comfyui-FlowChain

Позволяет заворачивать группы нод и целые форкфлоу в одну ноду

#ComfyUI #tools

1.6K views09:05

Нейронавт | Нейросети в творчестве

Ollama

Платформа запуска языковых моделей Ollama представила новый движок с полной поддержкой мультимодальных ИИ-моделей, которые могут работать как с текстом, так и с изображениями.

Что нового:
• Каждая модель теперь полностью автономна - это упрощает обновления и интеграцию
• Улучшена точность визуального анализа благодаря передаче метаданных и поддержке больших изображений
• Оптимизирована работа с памятью: кэшируются изображения, улучшен KV-кэш, модели работают быстрее и стабильнее

Скачать Ollama

#multimodal #VLM #news

1.6K views09:48

Нейронавт | Нейросети в творчестве

AI Runner 4.8

AI Runner теперь официально поддерживает OpenVoice.

Что нового:
• Поддержка OpenVoice для клонирования голоса и генерации речи на нескольких языках
• Возможность настройки стиля голоса, включая эмоции, акценты, ритм, паузы и интонацию
• Улучшенное качество аудио и нативная поддержка нескольких языков

#voicecloning #tools

1.5K views10:58

Нейронавт | Нейросети в творчестве

petermg InfiniteYou

Форк InfiniteYou с добавленными фуекциями

best_face:
Анализирует каждое загруженное изображение с использованием модели распознавания лиц и выбирает изображение с наибольшим показателем достоверности для обнаруженного лица. Этот режим идеален, когда вы хотите получить максимально четкое отдельное изображение, отражающее индивидуальность, отдавая приоритет качеству и четкости.

averaged_face:
Выравнивает все загруженные изображения на основе ориентиров лица (например, глаз и носа) по эталонному изображению, затем усредняет значения пикселей для создания усредненного лица

#imageediting #personalization

1.4K views11:17

Нейронавт | Нейросети в творчестве

1:37

This media is not supported in your browser

VIEW IN TELEGRAM

0:13

This media is not supported in your browser

VIEW IN TELEGRAM

PocketPal AI

Приватный ИИ-ассистент на мобилке на небольших языковых моделях - #SLM

Код
iOS
Android

#mobile #assistant

1.5K views13:12

Нейронавт | Нейросети в творчестве

WAN2.1 VACE14B GGUF

Квантизованная версия Wan2.1-VACE

воркфлоу

#text2video #video2video #personalization #videoediting #referencing #gguf

1.5K viewsedited 13:42

2025/07/04 09:05:17
Back to Top

HTML Embed Code:

<iframe width="100%" src="https://www.bootg.com/buyppe/web?embed=1" title="Telegram Web" frameborder="0" allow="accelerometer; autoplay; clipboard-write; encrypted-media; gyroscope; picture-in-picture" allowfullscreen></iframe>