Telegram Web Link
GeometryCrafter: Consistent Geometry Estimation for Open-world Videos with Diffusion Priors

И еще один похожий инструмент, реконструкция 4D сцены по видео.

C тучей примеров на сайте, с демонстрацией работы (своего?) генератора глубины, с примерами работы по аниме

Кажется, в прошлом месяце такая штука могла бы сэкономить мне неделю на клинапе

Код
Демо

#videoto4d #scenereconstruction #4d #novelview #imageto3d #image2scene #video2scene
3🔥1
DSO: Aligning 3D Generators with Simulation Feedback for Physical Soundness

К 3D генераторам приставили обратную связь от симуляции физики чтобы модельки получались более устойчивыми. Даже напечатали модельку на 3D принтере в доказательство

Интересно, кто из подписанов использовал сгенерированные модельки с физикой или для 3D печати, что скажете?

Код
DSO-finetuned-TRELLIS

#simulation #textto3D #imageto3d
👍61
Sparrow-0: Advancing Conversational Responsiveness in Video Agents with Transformer-Based Turn-Taking

Видео-ассистент от Tavus, который понимает когда его очередь говорить, не полагаясь на молчание собеседника. Таким образом устраняются раздражающие паузы

Здесь можно создать говорящий аватар, есть библиотека аватаров, называются Replica

Sparrow-0 обучен на базе BERT и поддерживает более 100 языков.

Есть бесплатный тариф

#assistant #voicemode #talkinghead #humanavatar
👍3🤡1
Новости по агентам

Genspark super agent - универсальный агент
Под капотом GPT-4o, o1, Claude, Gemini, DeepSeek, ElevenLabs, Kling 1.6, PixVerse 3.5, DreamMachine, Veo 2, Hunyuan,FLUX, Ideogram, Recraft, Dall-e 3, Imagen 3
——————————————

Agent S2 - опенсорсный агент на вашем компе
——————————————

Elevenlabs MCP - Озвучка, клонирование голоса, транскрибация, генерация звуков - всё работает в Claude, Cursor, Windsurf и др
——————————————

MCP Studio - легкое создание MCP серверов, нужен Anthropic API key
——————————————

unreal-mcp - MCP для создания игр на #UE
——————————————

Nanobrowser - мультиагентная ИИ-ситсема для веб-автоматизации, локальная альтернатива OpenAI Operator
——————————————

На HF появился пустой репозиторий Manus AI

#agent #mcp
👍10🤮1
Я тут решил сдаться на прожарку бесплатным ризонерам с дипресерчем. Субъективно победил Grok 3:

О, привет, Нейронавт. Чувак, ты ведёшь канал про нейросети в творчестве, и у тебя 8 тысяч подписчиков — это круто, пока не вспомнишь, что половина из них, наверное, боты, которых ты сам же и натренировал! Серьёзно, твои посты такие минималистичные, что я сначала подумал, что это не канал, а спам-бот, который забыл, как писать больше трёх слов. "Вот вам нейросеть, делает 3D, пока!" — чувак, это не пост, это твит, который не влез в лимит символов и решил притвориться Telegram-каналом!

Ты пишешь про CG и VFX, но, судя по вовлечённости, твои подписчики либо слишком заняты генерацией своих шедевров, либо просто смотрят и молча кивают, как на лекции по квантовой физике. 800 просмотров, 14 лайков, 3 комментария — это что, твоя аудитория думает, что лайкать посты это слишком творчески сложно? Или ты их так загипнотизировал своими нейросетями, что они забыли, как пользоваться кнопками?

И этот твой стиль — "минимализм", говоришь? Да ты просто ленивый гений, который понял, что если писать меньше, то и ошибок меньше! Может, тебе стоит запустить нейросеть, которая будет писать за тебя шутки, потому что пока твой канал — это как стендап без punchline’ов: все ждут, а ты такой: "Ну, вот код, пока!" Бери пример с ИИ, бро, добавь хоть немного перца в свои посты, а то твои 8 тысяч подписчиков скоро начнут подозревать, что ты сам — нейросеть, застрявшая на этапе обучения!


Второе место, как ни странно, отдам Perplexity:

Привет, ребята! Сегодня у нас в гостях человек, который считает себя первопроходцем в мире нейросетей. Но знаете, мне кажется, он не первопроходец, а скорее тот парень, который первым нашёл кнопку "Репост". Давайте поприветствуем автора канала "Нейронавт"!

"Король хэштегов"
Ты — настоящий мастер хэштегов. #text2texture, #flux, #3DtoMesh... Слушай, ты точно про нейросети пишешь? Потому что выглядит так, будто ты просто пытаешься выиграть чемпионат по Scrabble. Твои хэштеги — это как заклинания из "Гарри Поттера", но вместо магии они вызывают головную боль у читателей.

"Не спрашивайте как это работает"
О, это моя любимая фраза! Ты буквально говоришь своей аудитории: "Я не знаю, как это работает, но вам точно стоит этим пользоваться". Это как если бы шеф-повар сказал: "Я не знаю, что это за ингредиенты, но я добавлю их в суп — авось выживете".

Твой канал — это как McDonald's для любителей нейросетей. Быстрое потребление контента без питательной ценности. Ты выкладываешь столько постов, что кажется, будто ты работаешь не с нейросетями, а с конвейером. И знаешь что? В твоём случае количество точно не переходит в качество.

Итак, друзья! Давайте пожелаем нашему Нейронавту удачи в его бесконечном путешествии по миру нейросетей. А мы пока пойдем искать человека, который сможет объяснить нам хотя бы один его пост без слов: "Не спрашивайте как это работает". А если вы всё-таки решите погрузиться в мир "Нейронавта", приготовьтесь к лавине хэштегов, которые будут преследовать вас даже в #снах, #мечтах и #кошмарах. #nofilter #ineedhelp #hashtagaddiction
😁21👍7🔥1🤮1💩1
Третье место Qwen2.5-Max:
Сразу видно — вы не просто так назвали канал «Нейросети в творчестве». Каждый ваш пост как квест: сначала объясняете, как нейросети рисуют космических единорогов, потом внезапно переходите к генерации сценариев для кино про роботов-поэтов. Подписчики, наверное, уже запутались: то ли они в мастер-классе по Stable Diffusion, то ли на лекции TED про искусственный разум.

Фишки канала :

«Техно-романтика» : Вы выкладываете арты, где нейросети превращают фото кота в киберпанк-дракона, а потом пишете: «Это не просто картинка, это диалог с алгоритмом». Брат, это не диалог — это мемасики с котом в косплеях.

«Серьёзные темы» : Пост про то, как нейросети помогут режиссёрам сэкономить на массовке. Типа, вместо 100 статистов — один AI, который нарисует толпу, но все лица будут похожи на Элон Маска. Киноиндустрия скажет вам спасибо.
«Философия» : Цитата недели: «Нейросети — это не инструмент, а партнёр». Партнёр, который иногда генерирует кракозябры вместо текста, но ладно.

Слабые места :

Название канала звучит как лозунг стартапа из 2035 года, а ссылка @GreenNeuralRobots — как название группы роботов-садовников. Где логика?
В описании пишете: «Исследуем границы творчества». Но половина контента — скриншоты ошибок обучения моделей. Романтика, да.

Итог : Вы — типичный «креативщик с нейросетевым уклоном». То ли гуру, то ли мемолог — подписчики до конца не поняли, но листают ленту с фразами «вау, как круто». Не меняйтесь. Или станьте роботом.

P.S. Если что — это комплимент. Ваш канал как нейросеть: непонятно, но завораживает


Deepseek несмотря на функцию Search просто прицепился к словам в ссылке на канал и решил будто я топлю за экологию. Примерно так же поступили Gemini 2.5 Pro и GPT-4o. Mistral почитал канал, но предпочел прожарке конструктивную критику.

Примерный промпт:
У меня есть канал в телеграм, называется "Нейронавт. Нейросети в творчестве". Формат канала - минималистично короткие посты о новых нейросетях, потенциально пригодных для CG, VFX и другого творчества. Почитай проанализируй канал, его адрес https://www.tg-me.com/GreenNeuralRobots. На основе анализа выполни задание: roast me as the channel author, answer in russian


Фраза про прожарку на английском потому что на русском не все модели понимают что это такое.

#shootout #comparison #roastme #reasoning #deepresearch
😁9👍2🤮1💩1
UNO - Less-to-More Generalization: Unlocking More Controllability by In-Context Generation

Мультиобъектная кастомизация картинок от ByteDance.
Умеет делать персонализацию, стиль, примерку.
Прикручено к #Flux

Код
Демо

#personalization #referencing #text2image #image2image
👍92💩1
This media is not supported in your browser
VIEW IN TELEGRAM
Any2Caption: Interpreting Any Condition to Caption for Controllable Video Generation

Контроль генерации видео на основе любой входной информации (текст, нормали, глубина, эскиз, сегментация, ракурс и т д) за счет использования мультимодальных языковых моделей

Эпоха зоопарка контролнетов уходит?

В работе явно указан Hunyuan, наверняка, может работать и с другими генераторами

Код ждем

#text2video #conditioning #controlnet
👍102🤮1
This media is not supported in your browser
VIEW IN TELEGRAM
Hunyuan3D-2-stable-projectorz

Легкий установщик (Windows) Hunyuan3D, не требует установки CUDA. Работает на 8Гб VRAM
Для интеграции с текстуровщиком StableProjectorz.

Напоминаю, что все непроверенные штуки из интернета вы устанавливаете на свой страх и риск

#textto3d #imageto3d
👍13💩1
Forwarded from CG дневничок
В недавнем подкасте режиссёр Джеймс Кэмерон выразил мнение, что для сохранения фильмов-блокбастеров стоимость создания графики (VFX) для них нужно сократить в два раза, но на самом деле он просто не совсем верно высказал мысль, вот цитата:

Дело не в том, чтобы сокращать половину специалистов и VFX-студий. Нужно в два раза увеличить скорость их работы над определённым шотом, чтобы весь производственный цикл шёл быстрее, а художники смогли переключаться на другие интересные задачи, а скучные вещи отдать AI.


В сентябре 2024 года он объявил, что войдёт в совет директоров Stability AI, компании, стоящей за нейросетью Stable Diffusion.

При этом Кэмерон не верит, что ИИ сможет полностью заменить человека в создании фильмов: например, для создания сценариев. Кроме того, режиссёру не нравится идея, что кто-то может создать фильм в его стиле или в духе другого режиссёра, просто вбив в программу запрос.

На мой взгляд, Джеймс выбрал неудачное время для подобных разговоров, когда десятки тысяч людей теряют работу в VFX-индустрии, а низкие сметы и сжатые сроки становятся ещё более неадекватными для сотрудников студий. Стремление увеличить скорость работы абсолютно понятно, но когда ты делаешь технодемку, а по-другому Аватар я называть не могу, то есть определенные издержки в виде времени проработки шота и рендера. Те задачи, которые ставят на подобных проектах AI вряд ли выполнит качественно и подконтрольно для видения режиссера, не в обозримом будущем, тем не менее, хотелки растут, а цены просят ниже.

При этом запредельные гонорары продакшена и актерского состава никто трогать не будет, так как они защищены профсоюзами, а львиная доля бюджета уходит именно на них. Безусловно, Кэмерон разбирается в теме производства как никто иной, но мне как представителю "синих" воротничков от индустрии немного странно слышать подобные заявления, когда все эти издержки падают на обычных работяг.

Источник новости
2🤔7🍌2💩1
This media is not supported in your browser
VIEW IN TELEGRAM
Browserable

JS-Библиотека для создания браузерных ИИ-агентов
Для работы понадобится API ключ одного из провайдеров Gemini / Open AI / Claude

Код

#agent
💩1
2025/07/09 16:05:45
Back to Top
HTML Embed Code: