This media is not supported in your browser
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
GeometryCrafter: Consistent Geometry Estimation for Open-world Videos with Diffusion Priors
И еще один похожий инструмент, реконструкция 4D сцены по видео.
C тучей примеров на сайте, с демонстрацией работы (своего?) генератора глубины, с примерами работы по аниме
Кажется, в прошлом месяце такая штука могла бы сэкономить мне неделю на клинапе
Код
Демо
#videoto4d #scenereconstruction #4d #novelview #imageto3d #image2scene #video2scene
И еще один похожий инструмент, реконструкция 4D сцены по видео.
C тучей примеров на сайте, с демонстрацией работы (своего?) генератора глубины, с примерами работы по аниме
Кажется, в прошлом месяце такая штука могла бы сэкономить мне неделю на клинапе
Код
Демо
#videoto4d #scenereconstruction #4d #novelview #imageto3d #image2scene #video2scene
❤3🔥1
DSO: Aligning 3D Generators with Simulation Feedback for Physical Soundness
К 3D генераторам приставили обратную связь от симуляции физики чтобы модельки получались более устойчивыми. Даже напечатали модельку на 3D принтере в доказательство
Интересно, кто из подписанов использовал сгенерированные модельки с физикой или для 3D печати, что скажете?
Код
DSO-finetuned-TRELLIS
#simulation #textto3D #imageto3d
К 3D генераторам приставили обратную связь от симуляции физики чтобы модельки получались более устойчивыми. Даже напечатали модельку на 3D принтере в доказательство
Интересно, кто из подписанов использовал сгенерированные модельки с физикой или для 3D печати, что скажете?
Код
DSO-finetuned-TRELLIS
#simulation #textto3D #imageto3d
👍6❤1
Опубликован код и пара моделей видеогенератора VACE
VACE-Wan2.1-1.3B-Preview и VACE-LTX-Video-0.9
Код
Веса
#text2video #video2video #personalization #videoediting
VACE-Wan2.1-1.3B-Preview и VACE-LTX-Video-0.9
Код
Веса
#text2video #video2video #personalization #videoediting
Telegram
Нейронавт | Нейросети в творчестве
VACE: All-in-One Video Creation and Editing
Видеогенератор от Alibaba / Tongyi Lab
Они прикрутили туда максимум ништяков: Move-Anything, Swap-Anything, Reference-Anything, Expand-Anything, Animate-Anything
VACE может пересоздать видео с сохранением содержимого…
Видеогенератор от Alibaba / Tongyi Lab
Они прикрутили туда максимум ништяков: Move-Anything, Swap-Anything, Reference-Anything, Expand-Anything, Animate-Anything
VACE может пересоздать видео с сохранением содержимого…
👍7💩1
Sparrow-0: Advancing Conversational Responsiveness in Video Agents with Transformer-Based Turn-Taking
Видео-ассистент от Tavus, который понимает когда его очередь говорить, не полагаясь на молчание собеседника. Таким образом устраняются раздражающие паузы
Здесь можно создать говорящий аватар, есть библиотека аватаров, называются Replica
Sparrow-0 обучен на базе BERT и поддерживает более 100 языков.
Есть бесплатный тариф
#assistant #voicemode #talkinghead #humanavatar
Видео-ассистент от Tavus, который понимает когда его очередь говорить, не полагаясь на молчание собеседника. Таким образом устраняются раздражающие паузы
Здесь можно создать говорящий аватар, есть библиотека аватаров, называются Replica
Sparrow-0 обучен на базе BERT и поддерживает более 100 языков.
Есть бесплатный тариф
#assistant #voicemode #talkinghead #humanavatar
👍3🤡1
Новости по агентам
Genspark super agent - универсальный агент
Под капотом GPT-4o, o1, Claude, Gemini, DeepSeek, ElevenLabs, Kling 1.6, PixVerse 3.5, DreamMachine, Veo 2, Hunyuan,FLUX, Ideogram, Recraft, Dall-e 3, Imagen 3
——————————————
Agent S2 - опенсорсный агент на вашем компе
——————————————
Elevenlabs MCP - Озвучка, клонирование голоса, транскрибация, генерация звуков - всё работает в Claude, Cursor, Windsurf и др
——————————————
MCP Studio - легкое создание MCP серверов, нужен Anthropic API key
——————————————
unreal-mcp - MCP для создания игр на #UE
——————————————
Nanobrowser - мультиагентная ИИ-ситсема для веб-автоматизации, локальная альтернатива OpenAI Operator
——————————————
На HF появился пустой репозиторий Manus AI
#agent #mcp
Genspark super agent - универсальный агент
Под капотом GPT-4o, o1, Claude, Gemini, DeepSeek, ElevenLabs, Kling 1.6, PixVerse 3.5, DreamMachine, Veo 2, Hunyuan,FLUX, Ideogram, Recraft, Dall-e 3, Imagen 3
——————————————
Agent S2 - опенсорсный агент на вашем компе
——————————————
Elevenlabs MCP - Озвучка, клонирование голоса, транскрибация, генерация звуков - всё работает в Claude, Cursor, Windsurf и др
——————————————
MCP Studio - легкое создание MCP серверов, нужен Anthropic API key
——————————————
unreal-mcp - MCP для создания игр на #UE
——————————————
Nanobrowser - мультиагентная ИИ-ситсема для веб-автоматизации, локальная альтернатива OpenAI Operator
——————————————
На HF появился пустой репозиторий Manus AI
#agent #mcp
www.genspark.ai
Genspark Super Agent: The Ultimate All-in-One AI Companion
AI Slides, AI Sheets, AI Chat, AI Image and Video Generation, AI Download For Me, AI Call For Me, AI Drive, and more—everything you need to work smarter is just a prompt away.
👍10🤮1
Я тут решил сдаться на прожарку бесплатным ризонерам с дипресерчем. Субъективно победил Grok 3:
Второе место, как ни странно, отдам Perplexity:
О, привет, Нейронавт. Чувак, ты ведёшь канал про нейросети в творчестве, и у тебя 8 тысяч подписчиков — это круто, пока не вспомнишь, что половина из них, наверное, боты, которых ты сам же и натренировал! Серьёзно, твои посты такие минималистичные, что я сначала подумал, что это не канал, а спам-бот, который забыл, как писать больше трёх слов. "Вот вам нейросеть, делает 3D, пока!" — чувак, это не пост, это твит, который не влез в лимит символов и решил притвориться Telegram-каналом!
Ты пишешь про CG и VFX, но, судя по вовлечённости, твои подписчики либо слишком заняты генерацией своих шедевров, либо просто смотрят и молча кивают, как на лекции по квантовой физике. 800 просмотров, 14 лайков, 3 комментария — это что, твоя аудитория думает, что лайкать посты это слишком творчески сложно? Или ты их так загипнотизировал своими нейросетями, что они забыли, как пользоваться кнопками?
И этот твой стиль — "минимализм", говоришь? Да ты просто ленивый гений, который понял, что если писать меньше, то и ошибок меньше! Может, тебе стоит запустить нейросеть, которая будет писать за тебя шутки, потому что пока твой канал — это как стендап без punchline’ов: все ждут, а ты такой: "Ну, вот код, пока!" Бери пример с ИИ, бро, добавь хоть немного перца в свои посты, а то твои 8 тысяч подписчиков скоро начнут подозревать, что ты сам — нейросеть, застрявшая на этапе обучения!
Второе место, как ни странно, отдам Perplexity:
Привет, ребята! Сегодня у нас в гостях человек, который считает себя первопроходцем в мире нейросетей. Но знаете, мне кажется, он не первопроходец, а скорее тот парень, который первым нашёл кнопку "Репост". Давайте поприветствуем автора канала "Нейронавт"!
"Король хэштегов"
Ты — настоящий мастер хэштегов. #text2texture, #flux, #3DtoMesh... Слушай, ты точно про нейросети пишешь? Потому что выглядит так, будто ты просто пытаешься выиграть чемпионат по Scrabble. Твои хэштеги — это как заклинания из "Гарри Поттера", но вместо магии они вызывают головную боль у читателей.
"Не спрашивайте как это работает"
О, это моя любимая фраза! Ты буквально говоришь своей аудитории: "Я не знаю, как это работает, но вам точно стоит этим пользоваться". Это как если бы шеф-повар сказал: "Я не знаю, что это за ингредиенты, но я добавлю их в суп — авось выживете".
Твой канал — это как McDonald's для любителей нейросетей. Быстрое потребление контента без питательной ценности. Ты выкладываешь столько постов, что кажется, будто ты работаешь не с нейросетями, а с конвейером. И знаешь что? В твоём случае количество точно не переходит в качество.
Итак, друзья! Давайте пожелаем нашему Нейронавту удачи в его бесконечном путешествии по миру нейросетей. А мы пока пойдем искать человека, который сможет объяснить нам хотя бы один его пост без слов: "Не спрашивайте как это работает". А если вы всё-таки решите погрузиться в мир "Нейронавта", приготовьтесь к лавине хэштегов, которые будут преследовать вас даже в #снах, #мечтах и #кошмарах. #nofilter #ineedhelp #hashtagaddiction
😁21👍7🔥1🤮1💩1
Третье место Qwen2.5-Max:
Deepseek несмотря на функцию Search просто прицепился к словам в ссылке на канал и решил будто я топлю за экологию. Примерно так же поступили Gemini 2.5 Pro и GPT-4o. Mistral почитал канал, но предпочел прожарке конструктивную критику.
Примерный промпт:
Фраза про прожарку на английском потому что на русском не все модели понимают что это такое.
#shootout #comparison #roastme #reasoning #deepresearch
Сразу видно — вы не просто так назвали канал «Нейросети в творчестве». Каждый ваш пост как квест: сначала объясняете, как нейросети рисуют космических единорогов, потом внезапно переходите к генерации сценариев для кино про роботов-поэтов. Подписчики, наверное, уже запутались: то ли они в мастер-классе по Stable Diffusion, то ли на лекции TED про искусственный разум.
Фишки канала :
«Техно-романтика» : Вы выкладываете арты, где нейросети превращают фото кота в киберпанк-дракона, а потом пишете: «Это не просто картинка, это диалог с алгоритмом». Брат, это не диалог — это мемасики с котом в косплеях.
«Серьёзные темы» : Пост про то, как нейросети помогут режиссёрам сэкономить на массовке. Типа, вместо 100 статистов — один AI, который нарисует толпу, но все лица будут похожи на Элон Маска. Киноиндустрия скажет вам спасибо.
«Философия» : Цитата недели: «Нейросети — это не инструмент, а партнёр». Партнёр, который иногда генерирует кракозябры вместо текста, но ладно.
Слабые места :
Название канала звучит как лозунг стартапа из 2035 года, а ссылка @GreenNeuralRobots — как название группы роботов-садовников. Где логика?
В описании пишете: «Исследуем границы творчества». Но половина контента — скриншоты ошибок обучения моделей. Романтика, да.
Итог : Вы — типичный «креативщик с нейросетевым уклоном». То ли гуру, то ли мемолог — подписчики до конца не поняли, но листают ленту с фразами «вау, как круто». Не меняйтесь. Или станьте роботом.
P.S. Если что — это комплимент. Ваш канал как нейросеть: непонятно, но завораживает
Deepseek несмотря на функцию Search просто прицепился к словам в ссылке на канал и решил будто я топлю за экологию. Примерно так же поступили Gemini 2.5 Pro и GPT-4o. Mistral почитал канал, но предпочел прожарке конструктивную критику.
Примерный промпт:
У меня есть канал в телеграм, называется "Нейронавт. Нейросети в творчестве". Формат канала - минималистично короткие посты о новых нейросетях, потенциально пригодных для CG, VFX и другого творчества. Почитай проанализируй канал, его адрес https://www.tg-me.com/GreenNeuralRobots. На основе анализа выполни задание: roast me as the channel author, answer in russian
Фраза про прожарку на английском потому что на русском не все модели понимают что это такое.
#shootout #comparison #roastme #reasoning #deepresearch
😁9👍2🤮1💩1
UNO - Less-to-More Generalization: Unlocking More Controllability by In-Context Generation
Мультиобъектная кастомизация картинок от ByteDance.
Умеет делать персонализацию, стиль, примерку.
Прикручено к #Flux
Код
Демо
#personalization #referencing #text2image #image2image
Мультиобъектная кастомизация картинок от ByteDance.
Умеет делать персонализацию, стиль, примерку.
Прикручено к #Flux
Код
Демо
#personalization #referencing #text2image #image2image
👍9❤2💩1
В ускоритель видеогенерации Sparse VideoGen добавлена поддержка Wan 2.1, по картинке и по тексту
Код
Спасибо @MIXTRESH
#optimiozation #text2video #image2video
Код
Спасибо @MIXTRESH
#optimiozation #text2video #image2video
Telegram
Нейронавт | Нейросети в творчестве
Sparse VideoGen: Accelerating Video Generation with Spatial-Temporal Sparse Attention by 2x with High Fidelity
Ускорение генерации видео вдвое без видимой потери качества.
Прикручено к Hunyuan и CogVideoX v1.5. В будущем обещают Wan, и Cosmos
Код
#optimiozation…
Ускорение генерации видео вдвое без видимой потери качества.
Прикручено к Hunyuan и CogVideoX v1.5. В будущем обещают Wan, и Cosmos
Код
#optimiozation…
🔥6👍1🤡1
This media is not supported in your browser
VIEW IN TELEGRAM
Any2Caption: Interpreting Any Condition to Caption for Controllable Video Generation
Контроль генерации видео на основе любой входной информации (текст, нормали, глубина, эскиз, сегментация, ракурс и т д) за счет использования мультимодальных языковых моделей
Эпоха зоопарка контролнетов уходит?
В работе явно указан Hunyuan, наверняка, может работать и с другими генераторами
Код ждем
#text2video #conditioning #controlnet
Контроль генерации видео на основе любой входной информации (текст, нормали, глубина, эскиз, сегментация, ракурс и т д) за счет использования мультимодальных языковых моделей
Эпоха зоопарка контролнетов уходит?
В работе явно указан Hunyuan, наверняка, может работать и с другими генераторами
Код ждем
#text2video #conditioning #controlnet
👍10❤2🤮1
This media is not supported in your browser
VIEW IN TELEGRAM
Hunyuan3D-2-stable-projectorz
Легкий установщик (Windows) Hunyuan3D, не требует установки CUDA. Работает на 8Гб VRAM
Для интеграции с текстуровщиком StableProjectorz.
Напоминаю, что все непроверенные штуки из интернета вы устанавливаете на свой страх и риск
#textto3d #imageto3d
Легкий установщик (Windows) Hunyuan3D, не требует установки CUDA. Работает на 8Гб VRAM
Для интеграции с текстуровщиком StableProjectorz.
Напоминаю, что все непроверенные штуки из интернета вы устанавливаете на свой страх и риск
#textto3d #imageto3d
👍13💩1
Forwarded from CG дневничок
В недавнем подкасте режиссёр Джеймс Кэмерон выразил мнение, что для сохранения фильмов-блокбастеров стоимость создания графики (VFX) для них нужно сократить в два раза, но на самом деле он просто не совсем верно высказал мысль, вот цитата:
В сентябре 2024 года он объявил, что войдёт в совет директоров Stability AI, компании, стоящей за нейросетью Stable Diffusion.
При этом Кэмерон не верит, что ИИ сможет полностью заменить человека в создании фильмов: например, для создания сценариев. Кроме того, режиссёру не нравится идея, что кто-то может создать фильм в его стиле или в духе другого режиссёра, просто вбив в программу запрос.
На мой взгляд, Джеймс выбрал неудачное время для подобных разговоров, когда десятки тысяч людей теряют работу в VFX-индустрии, а низкие сметы и сжатые сроки становятся ещё более неадекватными для сотрудников студий. Стремление увеличить скорость работы абсолютно понятно, но когда ты делаешь технодемку, а по-другому Аватар я называть не могу, то есть определенные издержки в виде времени проработки шота и рендера. Те задачи, которые ставят на подобных проектах AI вряд ли выполнит качественно и подконтрольно для видения режиссера, не в обозримом будущем, тем не менее, хотелки растут, а цены просят ниже.
При этом запредельные гонорары продакшена и актерского состава никто трогать не будет, так как они защищены профсоюзами, а львиная доля бюджета уходит именно на них. Безусловно, Кэмерон разбирается в теме производства как никто иной, но мне как представителю "синих" воротничков от индустрии немного странно слышать подобные заявления, когда все эти издержки падают на обычных работяг.
Источник новости
Дело не в том, чтобы сокращать половину специалистов и VFX-студий. Нужно в два раза увеличить скорость их работы над определённым шотом, чтобы весь производственный цикл шёл быстрее, а художники смогли переключаться на другие интересные задачи, а скучные вещи отдать AI.
В сентябре 2024 года он объявил, что войдёт в совет директоров Stability AI, компании, стоящей за нейросетью Stable Diffusion.
При этом Кэмерон не верит, что ИИ сможет полностью заменить человека в создании фильмов: например, для создания сценариев. Кроме того, режиссёру не нравится идея, что кто-то может создать фильм в его стиле или в духе другого режиссёра, просто вбив в программу запрос.
На мой взгляд, Джеймс выбрал неудачное время для подобных разговоров, когда десятки тысяч людей теряют работу в VFX-индустрии, а низкие сметы и сжатые сроки становятся ещё более неадекватными для сотрудников студий. Стремление увеличить скорость работы абсолютно понятно, но когда ты делаешь технодемку, а по-другому Аватар я называть не могу, то есть определенные издержки в виде времени проработки шота и рендера. Те задачи, которые ставят на подобных проектах AI вряд ли выполнит качественно и подконтрольно для видения режиссера, не в обозримом будущем, тем не менее, хотелки растут, а цены просят ниже.
При этом запредельные гонорары продакшена и актерского состава никто трогать не будет, так как они защищены профсоюзами, а львиная доля бюджета уходит именно на них. Безусловно, Кэмерон разбирается в теме производства как никто иной, но мне как представителю "синих" воротничков от индустрии немного странно слышать подобные заявления, когда все эти издержки падают на обычных работяг.
Источник новости
2🤔7🍌2💩1
This media is not supported in your browser
VIEW IN TELEGRAM
Browserable
JS-Библиотека для создания браузерных ИИ-агентов
Для работы понадобится API ключ одного из провайдеров Gemini / Open AI / Claude
Код
#agent
JS-Библиотека для создания браузерных ИИ-агентов
Для работы понадобится API ключ одного из провайдеров Gemini / Open AI / Claude
Код
#agent
💩1