Telegram Web Link
Media is too big
VIEW IN TELEGRAM
Нейропрожарка

Автор: Сергей Васильев

🎯 Цель ролика: вызвать эмоции у 30+ летних ветеранов Battlefield 1-4 частей и вспомнить легендарный ролик с прыжком из самолета. Просто поджемить.

⏱️ Срок: половина воскресенья, креативный порыв - примерно 8-10 часов работы

💡 Как всё началось: Знакомые с Battlefield 3 наверняка помнят ролик с противостоянием двух истребителей и эпическим прыжком пилота с гранатометом. 18 млн просмотров, кстати - https://www.youtube.com/watch?v=FOaGhE_sejI. Этот видос даже стал неофициальным трейлером следующей части игры. Так вот, ударило мне в голову сделать что-то похожее, только с помощью подручного арсенала нейронок. Честно говоря, думал всё это дело закончится на паре неудачных генераций, а потом появился какой-то челлендж с разбором того, как нейронки вообще понимают самолёты и траектории полётов (спойлер - тяжело). И вот я здесь.

🎵 Саундтрек: Masters of War (Sebbu's Edited Version) - Battlefield 6 trailer song (Bob Dylan)

🔧 Инструменты:
• Midjourney - создание статичных кадров
• Banana - обработка изображений
• Wan 2.2 I2V, FLF2V- основной движок для анимации
• Veo 3 - дополнительные генерации (с переменным успехом)
• Topaz Video AI - интерполяция кадров
• SeedVR - апскейлер
• DaVinci Resolve - монтаж и финальная обработка

💰 Всё в рамках оплаченных тарифов и имеющегося сервака А100 для Wan, “условно” бесплатно, кроме пяти генераций на Veo.

🎬 Особенности работы:
Всё достаточно просто: связка Midjourney и Banana позволила сделать статику, по визуалу - Wan и частично Midjourney-видео и Veo 3. Сам по себе в композицию у меня не так много опыта, я больше технарь, но вроде получилось неплохо.

⚡️ Технические челленджи:
Датасета из битвы истребителей я так понял не существует, и получить нормальный полёт с корректной траекторией - это надо постараться, и та ещё задачка. Лучше всего летает Wan, 2 удачных шота выдала MJ, а вот Veo что-то ну совсем не туда. Очень интересно узнать, много ли вообще подобного опыта сложных траекторий необычной техники есть у других ребят? А еще заставить корректно отобразить гранатомент и выстрелить в самолет тоже пришлось попотеть.

Итог: захотелось прыгнуть с парашютом. Жду релиз BF6.

@cgevent
👎58🔥32😁14👍76
Google выкатил конкурента Open AI Operator для управления компьютером.

А точнее, для взаимодействия с программами и их интерфейсами.

Gemini 2.5 Computer Use основана на базе Gemini 2.5 Pro и лучший способ понять(если вы не гик), что она делает, это прошуровать сюда и задать какой-нибудь вопрос типа "What is MAU for chatGPT?"
https://gemini.browserbase.com/

Дальше вы увидите, как модель запускает в песочнице браузер, лезет в гугл и орудует с результатами. А вы сидите и смотрите, как она неистово кликает мышкой и анализирует результат.

Также для понимания полезно открыть список вызовов, в которые она умеет:
https://ai.google.dev/gemini-api/docs/computer-use?hl=ru#supported-actions

И там почитать про открытие браузера, наведение мышки, поиск и тд.

Совсем грубо говоря, это Autohotkeys или Selenium на стероидах Gemini.
Для ленивых, но любопытных есть видео:
https://www.youtube.com/watch?v=_lu-FcPUIfM

Пишете запрос: агент уходит решать задачу, вооружившись мышкой, клавиатурой, таймером и приложениями для поиска ответа.

По бенчмаркам от гугла, конечно, она побивает конкурентов и прочих подобных агентов.

Для разработчиков доступна через Gemini API in Google AI Studio и Vertex AI.

Остальные играются по первой ссылке.

@cgevent
👍2110🔥2
This media is not supported in your browser
VIEW IN TELEGRAM
StreamDiffusionV2: An Open-Source Streaming System for Real-Time Interactive Video Generation


StreamDiffusion обновился до версии 2. Это реалтаймовое решение video2video, в котором разработчики утверждают, что снизили родовое кипение и фликеринг диффузионных видео до приемлемого компромисса между скоростью (это на минуточку реалтайм) и качеством (кипение еще есть).

Для всяких стримов, влоггеров и ютюберов может быть прикольной находкой - scalable across diverse GPU setups, supporting flexible denoising steps, and delivering high FPS for creators and platforms.

Тем более, что код есть:
https://github.com/chenfengxu714/StreamDiffusionV2

Страница проекта:
https://streamdiffusionv2.github.io/

Еще раз, это не просто video2video, это стриминг в реальном времени. В прошлой жизни это называлось Performance Animation.

@cgevent
🔥146👍6
Питонг обновился до Пи.

As of Python 3.14, the free-threaded (or no-GIL) version of the Python interpreter is no longer considered experimental.

Template strings (t-strings)
🚀 Free-threaded Python officially supported
🎨 Syntax highlighting in the REPL
📦 Zstandard compression in stdlib
🔍 Remote PDB debugging

Полный список фич тут:
https://docs.python.org/3.14/whatsnew/3.14.html

Забавно, что многие репозитарии для генераторов картинок и видео до сих пор требуют Питонг версии 3.10.

@cgevent
👍13😁75😱3🔥2
This media is not supported in your browser
VIEW IN TELEGRAM
Тяжелая легкая атлетика в Сора.

Что там писали про понимание физики?

Но залипательно невыносимо. Реальный brainrot.

@cgevent
😁174🔥238👍5
Forwarded from Neural Shit
Давным давно было замечено, что видеогенераторы весело лажают если попросить их сгенерировать видео с человеком вверх ногами, а после перевернуть это видео на 180 градусов.

Новая сора тоже этим болеет
😁1187🔥4👍2
Veo3.1

Утечки из твитторa от 8 октября 2025 года указывают на грядущее обновление Veo 3.1 для модели генерации видео от Google, замеченное в списке ожидания Higgsfield AI и во внутренних кодовых базах, таких как Vertex AI. Предполагаемые улучшения включают в себя улучшенную согласованность персонажей, продолжительность роликов до одной минуты, конструкторы сцен и кинематографические пресеты. ИИ-сообщество рассматривает их как шаги, призванные бросить вызов Sora от OpenAI, хотя Google не предоставила официального подтверждения.

@cgevent
🔥3110👍7👎2
Veo 3.1
😱64🔥285👍3👎2
Media is too big
VIEW IN TELEGRAM
В HeyGen встроили Sora 2

В отличие от многих других агрегаторов они сделали попытку встроить ее как один из элементов ковейера.
Можно просто генерить B-rolls как ассеты внутри HeyGen, которыми потом разбавлять говорящие головы

B-roll - это дополнительный видеоматериал, который дополняет основной материал (A-roll).
Проще говоря, это вставочные кадры, которые помогают сделать видео более живым, динамичным и понятным.

Но есть и режим видеоагента HeyGen с галочкой Sora2: просто пишете промпт, а HeyGen агент генерит и головы, и видосы в Соре, и монтирует все это в один видос.

Интересный пример интеграции, выходящий за рамки "а у нас можно сорой генерить видосы".

@cgevent
16🔥12👍3
Forwarded from mimagie
Media is too big
VIEW IN TELEGRAM
Prompt: LIVE‑ACTION PHOTOREAL CINEMA. NOT animation, NOT storyboard, NOT illustration.
One continuous shot, single take. DO NOT CUT. 24 fps, natural motion blur (180° shutter look).
Camera: gimbal dolly backward at constant speed; slight handheld micro‑jitter under 1.5%.
Framing: MEDIUM SHOT chest‑up; subject stays center‑weighted and same scale for all 12 s.
Lens & DOF: spherical 28–35 mm equivalent; shallow depth of field; eyes tack‑sharp, background softly defocused with natural round bokeh and mild vignetting.
Lighting & grade: natural daylight, soft top‑light through tree leaves; filmic highlight roll‑off; neutral‑warm skin tones; subtle film grain; no toon/line art/text overlays.

Concept: show nearly a year of routine in a single unbroken walk from his front door to the trash can. The background evolves as if time advances day by day (seasons, weather, decorations), but feels like real live‑action environmental changes behind him. The man walks toward camera at a steady pace; the camera glides backwards keeping him framed identically.

Subject identity (lock it): one consistent man, late‑20s/early‑30s, short ginger hair, light freckles, small hoop earring, gold chain, denim jacket over neutral tee. Preserve his face and body continuity across the full shot.

Recurring neighbors (keep them consistent whenever they appear in the background):
• Attractive female neighbor, 30s, short dark hair, pink T‑shirt with yoga mat; friendly glance.
• Smug office manager, 40s, cheap suit with lanyard; slightly antagonistic.

Continuity rules for BIG events:
• Wardrobe special: from 2.6–4.6 s he wears a BLUE Adidas‑style tracksuit (with stripes). Keep this outfit continuous during that window only; then revert to baseline denim afterwards.
• Hair change: abrupt change at ~4.9 s (either bright blue dye OR close buzz cut). After that moment, hair gradually grows back over time; keep the chosen path consistent.
• Black eye: appears suddenly at ~7.6 s; then fades out gradually and completely from 7.6–8.6 s.

Background evolution notes (realistic, not cartoon): every few frames the environment behind him shifts as if to new days—trees with and without leaves, sun → overcast → rain → wind → light snow, holiday lights, umbrellas, scattered puddles—while the sidewalk and “route to the trash can” remain semantically the same. Use physically‑plausible parallax and weather FX; do not change his scale or camera move.

Beat plan over 12 s:
• 0.0–2.4 Establish the walk; subtle leaf shimmer, late‑summer sun; neighbors may appear far back.
• 2.4–4.8 He continues; from 2.6–4.6 s hold the BLUE tracksuit while backgrounds keep advancing through different days.
• 4.8–7.2 Abrupt HAIR CHANGE at ~4.9 s; from there hair slowly regrows. Show a quick “hungover morning” read in his eyes without breaking pace.
• 7.2–9.6 BLACK EYE appears at ~7.6 s and fades 7.6–8.6 s while snow/wind/rain moments pass; smug manager cameo in background walkway.
• 9.6–12.0 Approach the trash can. At 11.6 s he tosses the bag and MISSES by a few inches. Hold his deadpan reaction to 12.0 s.

Audio (generate with video): one continuous RISING SUSPENSE bed across 0.0–12.0 s (no melody), plus subtle diegetic ambience that matches weather (soft rain patter, wind rustle, footfalls), mixed under the bed. No final sting; let the anticlimax land dry at 11.6–12.0 s.

Hard constraints: NO CUTS. NO timelapse. NO speed ramping. NO freeze‑frames. Preserve subject identity and both neighbor identities. Keep subject scale/position constant; keep camera move perfectly continuous.
Forbidden styles: animation, 2D/3D toon shading, sketch lines, low‑poly, comic, posterization.
47🔥13😁4👍3👎1🙏1
This media is not supported in your browser
VIEW IN TELEGRAM
Grok Imagine 0.9

Надо повнимательнее приглядеться к нему: сколько вилов смитов дадим?

Мне кажется уже тянет на девяточку.

Я зашел на https://grok.com/imagine/
Регнулся твиттором (можно гуглом или эппле) и получил довольно интересный опыт.
Если пишешь просто промпт, он генерит Бесконечную(!) ленту картинок по твоему промпту.
Ибо он пока не умеет в text2video.
Потом выбираешь (или загружаешь) картинку и он ея оживляет в видео.

Но есть лайфхак, если ему на вход подать чорную картинку и свой промпт, то получится text2video.

Есть липсинк, есть озвучка эффектов, подкладка музики.

Довольно развеселый продукт.

Также есть аппы для айфона и андроида.

@cgevent
👍33🔥98
This media is not supported in your browser
VIEW IN TELEGRAM
Grok Imagine 0.9 Desktop

Забавно за липсинк: поглядите как акула и белочь синхронно, но по-своему, открывают пасти.

Беда обобщенного липсинка, что он наваливается на все губы и пасти, которые видит в кадре.

@cgevent
👍16😁5🔥21
Камео в Сора 2

Тут Ваня Юницкий экспериментирует со сторителлингом в Sora 2 и делает сериал, где использует себя как камео в Sora 2. Получается хороший faceswap. А идея скормить в chatGPT Соровский гайд просто отличная. Как и другие хаки.

Как только появился Sora App – я немного поиграл с рандомным слопом, но быстро все снес и начал последовательную историю про то, как мой камео строит ракету из подручных материалов на заднем дворе дома, зовет своего друга (камео реального друга), и отправляется бороздить вселенную в поисках "42", ну и еще много чего.

Немного о процессе.

Сценарии (промпты).
Я сделал "project" в ChatGPT, дал ему базовые инструкции, например скормил ему
Соровский гайд, а также обозначил, что у модели нет памяти, и мы не пишем "интерьер, как в прошлом видео" и т.д. Всех моих персонажей он знает и правильно вставляет в промпт. Мне лишь остается надиктовывать голосм идею для следующего эпизода и вставлять в поле для генерации.

Генерация видео.
– Все внутри приложении Sora.
– Перед постингом я кликаю на промпт, удаляю и вставляю в описание "Chapter 1. Episode 10" и так далее. Это дополнительный крючок для рандомных зрителей из ленты.
– Заметил, что обычная 720 Sora выдает картинку, близкую к Sora Pro, если я добавляю это условие:

A realistic mockumentary filmed as a selfie-video on a smartphone, shot in a single take.

Вотермарки Sora убираю
тут.

Вообще, это стало для меня настоящим хобби, я одновременно создатель и зритель, так как заставляю себя не продумывать сценарий сильно вперед, безумно затягивает.

Это похоже на чувство, которое было в детстве, когда погружался в какую-нибудь классную игру на PS1. Думал, что такого уже никогда не будет.

Прикрепляю некоторые примеры эпизодов.
А тут следить за сериалом:
Sora, Inst, Tik-Tok, YouTube.

@cgevent
2632👍25🔥10👎1
Tiny Recursive Model (TRM)

Samsung придумал новую архитектуру рекурсивного мышления для построения языковых моделей, которая при размере всего 7М параметров (!!!) — оказалась круче DeepSeek-R1, Gemini 2.5 Pro и o3-mini в тестах на логику и мышление.

Работает так:

1. Делает первый черновой ответ.
2. Думает над ним внутри себя.
3. Проверяет и исправляет свои мысли.
4. Перерабатывает ответ, чтобы он был точнее.
5. Повторяет, пока не будет уверен в своем решении.

* Маленькая: всего 7 миллионов параметров, это в 10 000 раз меньше, чем у современных LLM
* Эффективная: работает лучше больших моделей, но требует меньше ресурсов.
* Логика важнее всего: TRM показывает, что хорошая архитектура важнее объема данных.
* Доступная: может работать на слабых устройствах, не нужны мощные сервера.

Неплохо, в следующем году будем пользоваться модельками уровня DeepSeek локально на телефоне?

Гитхаб
Препринт

#research #llm #TRM
🔥76👍159😱4👎3
Media is too big
VIEW IN TELEGRAM
Нейропрожарка

Свежая работа от Паши Нойза "DAY OF THE DAD". Очень советую пересмотреть в версии 4K (ссылка в конце). Помните его клип для Limp Bizkit?

Сюжет:
В мире, где День отца — это дата трагедии, выживший "Король Свалки" отмечает ее кровавым ритуалом мести. Его миссия: прорваться сквозь орду мертвецов, чтобы найти новый подарок для своей погибшей дочери, тем самым сохраняя последнюю, самую важную традицию. Это ультра-насилие, ведомое глубочайшей сентиментальностью.

2. Краткая Идея и Философия

Это ultra-trash-хоррор-боевик в стиле B-movie 80-х, который служит пилотом для моей будущей франшизы THE DEAD RUST.
В отличие от современных, бегущих Зомби фильмов и одинаковых серых зомби, мне нравятся Зомби эстетика 1980s с их индивидуальностью и кино эстетикой .
И я намеренно воскресил философию Джорджа А. Ромеро—зомби должны быть уникальными, медленными и нести свою прошлую "идентичность”(Зомби моряк или пассажир в такси). Поэтому я воссоздал эстетику таких фильмов как - “День Мертвецов” или “Ночь живых мертвецов”

3. Детали Производства и Бюджет


Flux
1.dev Finetuned и собственный пайплайн для лица главного героя
Midjourney и собственный Moodboard для генерация основной стилистики
Omni Reference для создания консистентых сцен с главным героем
Kling AI - основной генератор
Minimax Fast для Кровавых сцен (хорошо проводит цензуру)
Higgsfield AI & Wan 2.5 для специальных сцен (взрывы)
SeeDance - для Close Up в основном (хороший кино тон у картинки)
Nano Banao & Seedream - для Создания дополнительных кадров и редактуры
Suno v5 - музыка
ElevenLabs = Закадровый голос.
Final Cut Pro был использован для ручного монтажа и SFX (созданных мной).
Topaz Labs использовался для Upscale в 4K
Бюджет и Время: Общая сумма прямых затрат составила всего около 50$ Внебюджетные расходы (CPP): Topaz Labs и Higgsfield AI использовались на условиях партнерских программ и не вошли в прямые расходы.

4. Личное Заявление
Моя цель — доказать, что AI-кино — это мастерство управления эстетикой, а не случайная генерация. Весь проект был задуман и исполнен за 5-дневный спринт.
Этим проектом я бы хотел показать что : AI — это кисть или инструмент. В правильных руках он может воскресить утраченную эстетику (Джорджа Ромеро) и решить ключевые проблемы консистентности благодаря собственным техническим наработкам.

P.S Если есть вопросы спрашивайте отвечу в комментариях или лично.

Смотреть в 4K -
https://youtu.be/fKL1gh4i1Cs

@cgevent
1🔥91👍23👎208
Диму знаю лично, часто встречаемся на кипрских вечерних посиделках, плюс я выступал у него в клубе GROW.

И да, у Димы тоже есть канал - это нескучный дневник опытного действующего предпринимателя. Рефлексия, управление людьми, подходы к маркетингу и разработке продукта в стартапе, факапы, вакансии и развитие международного AI-стартапа в реальном времени без утаивания «неудобных» деталей. Канал легко читается, написано доступным языком без заумных слов. Каждый пост дает пищу для размышлений, расширяет картину мира, либо просто веселит)

Димон вырос на компьютерных играх. Первые деньги заработал, прокачав рейтинг в игре World of Warcraft известному хоккеисту из Перми.
Продавал виртуальных коней члену королевской семьи Дубая.
Ну вы поняли.. жесткая практика и минимум теории:
- Сделал exit с проектом LF.Group - инструменты для игровых комьюнити. Продан корпорации Xsolla;
- Со-основатель Overgear - маркетплейса для геймеров, одного из крупнейших провайдеров услуг и валют в виртуальных мирах;
- Со-основатель проекта, связанного со скинами Counter-Strike (NDA). Более 5 млн пользователей в месяц

Креаторы увидят изнанку развития сервиса для креаторов. Станут первыми пользователями, смогут давать обратную связь в реальном времени.

Стартап-индустрия (стартаперы, венчурные инвесторы) узнают «своих», следить за развитием подобных продуктов очень полезно для вдохновения и поиска инсайтов.

Хорошие прмеры:
https://www.tg-me.com/dimabeseda/86 - метровый плюшевый член как финальный тест на совместимость по ценностям перед наймом

https://www.tg-me.com/dimabeseda/88 - почему считать «выручку на человека» это полная глупость

https://www.tg-me.com/dimabeseda/92 - огромная разница между образом мышления компаний из СНГ и США, из-за которой управленцы проваливают отношения с подчиненными

Люто плюсую за канал Димы, подписывайтесь.

@cgevent
👎34👍94🔥3😱1
Оказывается на сайте Академии OpenAI есть здоровый набор "Промпт Паков".

Так и называются - Prompt Packs

Есть Паки для:
for sales
for product
for IT(!?)
for HR
for engeneers(!?)
for managers
for executives (для топов)

И там их прям много, для каждой категории разобраны разные кейсы.

Забирайте тут:
https://academy.openai.com/public/tags/prompt-packs-6849a0f98c613939acef841c

@cgevent
1👍4113🔥8👎1
Media is too big
VIEW IN TELEGRAM
Рендер или видео?

Я совершенно залип на этом Figure 03. Там чем дальше, тем больше киберпанка.

При этом они говорят про серийное производство таких тварей. 12 000 в год!

Берём?

https://www.figure.ai/news/introducing-figure-03

@cgevent
44👍17🔥7😱3
2025/10/25 19:34:16
Back to Top
HTML Embed Code: