Telegram Web Link
Камео в Сора 2

Тут Ваня Юницкий экспериментирует со сторителлингом в Sora 2 и делает сериал, где использует себя как камео в Sora 2. Получается хороший faceswap. А идея скормить в chatGPT Соровский гайд просто отличная. Как и другие хаки.

Как только появился Sora App – я немного поиграл с рандомным слопом, но быстро все снес и начал последовательную историю про то, как мой камео строит ракету из подручных материалов на заднем дворе дома, зовет своего друга (камео реального друга), и отправляется бороздить вселенную в поисках "42", ну и еще много чего.

Немного о процессе.

Сценарии (промпты).
Я сделал "project" в ChatGPT, дал ему базовые инструкции, например скормил ему
Соровский гайд, а также обозначил, что у модели нет памяти, и мы не пишем "интерьер, как в прошлом видео" и т.д. Всех моих персонажей он знает и правильно вставляет в промпт. Мне лишь остается надиктовывать голосм идею для следующего эпизода и вставлять в поле для генерации.

Генерация видео.
– Все внутри приложении Sora.
– Перед постингом я кликаю на промпт, удаляю и вставляю в описание "Chapter 1. Episode 10" и так далее. Это дополнительный крючок для рандомных зрителей из ленты.
– Заметил, что обычная 720 Sora выдает картинку, близкую к Sora Pro, если я добавляю это условие:

A realistic mockumentary filmed as a selfie-video on a smartphone, shot in a single take.

Вотермарки Sora убираю
тут.

Вообще, это стало для меня настоящим хобби, я одновременно создатель и зритель, так как заставляю себя не продумывать сценарий сильно вперед, безумно затягивает.

Это похоже на чувство, которое было в детстве, когда погружался в какую-нибудь классную игру на PS1. Думал, что такого уже никогда не будет.

Прикрепляю некоторые примеры эпизодов.
А тут следить за сериалом:
Sora, Inst, Tik-Tok, YouTube.

@cgevent
2632👍25🔥10👎1
Tiny Recursive Model (TRM)

Samsung придумал новую архитектуру рекурсивного мышления для построения языковых моделей, которая при размере всего 7М параметров (!!!) — оказалась круче DeepSeek-R1, Gemini 2.5 Pro и o3-mini в тестах на логику и мышление.

Работает так:

1. Делает первый черновой ответ.
2. Думает над ним внутри себя.
3. Проверяет и исправляет свои мысли.
4. Перерабатывает ответ, чтобы он был точнее.
5. Повторяет, пока не будет уверен в своем решении.

* Маленькая: всего 7 миллионов параметров, это в 10 000 раз меньше, чем у современных LLM
* Эффективная: работает лучше больших моделей, но требует меньше ресурсов.
* Логика важнее всего: TRM показывает, что хорошая архитектура важнее объема данных.
* Доступная: может работать на слабых устройствах, не нужны мощные сервера.

Неплохо, в следующем году будем пользоваться модельками уровня DeepSeek локально на телефоне?

Гитхаб
Препринт

#research #llm #TRM
🔥76👍159😱4👎3
Media is too big
VIEW IN TELEGRAM
Нейропрожарка

Свежая работа от Паши Нойза "DAY OF THE DAD". Очень советую пересмотреть в версии 4K (ссылка в конце). Помните его клип для Limp Bizkit?

Сюжет:
В мире, где День отца — это дата трагедии, выживший "Король Свалки" отмечает ее кровавым ритуалом мести. Его миссия: прорваться сквозь орду мертвецов, чтобы найти новый подарок для своей погибшей дочери, тем самым сохраняя последнюю, самую важную традицию. Это ультра-насилие, ведомое глубочайшей сентиментальностью.

2. Краткая Идея и Философия

Это ultra-trash-хоррор-боевик в стиле B-movie 80-х, который служит пилотом для моей будущей франшизы THE DEAD RUST.
В отличие от современных, бегущих Зомби фильмов и одинаковых серых зомби, мне нравятся Зомби эстетика 1980s с их индивидуальностью и кино эстетикой .
И я намеренно воскресил философию Джорджа А. Ромеро—зомби должны быть уникальными, медленными и нести свою прошлую "идентичность”(Зомби моряк или пассажир в такси). Поэтому я воссоздал эстетику таких фильмов как - “День Мертвецов” или “Ночь живых мертвецов”

3. Детали Производства и Бюджет


Flux
1.dev Finetuned и собственный пайплайн для лица главного героя
Midjourney и собственный Moodboard для генерация основной стилистики
Omni Reference для создания консистентых сцен с главным героем
Kling AI - основной генератор
Minimax Fast для Кровавых сцен (хорошо проводит цензуру)
Higgsfield AI & Wan 2.5 для специальных сцен (взрывы)
SeeDance - для Close Up в основном (хороший кино тон у картинки)
Nano Banao & Seedream - для Создания дополнительных кадров и редактуры
Suno v5 - музыка
ElevenLabs = Закадровый голос.
Final Cut Pro был использован для ручного монтажа и SFX (созданных мной).
Topaz Labs использовался для Upscale в 4K
Бюджет и Время: Общая сумма прямых затрат составила всего около 50$ Внебюджетные расходы (CPP): Topaz Labs и Higgsfield AI использовались на условиях партнерских программ и не вошли в прямые расходы.

4. Личное Заявление
Моя цель — доказать, что AI-кино — это мастерство управления эстетикой, а не случайная генерация. Весь проект был задуман и исполнен за 5-дневный спринт.
Этим проектом я бы хотел показать что : AI — это кисть или инструмент. В правильных руках он может воскресить утраченную эстетику (Джорджа Ромеро) и решить ключевые проблемы консистентности благодаря собственным техническим наработкам.

P.S Если есть вопросы спрашивайте отвечу в комментариях или лично.

Смотреть в 4K -
https://youtu.be/fKL1gh4i1Cs

@cgevent
1🔥90👍23👎208
Диму знаю лично, часто встречаемся на кипрских вечерних посиделках, плюс я выступал у него в клубе GROW.

И да, у Димы тоже есть канал - это нескучный дневник опытного действующего предпринимателя. Рефлексия, управление людьми, подходы к маркетингу и разработке продукта в стартапе, факапы, вакансии и развитие международного AI-стартапа в реальном времени без утаивания «неудобных» деталей. Канал легко читается, написано доступным языком без заумных слов. Каждый пост дает пищу для размышлений, расширяет картину мира, либо просто веселит)

Димон вырос на компьютерных играх. Первые деньги заработал, прокачав рейтинг в игре World of Warcraft известному хоккеисту из Перми.
Продавал виртуальных коней члену королевской семьи Дубая.
Ну вы поняли.. жесткая практика и минимум теории:
- Сделал exit с проектом LF.Group - инструменты для игровых комьюнити. Продан корпорации Xsolla;
- Со-основатель Overgear - маркетплейса для геймеров, одного из крупнейших провайдеров услуг и валют в виртуальных мирах;
- Со-основатель проекта, связанного со скинами Counter-Strike (NDA). Более 5 млн пользователей в месяц

Креаторы увидят изнанку развития сервиса для креаторов. Станут первыми пользователями, смогут давать обратную связь в реальном времени.

Стартап-индустрия (стартаперы, венчурные инвесторы) узнают «своих», следить за развитием подобных продуктов очень полезно для вдохновения и поиска инсайтов.

Хорошие прмеры:
https://www.tg-me.com/dimabeseda/86 - метровый плюшевый член как финальный тест на совместимость по ценностям перед наймом

https://www.tg-me.com/dimabeseda/88 - почему считать «выручку на человека» это полная глупость

https://www.tg-me.com/dimabeseda/92 - огромная разница между образом мышления компаний из СНГ и США, из-за которой управленцы проваливают отношения с подчиненными

Люто плюсую за канал Димы, подписывайтесь.

@cgevent
👎34👍94🔥3😱1
Оказывается на сайте Академии OpenAI есть здоровый набор "Промпт Паков".

Так и называются - Prompt Packs

Есть Паки для:
for sales
for product
for IT(!?)
for HR
for engeneers(!?)
for managers
for executives (для топов)

И там их прям много, для каждой категории разобраны разные кейсы.

Забирайте тут:
https://academy.openai.com/public/tags/prompt-packs-6849a0f98c613939acef841c

@cgevent
1👍4113🔥8👎1
Media is too big
VIEW IN TELEGRAM
Рендер или видео?

Я совершенно залип на этом Figure 03. Там чем дальше, тем больше киберпанка.

При этом они говорят про серийное производство таких тварей. 12 000 в год!

Берём?

https://www.figure.ai/news/introducing-figure-03

@cgevent
44👍17🔥7😱3
This media is not supported in your browser
VIEW IN TELEGRAM
Гагарт: Гага-актеры и Гага-ававтары.

Держите китайскую Хедру - GAGA.ART - озвучиватель портретов по фотке и входному тексту\аудио.

Попробовал, потому что дают 200 бесплатных кредитов.

Если честно, выглядит, как китайская под(д)елка: длительность видео 10 секунд (у Хедры минуты), кариес с зубами, статичная камера, ну и в целом так себе интерфейс.

Из плюсов, есть бесплатная генерилка картинок и за Gaga Actor с меня даже кредиты не списали.
Илон Маск сделан именно так.

В Gaga Avatar уже можно присовывать аудио, а не только текст.

Авторы настаивают, что они делают липсинк С УЧЕТОМ эмоций через микродвижения, что бы это не значило.

Попробуйте, может вам зайдет, логин гуглом.

https://gaga.art/

@cgevent
1🔥12😁8👍53
Нашел картинку, хорошо иллюстрирующую, почему не надо покупать видеокарты домой.

На картинке с точками, показано, что требования к железу в области ИИ растут в 4.5 раз в год.
А если взять оптимистическую трактовку закона Мура, то эффективность чипов растет в 2 раза в год (или за полтора года). И тут еще не говорится про объем памяти на чипах.

Как я и писал, требования к железу стали сильно превосходить возможности железа, которое может себе позволить новый нормальный пользователь.

Вторая картинка: затраты на построение дата-центров в этом году (в Штатах) вплотную приблизились к затратам на построение новых офисных зданий. Прекрасно, я считаю. Можно выпить за белых и синих воротничков.

@cgevent
1👍336😱4👎1🔥1
Vivix, the World's first Real-time Long Video Model

Звучит как кликбейт, но они действительно генерят пятисекундный видос за три секунды. Но есть моменты.

Реальный кликбейт тут: Vivix Turbo — создавайте видеоролики длиной до 1 минуты менее, чем за 3 секунды, с 9 вариантами сразу.

9 вариантов вам предложат только на платном тарифе.

Но на бесплатных генерациях (а мне насыпали сразу 260 кредитов и одна генерация - 10 кредитов), он работает как обещано - за три секунды генерит одно видео в 5 секунд.

Дальше начинаются игрищща - он пишет на видео длительность в 15 или даже в 50 секунд, и после того, как вы кликаете на видео, начинает его долго генерить (я не дождался).

Качество приподшакальное, 512р.

Но Вилл Смит втянул макаронину как положено.

Умеет только в image2video.

Наверное в таком случае проще использовать Grok Imagine

https://vivix.ai/labs/turbo

@cgevent
👍17😁32
The Best Inventions of 2025

Лучшие инновации и изобретения по версии Times.

Невозможно пересказать или суммаризировать, там слишком много всего - и оно ВСЕ интересное.
Полистайте, очень рекомендую, люди делают удивительные вещи в дизайне, робототехнике, ИИ и даже сельском хозяйстве.
От фенов до дронов.

Выделю лишь Huawei Pura 80 Ultra с непобиваемой камерой.

https://time.com/collections/best-inventions-2025/

@cgevent
1🔥206👍2😁2👎1
Media is too big
VIEW IN TELEGRAM
Нейропрожарка

Клип “Маяк” - сольный проект TONEVA Ирины Тоневой (Toneva) by Оля Шарю за нейронки

Видео на You Tube

У Иры с самого начала было чёткое видение клипа:
1. Сюжет - показать состояние вне времени, когда прошлое и будущее теряют смысл. Не нужно бежать, прятаться или вспоминать - важно просто быть “здесь и сейчас”
2. Цвет —-мягкая, светлая палитра
3. Монтаж - плавный, без резких смен кадров и эффектов

До этого я уже делала сниппет на эту песню - тогда работала с LoRa (Flux)
@Krea, и именно она снова спасла проект

Для клипа я протестировала всё, что только можно:

- Omni ref @ Midjourney

- Character @ Higgsfield

- Character @ Ideogram

- LoRa (Krea 1)

Но нужную стабильность персонажа, гамму и скорость работы дала только LoRa (Flux) - как и раньше

Для плавного монтажа часто использовала морфинг, отсюда пошли небольшие сложности на монтаже. Делала стоп кадр анимации, анимировала его, и снова стоп кадр уже с анимированного первого сто-кадра. В итоге первый кадр и последний из этой цепочки сильно отличались как по высоте, так и по ширине, и для бесшовного монтажа приходилось долго подбирать нужное увеличение масштаба, а в некоторых случаях и расположение кадра по оси X и Y

Клип был сдан за день до релиза Kling 2.5, поэтому сцены с бегом дались непросто 😅 - тут очень выручила Seedance

И всё это - в условиях жёсткого дедлайна: нужно было успеть к неожиданному выступлению Иры на ВДНХ.
Анимация, монтаж, цветокор и апскейл - всё за 4 дня

В ночь сдачи перестал работать Edit @ Midjourney, а нужно было добавить маяк и росток в последний кадр.
Ни Nano Banana, ни Seedream не справились - помогла только связка генеративной заливки Photoshop + Nano Banana

Итог:
Клиент доволен
Клип уже рассматривают для ротации музыкальные паблики и каналы


@cgevent
👎6823👍16🔥7
This media is not supported in your browser
VIEW IN TELEGRAM
Это вам за то, что не молитесь...
1😁106🔥2610👎5👍4😱2🙏1
Prompt: Generate an SVG of an Xbox 360 controller

@cgevent
😁74😱205🔥5👍4
This media is not supported in your browser
VIEW IN TELEGRAM
DreamOmni2: Multimodal Instruction-based Editing and Generation''

Вы будете смеяцца, но у нас ещё одна Нанабанана. Или скорее Qwen Edit, ибо опенсорс.

То есть генеративная и редактирующая мультимодальная модель для картинок. От Байтденсика.

Есть все. И код, и демо, и папирус, и страница проекта.

Все это вы найдете тут:
https://github.com/dvlab-research/DreamOmni2

Картинки и сравнения с Бананой, Контекстом, Квеном, GptImage 1 и даже с ОмниГеном тут:
https://pbihao.github.io/projects/DreamOmni2/index.html

Го тестировать в демо и локально, пишите в коменты, я до понедельника вдетоксе.

@cgevent
🔥37👍132👎2
Media is too big
VIEW IN TELEGRAM
Хотел написать "держите новый опенсорсный 3Д-генератор", но нет.

Во-первых, он не такой уж новый, статья вышла в июле, а сейчас появился код на гитхабе.
Во-вторых, это не самостоятельный 3Д-генератор, а нашлепка над TRELLIS, со всеми вытекающими.
Ну и маленькая деталь: код есть, но ссылка на веса не работает.

Идея в том, чтобы по входной картинке генерить не всю модель целиком, а сначала генерятся консистентные 2Д-маски для различный частей модели, потом для частей генерятся баундинг боксы, а уже по размерам этих боксов генерятся 3Д-модели, как отдельные части.

На картинках у них мелькает Geometry Processing и правильные отретопленные сетки, но подозреваю, что это фотошоп.

https://omnipart.github.io/
https://github.com/HKU-MMLab/OmniPart

@cgevent
9👍3😱2😁1
Ну, за драматургов!

Королевская опера Версальского дворца в 2026 году представит спектакль по пьесе, написанной искусственным интеллектом. Она будет создана в стиле французского драматурга Мольера.

Пьеса «Астролог, или Ложные предсказания» находится на стадии написания. Взяли Mistal и ну учить его на пьесах Мольера. Премьера ожидается 5 и 6 мая 2026 года.

@cgevent
👍27👎14😁127😱3🔥2
Segment Anything 3 тихо появился на ICLR в виде статьи

Первая версия SAM позволяла щелкнуть по объекту, чтобы сегментировать его.
В SAM 2 были добавлены видео и память.
Теперь SAM 3 говорит: просто опишите, что вы хотите - «желтый школьный автобус», «полосатый кот», «красное яблоко» — и он найдет и сегментирует каждый экземпляр этого объекта на изображениях или в видео.

Это как будто сегментация наконец-то научилась языку, но в обоснованной, минимальной форме, просто оперируя концепциями.
Короткие существительные, образцы изображений или и то, и другое.
Вы озвучиваете объект, он понимает, что вы имеете в виду, и рисует границу везде, где она появляется.

За этим стоит огромный механизм обработки данных: 4 миллиона уникальных концепций, 52 миллиона проверенных масок, созданных людьми и LLM, проверяющими работу друг друга.

Результат: примерно в 2 раза лучше, чем SAM 2, распознавание, близкое к человеческому, на тестах с открытым словарем и скорость в реальном времени.

https://openreview.net/forum?id=r35clVtGzw

@cgevent
👍49🔥215
This media is not supported in your browser
VIEW IN TELEGRAM
Mesh2Motion

Принес вам опенсорный вариант Mixamo: риг и анимация в браузере.

Загружаете свою 3Д-модель в Mesh2Motion, дальше работает авториг с возможностью редактирования, можно также навалить свою анимацию и потом экспортнуть в любой 3Д-пакет через GLB/GLTF.

Сайт: https://mesh2motion.org/
Демо: https://app.mesh2motion.org/
Код: https://github.com/scottpetrovic/mesh2motion-app

@cgevent
🔥27👍84😱2👎1
2025/10/24 06:52:03
Back to Top
HTML Embed Code: