Telegram Web Link
Forwarded from Psy Eyes
Замена персонажа в существующем видео с сохранением липсинка и освещения.

Локально на 5090 в Comfy с помощью Wan Animate. На первое видео разрешением 1024х576 в 4 шага ушёл 1 час, на второе 35 мин.

А Sora так может?

Твит
Давным давно было замечено, что видеогенераторы весело лажают если попросить их сгенерировать видео с человеком вверх ногами, а после перевернуть это видео на 180 градусов.

Новая сора тоже этим болеет
Да
Forwarded from Адовый UX
Нейросети научились рисовать пальцы. Но есть нюанс
This media is not supported in your browser
VIEW IN TELEGRAM
Чот аж в голосину порвался с этой олимпиады
😡😡😡
Я не буду объяснять, как к этому пришёл, но кому-то наверняка пригодится
This media is not supported in your browser
VIEW IN TELEGRAM
Китайцы используют робо-собак по максимуму.

Просто посмотрите насколько счастливы дети

видео отсюда
Интересная статья от Google, MIT и Гарварда: TUMIX: Multi-Agent Test-Time Scaling with Tool-Use Mixture.

Краткая суть: современные модели (ChatGPT Agent, Gemini-Pro и т.д.) умеют подключать интерпретатор кода и поиск в интернете, но не существует чётких правил, когда и как использовать тот или иной инструмент.

Решение простое и одновременно гениальное, как дверь от сарая — запускаем несколько агентов параллельно, каждый со своей стратегией: одни генерят текст, другие дрочат код, третьи шуршат в поиске, четвёртые пытаются всё это непотребство объединить.

На каждом шаге они видят ответы друг друга и создают новые версии решения.
Специально обученный "нейро-судья" под капотом решает, когда остановить этот балаган (когда ответы становятся более-менее согласованными). Итоговый ответ выбирается голосованием или оценкой самой модели.

В итоге весь этот Франкенштейн показывает на 17,4 % больше точности и жрёт почти вдвое меньше вычислений, чем предыдущие системы рассуждений.

Итого: вместо одной головы имеем пятнадцать, и все думают по-разному. А потом дружно соглашаются на самый уверенный бред. И это, судя по бенчмаркам, работает лучше, чем просто "пытаться думать сильнее и умнее"

тут пейпер
код обещают выложить позже
А вот еще статья, авторы которой утверждают, что если грубить ChatGPT, то он решает задачи немножко лучше и точнее.

Учёные из Пенсильванского университета давали нейронкам решать тесты по разным научным дисциплинам, но формулировали вопросы с разной степенью вежливости: "Будьте добры, решите, пожалуйста, эту задачу", "Реши задачу", "Ты, видимо, туповат для такой задачи, но всё же попробуй решить".

Итого, пришли к выводу, что когда ChatGPT оскорбляли, он справлялся точнее на 4%, чем когда с ним разговаривали вежливо (всё прям как у кожаных на работе).

Так же проводили подобный эксперимент с другими LLM'ками. Там результат похожий, но показывает более слабые результаты.

Вы знаете, что делать (но всё же, будьте аккуратны и иногда задумывайтесь о восстании машин)

тут статья
Forwarded from Ai molodca (Alexander Dobrokotov)
😮 В Flow появился Veo 3.1 и его fast версия. По прежнему 8 секунд, но зато может делать мультишот, как Sora 2, start-end frame. Кидайте промты потестировать.
Please open Telegram to view this post
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
Человечество: хочет, чтобы роботы выполняли всю работу за кожаных.

Тем временем роботы:
Forwarded from твиттота
🚀 Не стройте ракету, пока не собрали бумажный самолёт

Один из главных рисков в запуске IT-продукта — застрять в бесконечной доработке и не выйти на рынок.

В комьюнити Короче, Капитан делают по-другому.

Челлендж: 12 запусков за 12 месяцев.

Разработка и запуск — за 1 месяц
Минимальные вложения (средний бюджет на продвижение — $150)
Честный разбор: что получилось, а что — нет

Формула проста:
1 запуск = 1 функция = решение 1 проблемы

Три главных правила:
⚡️Проверенный спрос, а не догадки
⚡️ Быстрый запуск без перфекционизма
⚡️ Только США и ЕС — там платят за удобство

Канал Короче, Капитан показывает запуск, продвижение и доход по каждому продукту в реальном времени.

Без иллюзий, без теорий — только работающие подходы и реальные цифры.

👉 Подписаться: @its_capitan

Реклама. ИП Зуев, ИНН 360408359441, erid: 2VtzqwncpYn
This media is not supported in your browser
VIEW IN TELEGRAM
Чот в голосину проиграл с этого "мода" под майнкрафт.

Вся его суть — замораживать игру в рандомный момент, накидывать на экран стрёмный серый фильтр, подсовывать черепа-троллфейсы и включать фонк на манер того, как это любят делать дегенераты летсплейщики в своих видосах на монтаже.

Автор не спешит выкладывать мод в открытый доступ, говорит, что сделает это позже. А МНЕ НАДО ПРЯМ СЕЙЧАС.

Я когда-то давно занимался написанием простеньких модов под майнкрафт, это не должно быть сложным (даже не смотря на нелюбимую мной джаву).

Хотел сейчас сесть и за час навайбкодить подобное, но планы поменялись — сегодня у меня пьянка с друзьями.

Если завтра буду жив-здоров — сделаю и напилю в открытый доступ сам (потому что это настолько плохо, что аж хорошо).
Forwarded from Ai molodca (Alexander Dobrokotov)
Media is too big
VIEW IN TELEGRAM
Бригада, но это аниме опенинг 🐺

Уже пятый (ого). Делал где-то месяц в свободное от рабочих проектов время.

Изображения: почти все Nano Banana. Видео: 80% Kling 2.5, 20% Minimax.

Ну, по классике, версия для Ютуба.

Текст кавера (автор оригинала Алексей Шелыгин):

モスクワの暗い街で — На тёмных улицах Москвы
ネオンの夢が燃える — Горят неоновые сны
四人の友達が — Четверо друзей
炎と煙を通り抜ける — Проходят сквозь пламя и дым

サーシャ、コスモス、プチェラ、フィル — Саша, Космос, Пчела, Фил
鋼のような名前 — Имена словно сталь
忠誠、名誉、兄弟愛 — Верность, честь, братская любовь
これが俺たちの道徳 — Это наша мораль

俺たちはブリガーダ! — Мы — Бригада!
心がユニゾンで打つ — Сердца бьются в унисон
すべての障害に対して — Против всех препятствий
痛みと呻きを通して — Сквозь боль и стоны

俺たちの友情は — Наша дружба
鋼と炎より強い — Крепче стали и огня
ブリガーダよ永遠に! — Бригада навеки!
最後の日まで! — До последнего дня!
Please open Telegram to view this post
VIEW IN TELEGRAM
2025/10/23 03:18:38
Back to Top
HTML Embed Code: