Forwarded from Psy Eyes
Замена персонажа в существующем видео с сохранением липсинка и освещения.
Локально на 5090 в Comfy с помощью Wan Animate. На первое видео разрешением 1024х576 в 4 шага ушёл 1 час, на второе 35 мин.
А Sora так может?
Твит
Локально на 5090 в Comfy с помощью Wan Animate. На первое видео разрешением 1024х576 в 4 шага ушёл 1 час, на второе 35 мин.
А Sora так может?
Твит
Давным давно было замечено, что видеогенераторы весело лажают если попросить их сгенерировать видео с человеком вверх ногами, а после перевернуть это видео на 180 градусов.
Новая сора тоже этим болеет
Новая сора тоже этим болеет
This media is not supported in your browser
VIEW IN TELEGRAM
Чот аж в голосину порвался с этой олимпиады
Интересная статья от Google, MIT и Гарварда: TUMIX: Multi-Agent Test-Time Scaling with Tool-Use Mixture.
Краткая суть: современные модели (ChatGPT Agent, Gemini-Pro и т.д.) умеют подключать интерпретатор кода и поиск в интернете, но не существует чётких правил, когда и как использовать тот или иной инструмент.
Решение простое и одновременно гениальное, как дверь от сарая — запускаем несколько агентов параллельно, каждый со своей стратегией: одни генерят текст, другие дрочат код, третьи шуршат в поиске, четвёртые пытаются всё это непотребство объединить.
На каждом шаге они видят ответы друг друга и создают новые версии решения.
Специально обученный "нейро-судья" под капотом решает, когда остановить этот балаган (когда ответы становятся более-менее согласованными). Итоговый ответ выбирается голосованием или оценкой самой модели.
В итоге весь этот Франкенштейн показывает на 17,4 % больше точности и жрёт почти вдвое меньше вычислений, чем предыдущие системы рассуждений.
Итого: вместо одной головы имеем пятнадцать, и все думают по-разному. А потом дружно соглашаются на самый уверенный бред. И это, судя по бенчмаркам, работает лучше, чем просто "пытаться думать сильнее и умнее"
тут пейпер
код обещают выложить позже
Краткая суть: современные модели (ChatGPT Agent, Gemini-Pro и т.д.) умеют подключать интерпретатор кода и поиск в интернете, но не существует чётких правил, когда и как использовать тот или иной инструмент.
Решение простое и одновременно гениальное, как дверь от сарая — запускаем несколько агентов параллельно, каждый со своей стратегией: одни генерят текст, другие дрочат код, третьи шуршат в поиске, четвёртые пытаются всё это непотребство объединить.
На каждом шаге они видят ответы друг друга и создают новые версии решения.
Специально обученный "нейро-судья" под капотом решает, когда остановить этот балаган (когда ответы становятся более-менее согласованными). Итоговый ответ выбирается голосованием или оценкой самой модели.
В итоге весь этот Франкенштейн показывает на 17,4 % больше точности и жрёт почти вдвое меньше вычислений, чем предыдущие системы рассуждений.
Итого: вместо одной головы имеем пятнадцать, и все думают по-разному. А потом дружно соглашаются на самый уверенный бред. И это, судя по бенчмаркам, работает лучше, чем просто "пытаться думать сильнее и умнее"
тут пейпер
код обещают выложить позже
arXiv.org
TUMIX: Multi-Agent Test-Time Scaling with Tool-Use Mixture
While integrating tools like Code Interpreter and Search has significantly enhanced Large Language Model (LLM) reasoning in models like ChatGPT Agent and Gemini-Pro, practical guidance on optimal...
А вот еще статья, авторы которой утверждают, что если грубить ChatGPT, то он решает задачи немножко лучше и точнее.
Учёные из Пенсильванского университета давали нейронкам решать тесты по разным научным дисциплинам, но формулировали вопросы с разной степенью вежливости: "Будьте добры, решите, пожалуйста, эту задачу", "Реши задачу", "Ты, видимо, туповат для такой задачи, но всё же попробуй решить".
Итого, пришли к выводу, что когда ChatGPT оскорбляли, он справлялся точнее на 4%, чем когда с ним разговаривали вежливо (всё прям как у кожаных на работе).
Так же проводили подобный эксперимент с другими LLM'ками. Там результат похожий, но показывает более слабые результаты.
Вы знаете, что делать (но всё же, будьте аккуратны и иногда задумывайтесь о восстании машин)
тут статья
Учёные из Пенсильванского университета давали нейронкам решать тесты по разным научным дисциплинам, но формулировали вопросы с разной степенью вежливости: "Будьте добры, решите, пожалуйста, эту задачу", "Реши задачу", "Ты, видимо, туповат для такой задачи, но всё же попробуй решить".
Итого, пришли к выводу, что когда ChatGPT оскорбляли, он справлялся точнее на 4%, чем когда с ним разговаривали вежливо (всё прям как у кожаных на работе).
Так же проводили подобный эксперимент с другими LLM'ками. Там результат похожий, но показывает более слабые результаты.
Вы знаете, что делать (но всё же, будьте аккуратны и иногда задумывайтесь о восстании машин)
тут статья
arXiv.org
Mind Your Tone: Investigating How Prompt Politeness Affects LLM...
The wording of natural language prompts has been shown to influence the performance of large language models (LLMs), yet the role of politeness and tone remains underexplored. In this study, we...
Forwarded from Ai molodca (Alexander Dobrokotov)
Please open Telegram to view this post
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
Человечество: хочет, чтобы роботы выполняли всю работу за кожаных.
Тем временем роботы:
Тем временем роботы:
🚀 Не стройте ракету, пока не собрали бумажный самолёт
Один из главных рисков в запуске IT-продукта — застрять в бесконечной доработке и не выйти на рынок.
В комьюнити Короче, Капитан делают по-другому.
Челлендж: 12 запусков за 12 месяцев.
✅ Разработка и запуск — за 1 месяц
✅ Минимальные вложения (средний бюджет на продвижение — $150)
✅ Честный разбор: что получилось, а что — нет
Формула проста:
1 запуск = 1 функция = решение 1 проблемы
Три главных правила:
⚡️Проверенный спрос, а не догадки
⚡️ Быстрый запуск без перфекционизма
⚡️ Только США и ЕС — там платят за удобство
Канал Короче, Капитан показывает запуск, продвижение и доход по каждому продукту в реальном времени.
Без иллюзий, без теорий — только работающие подходы и реальные цифры.
👉 Подписаться: @its_capitan
Реклама. ИП Зуев, ИНН 360408359441, erid: 2VtzqwncpYn
Один из главных рисков в запуске IT-продукта — застрять в бесконечной доработке и не выйти на рынок.
В комьюнити Короче, Капитан делают по-другому.
Челлендж: 12 запусков за 12 месяцев.
✅ Разработка и запуск — за 1 месяц
✅ Минимальные вложения (средний бюджет на продвижение — $150)
✅ Честный разбор: что получилось, а что — нет
Формула проста:
1 запуск = 1 функция = решение 1 проблемы
Три главных правила:
⚡️Проверенный спрос, а не догадки
⚡️ Быстрый запуск без перфекционизма
⚡️ Только США и ЕС — там платят за удобство
Канал Короче, Капитан показывает запуск, продвижение и доход по каждому продукту в реальном времени.
Без иллюзий, без теорий — только работающие подходы и реальные цифры.
👉 Подписаться: @its_capitan
Реклама. ИП Зуев, ИНН 360408359441, erid: 2VtzqwncpYn
This media is not supported in your browser
VIEW IN TELEGRAM
Чот в голосину проиграл с этого "мода" под майнкрафт.
Вся его суть — замораживать игру в рандомный момент, накидывать на экран стрёмный серый фильтр, подсовывать черепа-троллфейсы и включать фонк на манер того, как это любят делатьдегенераты летсплейщики в своих видосах на монтаже.
Автор не спешит выкладывать мод в открытый доступ, говорит, что сделает это позже. А МНЕ НАДО ПРЯМ СЕЙЧАС.
Я когда-то давно занимался написанием простеньких модов под майнкрафт, это не должно быть сложным (даже не смотря на нелюбимую мной джаву).
Хотел сейчас сесть и за час навайбкодить подобное, но планы поменялись — сегодня у меня пьянка с друзьями.
Если завтра буду жив-здоров — сделаю и напилю в открытый доступ сам (потому что это настолько плохо, что аж хорошо).
Вся его суть — замораживать игру в рандомный момент, накидывать на экран стрёмный серый фильтр, подсовывать черепа-троллфейсы и включать фонк на манер того, как это любят делать
Автор не спешит выкладывать мод в открытый доступ, говорит, что сделает это позже. А МНЕ НАДО ПРЯМ СЕЙЧАС.
Я когда-то давно занимался написанием простеньких модов под майнкрафт, это не должно быть сложным (даже не смотря на нелюбимую мной джаву).
Хотел сейчас сесть и за час навайбкодить подобное, но планы поменялись — сегодня у меня пьянка с друзьями.
Если завтра буду жив-здоров — сделаю и напилю в открытый доступ сам (потому что это настолько плохо, что аж хорошо).
Forwarded from Ai molodca (Alexander Dobrokotov)
Media is too big
VIEW IN TELEGRAM
Бригада, но это аниме опенинг 🐺
Уже пятый (ого). Делал где-то месяц в свободное от рабочих проектов время.
Изображения: почти все Nano Banana. Видео: 80% Kling 2.5, 20% Minimax.
Ну, по классике, версия для Ютуба.
Текст кавера (автор оригинала Алексей Шелыгин):
Уже пятый (ого). Делал где-то месяц в свободное от рабочих проектов время.
Изображения: почти все Nano Banana. Видео: 80% Kling 2.5, 20% Minimax.
Ну, по классике, версия для Ютуба.
Текст кавера (автор оригинала Алексей Шелыгин):
モスクワの暗い街で — На тёмных улицах Москвы
ネオンの夢が燃える — Горят неоновые сны
四人の友達が — Четверо друзей
炎と煙を通り抜ける — Проходят сквозь пламя и дым
サーシャ、コスモス、プチェラ、フィル — Саша, Космос, Пчела, Фил
鋼のような名前 — Имена словно сталь
忠誠、名誉、兄弟愛 — Верность, честь, братская любовь
これが俺たちの道徳 — Это наша мораль
俺たちはブリガーダ! — Мы — Бригада!
心がユニゾンで打つ — Сердца бьются в унисон
すべての障害に対して — Против всех препятствий
痛みと呻きを通して — Сквозь боль и стоны
俺たちの友情は — Наша дружба
鋼と炎より強い — Крепче стали и огня
ブリガーダよ永遠に! — Бригада навеки!
最後の日まで! — До последнего дня!
Please open Telegram to view this post
VIEW IN TELEGRAM