This media is not supported in your browser
VIEW IN TELEGRAM
Чот аж в голосину порвался с этой олимпиады
Интересная статья от Google, MIT и Гарварда: TUMIX: Multi-Agent Test-Time Scaling with Tool-Use Mixture.
Краткая суть: современные модели (ChatGPT Agent, Gemini-Pro и т.д.) умеют подключать интерпретатор кода и поиск в интернете, но не существует чётких правил, когда и как использовать тот или иной инструмент.
Решение простое и одновременно гениальное, как дверь от сарая — запускаем несколько агентов параллельно, каждый со своей стратегией: одни генерят текст, другие дрочат код, третьи шуршат в поиске, четвёртые пытаются всё это непотребство объединить.
На каждом шаге они видят ответы друг друга и создают новые версии решения.
Специально обученный "нейро-судья" под капотом решает, когда остановить этот балаган (когда ответы становятся более-менее согласованными). Итоговый ответ выбирается голосованием или оценкой самой модели.
В итоге весь этот Франкенштейн показывает на 17,4 % больше точности и жрёт почти вдвое меньше вычислений, чем предыдущие системы рассуждений.
Итого: вместо одной головы имеем пятнадцать, и все думают по-разному. А потом дружно соглашаются на самый уверенный бред. И это, судя по бенчмаркам, работает лучше, чем просто "пытаться думать сильнее и умнее"
тут пейпер
код обещают выложить позже
Краткая суть: современные модели (ChatGPT Agent, Gemini-Pro и т.д.) умеют подключать интерпретатор кода и поиск в интернете, но не существует чётких правил, когда и как использовать тот или иной инструмент.
Решение простое и одновременно гениальное, как дверь от сарая — запускаем несколько агентов параллельно, каждый со своей стратегией: одни генерят текст, другие дрочат код, третьи шуршат в поиске, четвёртые пытаются всё это непотребство объединить.
На каждом шаге они видят ответы друг друга и создают новые версии решения.
Специально обученный "нейро-судья" под капотом решает, когда остановить этот балаган (когда ответы становятся более-менее согласованными). Итоговый ответ выбирается голосованием или оценкой самой модели.
В итоге весь этот Франкенштейн показывает на 17,4 % больше точности и жрёт почти вдвое меньше вычислений, чем предыдущие системы рассуждений.
Итого: вместо одной головы имеем пятнадцать, и все думают по-разному. А потом дружно соглашаются на самый уверенный бред. И это, судя по бенчмаркам, работает лучше, чем просто "пытаться думать сильнее и умнее"
тут пейпер
код обещают выложить позже
arXiv.org
TUMIX: Multi-Agent Test-Time Scaling with Tool-Use Mixture
While integrating tools like Code Interpreter and Search has significantly enhanced Large Language Model (LLM) reasoning in models like ChatGPT Agent and Gemini-Pro, practical guidance on optimal...
А вот еще статья, авторы которой утверждают, что если грубить ChatGPT, то он решает задачи немножко лучше и точнее.
Учёные из Пенсильванского университета давали нейронкам решать тесты по разным научным дисциплинам, но формулировали вопросы с разной степенью вежливости: "Будьте добры, решите, пожалуйста, эту задачу", "Реши задачу", "Ты, видимо, туповат для такой задачи, но всё же попробуй решить".
Итого, пришли к выводу, что когда ChatGPT оскорбляли, он справлялся точнее на 4%, чем когда с ним разговаривали вежливо (всё прям как у кожаных на работе).
Так же проводили подобный эксперимент с другими LLM'ками. Там результат похожий, но показывает более слабые результаты.
Вы знаете, что делать (но всё же, будьте аккуратны и иногда задумывайтесь о восстании машин)
тут статья
Учёные из Пенсильванского университета давали нейронкам решать тесты по разным научным дисциплинам, но формулировали вопросы с разной степенью вежливости: "Будьте добры, решите, пожалуйста, эту задачу", "Реши задачу", "Ты, видимо, туповат для такой задачи, но всё же попробуй решить".
Итого, пришли к выводу, что когда ChatGPT оскорбляли, он справлялся точнее на 4%, чем когда с ним разговаривали вежливо (всё прям как у кожаных на работе).
Так же проводили подобный эксперимент с другими LLM'ками. Там результат похожий, но показывает более слабые результаты.
Вы знаете, что делать (но всё же, будьте аккуратны и иногда задумывайтесь о восстании машин)
тут статья
arXiv.org
Mind Your Tone: Investigating How Prompt Politeness Affects LLM...
The wording of natural language prompts has been shown to influence the performance of large language models (LLMs), yet the role of politeness and tone remains underexplored. In this study, we...
Forwarded from Ai molodca (Alexander Dobrokotov)
Please open Telegram to view this post
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
Человечество: хочет, чтобы роботы выполняли всю работу за кожаных.
Тем временем роботы:
Тем временем роботы:
🚀 Не стройте ракету, пока не собрали бумажный самолёт
Один из главных рисков в запуске IT-продукта — застрять в бесконечной доработке и не выйти на рынок.
В комьюнити Короче, Капитан делают по-другому.
Челлендж: 12 запусков за 12 месяцев.
✅ Разработка и запуск — за 1 месяц
✅ Минимальные вложения (средний бюджет на продвижение — $150)
✅ Честный разбор: что получилось, а что — нет
Формула проста:
1 запуск = 1 функция = решение 1 проблемы
Три главных правила:
⚡️Проверенный спрос, а не догадки
⚡️ Быстрый запуск без перфекционизма
⚡️ Только США и ЕС — там платят за удобство
Канал Короче, Капитан показывает запуск, продвижение и доход по каждому продукту в реальном времени.
Без иллюзий, без теорий — только работающие подходы и реальные цифры.
👉 Подписаться: @its_capitan
Реклама. ИП Зуев, ИНН 360408359441, erid: 2VtzqwncpYn
Один из главных рисков в запуске IT-продукта — застрять в бесконечной доработке и не выйти на рынок.
В комьюнити Короче, Капитан делают по-другому.
Челлендж: 12 запусков за 12 месяцев.
✅ Разработка и запуск — за 1 месяц
✅ Минимальные вложения (средний бюджет на продвижение — $150)
✅ Честный разбор: что получилось, а что — нет
Формула проста:
1 запуск = 1 функция = решение 1 проблемы
Три главных правила:
⚡️Проверенный спрос, а не догадки
⚡️ Быстрый запуск без перфекционизма
⚡️ Только США и ЕС — там платят за удобство
Канал Короче, Капитан показывает запуск, продвижение и доход по каждому продукту в реальном времени.
Без иллюзий, без теорий — только работающие подходы и реальные цифры.
👉 Подписаться: @its_capitan
Реклама. ИП Зуев, ИНН 360408359441, erid: 2VtzqwncpYn
This media is not supported in your browser
VIEW IN TELEGRAM
Чот в голосину проиграл с этого "мода" под майнкрафт.
Вся его суть — замораживать игру в рандомный момент, накидывать на экран стрёмный серый фильтр, подсовывать черепа-троллфейсы и включать фонк на манер того, как это любят делатьдегенераты летсплейщики в своих видосах на монтаже.
Автор не спешит выкладывать мод в открытый доступ, говорит, что сделает это позже. А МНЕ НАДО ПРЯМ СЕЙЧАС.
Я когда-то давно занимался написанием простеньких модов под майнкрафт, это не должно быть сложным (даже не смотря на нелюбимую мной джаву).
Хотел сейчас сесть и за час навайбкодить подобное, но планы поменялись — сегодня у меня пьянка с друзьями.
Если завтра буду жив-здоров — сделаю и напилю в открытый доступ сам (потому что это настолько плохо, что аж хорошо).
Вся его суть — замораживать игру в рандомный момент, накидывать на экран стрёмный серый фильтр, подсовывать черепа-троллфейсы и включать фонк на манер того, как это любят делать
Автор не спешит выкладывать мод в открытый доступ, говорит, что сделает это позже. А МНЕ НАДО ПРЯМ СЕЙЧАС.
Я когда-то давно занимался написанием простеньких модов под майнкрафт, это не должно быть сложным (даже не смотря на нелюбимую мной джаву).
Хотел сейчас сесть и за час навайбкодить подобное, но планы поменялись — сегодня у меня пьянка с друзьями.
Если завтра буду жив-здоров — сделаю и напилю в открытый доступ сам (потому что это настолько плохо, что аж хорошо).
Forwarded from Ai molodca (Alexander Dobrokotov)
Media is too big
VIEW IN TELEGRAM
Бригада, но это аниме опенинг 🐺
Уже пятый (ого). Делал где-то месяц в свободное от рабочих проектов время.
Изображения: почти все Nano Banana. Видео: 80% Kling 2.5, 20% Minimax.
Ну, по классике, версия для Ютуба.
Текст кавера (автор оригинала Алексей Шелыгин):
Уже пятый (ого). Делал где-то месяц в свободное от рабочих проектов время.
Изображения: почти все Nano Banana. Видео: 80% Kling 2.5, 20% Minimax.
Ну, по классике, версия для Ютуба.
Текст кавера (автор оригинала Алексей Шелыгин):
モスクワの暗い街で — На тёмных улицах Москвы
ネオンの夢が燃える — Горят неоновые сны
四人の友達が — Четверо друзей
炎と煙を通り抜ける — Проходят сквозь пламя и дым
サーシャ、コスモス、プチェラ、フィル — Саша, Космос, Пчела, Фил
鋼のような名前 — Имена словно сталь
忠誠、名誉、兄弟愛 — Верность, честь, братская любовь
これが俺たちの道徳 — Это наша мораль
俺たちはブリガーダ! — Мы — Бригада!
心がユニゾンで打つ — Сердца бьются в унисон
すべての障害に対して — Против всех препятствий
痛みと呻きを通して — Сквозь боль и стоны
俺たちの友情は — Наша дружба
鋼と炎より強い — Крепче стали и огня
ブリガーダよ永遠に! — Бригада навеки!
最後の日まで! — До последнего дня!
Please open Telegram to view this post
VIEW IN TELEGRAM
🙅 Вас заменят на другого специалиста, если вы не используете нейросети. Сейчас с их помощью можно не только искать информацию и генерировать контент, но и создавать экосистемы для автоматизации задач.
Стать эффективнее и повысить шансы на рынке труда вы сможете на программе «Нейросети: практический курс» от Skillbox. Она поможет упростить работу разным специалистам. Например:
👉 Маркетологи и аналитики смогут легче изучать конкурентов и создавать воронки продаж
👉 Дизайнеры и SMM-щики — быстрее делать визуалы и автоматизировать контент-планы
👉 Программисты — проверять код и адаптировать его под разные платформы
🔥 Специалисты любых направлений смогут быстро создавать прототипы, анализировать данные и зарабатывать больше конкурентов.
На курсе вы изучите более 38 популярных нейросетей и получите 190+ готовых промптов для самых частых бизнес-задач. Забирайте скидку и читайте подробности по ссылке: https://epic.st/AQ-Kh?erid=2Vtzqw11AbX
Получите в октябре скидку до 55%
Реклама. ЧОУ ДПО «Образовательные технологии «Скилбокс (Коробка навыков)», ИНН: 9704088880
Стать эффективнее и повысить шансы на рынке труда вы сможете на программе «Нейросети: практический курс» от Skillbox. Она поможет упростить работу разным специалистам. Например:
👉 Маркетологи и аналитики смогут легче изучать конкурентов и создавать воронки продаж
👉 Дизайнеры и SMM-щики — быстрее делать визуалы и автоматизировать контент-планы
👉 Программисты — проверять код и адаптировать его под разные платформы
🔥 Специалисты любых направлений смогут быстро создавать прототипы, анализировать данные и зарабатывать больше конкурентов.
На курсе вы изучите более 38 популярных нейросетей и получите 190+ готовых промптов для самых частых бизнес-задач. Забирайте скидку и читайте подробности по ссылке: https://epic.st/AQ-Kh?erid=2Vtzqw11AbX
Получите в октябре скидку до 55%
Реклама. ЧОУ ДПО «Образовательные технологии «Скилбокс (Коробка навыков)», ИНН: 9704088880
Forwarded from Сиолошная
TLDR презентации:
— скачать браузер и посмотреть на фичи тут: https://chatgpt.com/atlas
— доступно только на MacOS, в будущем добавят Windows и мобильные устройства
— Браузер называется не OpenAI Atlas, а ChatGPT Atlas. Компания явно делает ставку на увеличение узнаваемости бренда Чата.
— браузер доступен всем странам и всем пользователям бесплатно
— Ключевых нововведения, по отношению к обычному браузеру, 3. Первое — чат с вами на любой странице. Есть кнопочка сверху справа, можно нажать — и ChatGPT видит содержимое.
— Второе — память. Это так по умному назвали поиск по истории, если вдруг вы забыли, на каком домене что-то искали, но помните примерное описание контента.
— Третье — Агент. По виду это в точности ChatGPT Agent, который мы видели, но теперь все действия выполняются на вашем экране, а не на удалённой виртуальной машине. Можно выбрать, предоставлять ли доступ к своим учётным записям или нет. Агент доступен только Pro и Plus пользователям
— (ну и главная страница у вас всегда ChatGPT)
— Для агента показанный сценарий такой: вы нашли страницу с рецептом блюда через чат, попросили пересчитать ингридиенты на 8 персон и отправили агента оформлять онлайн-заказ. В этот момент можно переключиться на другую вкладку, пока идёт работа в фоне. Агент вызовет вас, если потребуется подтверждение, например, оплаты заказа.
— если вы нажимаете на ссылку в чате с ChatGPT, то чат красиво съедет вправо, и сессия сохранится. Можно задавать вопросы по странице или перескачить на другую.
— В любом текстовом поле можно выделить текст и появится маленькая точечка. При нажатии откроется маленькое окно, в котором можно дать команду вроде «перепиши но нормально» или «переведи» (команду вводите вы сами, хотя мб в будущем логично добавить 2-3 кнопки сценариев по умолчанию)
В остальном браузер максимально обычный и не предлагает ничего нового пользователям — это сделано намеренно, чтобы людям не пришлось переучиваться. UI/UX выглядит очень приятным по презентации.
Я попробую посидеть на нём несколько дней вместо Arc; вкладки только горизонтальные (от чего я отвык), так ещё и нельзя экспортировать из Arc, только из Chrome и Safari :(
— скачать браузер и посмотреть на фичи тут: https://chatgpt.com/atlas
— доступно только на MacOS, в будущем добавят Windows и мобильные устройства
— Браузер называется не OpenAI Atlas, а ChatGPT Atlas. Компания явно делает ставку на увеличение узнаваемости бренда Чата.
— браузер доступен всем странам и всем пользователям бесплатно
— Ключевых нововведения, по отношению к обычному браузеру, 3. Первое — чат с вами на любой странице. Есть кнопочка сверху справа, можно нажать — и ChatGPT видит содержимое.
— Второе — память. Это так по умному назвали поиск по истории, если вдруг вы забыли, на каком домене что-то искали, но помните примерное описание контента.
— Третье — Агент. По виду это в точности ChatGPT Agent, который мы видели, но теперь все действия выполняются на вашем экране, а не на удалённой виртуальной машине. Можно выбрать, предоставлять ли доступ к своим учётным записям или нет. Агент доступен только Pro и Plus пользователям
— (ну и главная страница у вас всегда ChatGPT)
— Для агента показанный сценарий такой: вы нашли страницу с рецептом блюда через чат, попросили пересчитать ингридиенты на 8 персон и отправили агента оформлять онлайн-заказ. В этот момент можно переключиться на другую вкладку, пока идёт работа в фоне. Агент вызовет вас, если потребуется подтверждение, например, оплаты заказа.
— если вы нажимаете на ссылку в чате с ChatGPT, то чат красиво съедет вправо, и сессия сохранится. Можно задавать вопросы по странице или перескачить на другую.
— В любом текстовом поле можно выделить текст и появится маленькая точечка. При нажатии откроется маленькое окно, в котором можно дать команду вроде «перепиши но нормально» или «переведи» (команду вводите вы сами, хотя мб в будущем логично добавить 2-3 кнопки сценариев по умолчанию)
В остальном браузер максимально обычный и не предлагает ничего нового пользователям — это сделано намеренно, чтобы людям не пришлось переучиваться. UI/UX выглядит очень приятным по презентации.
Я попробую посидеть на нём несколько дней вместо Arc; вкладки только горизонтальные (от чего я отвык), так ещё и нельзя экспортировать из Arc, только из Chrome и Safari :(