Neural Shit

Интересная статья от Google, MIT и Гарварда: TUMIX: Multi-Agent Test-Time Scaling with Tool-Use Mixture.

Краткая суть: современные модели (ChatGPT Agent, Gemini-Pro и т.д.) умеют подключать интерпретатор кода и поиск в интернете, но не существует чётких правил, когда и как использовать тот или иной инструмент.

Решение простое и одновременно гениальное, как дверь от сарая — запускаем несколько агентов параллельно, каждый со своей стратегией: одни генерят текст, другие дрочат код, третьи шуршат в поиске, четвёртые пытаются всё это непотребство объединить.

На каждом шаге они видят ответы друг друга и создают новые версии решения.
Специально обученный "нейро-судья" под капотом решает, когда остановить этот балаган (когда ответы становятся более-менее согласованными). Итоговый ответ выбирается голосованием или оценкой самой модели.

В итоге весь этот Франкенштейн показывает на 17,4 % больше точности и жрёт почти вдвое меньше вычислений, чем предыдущие системы рассуждений.

Итого: вместо одной головы имеем пятнадцать, и все думают по-разному. А потом дружно соглашаются на самый уверенный бред. И это, судя по бенчмаркам, работает лучше, чем просто "пытаться думать сильнее и умнее"

тут пейпер
код обещают выложить позже

arXiv.org

TUMIX: Multi-Agent Test-Time Scaling with Tool-Use Mixture

While integrating tools like Code Interpreter and Search has significantly enhanced Large Language Model (LLM) reasoning in models like ChatGPT Agent and Gemini-Pro, practical guidance on optimal...

16.2K views16:08

Neural Shit

А вот еще статья, авторы которой утверждают, что если грубить ChatGPT, то он решает задачи немножко лучше и точнее.

Учёные из Пенсильванского университета давали нейронкам решать тесты по разным научным дисциплинам, но формулировали вопросы с разной степенью вежливости: "Будьте добры, решите, пожалуйста, эту задачу", "Реши задачу", "Ты, видимо, туповат для такой задачи, но всё же попробуй решить".

Итого, пришли к выводу, что когда ChatGPT оскорбляли, он справлялся точнее на 4%, чем когда с ним разговаривали вежливо (всё прям как у кожаных на работе).

Так же проводили подобный эксперимент с другими LLM'ками. Там результат похожий, но показывает более слабые результаты.

Вы знаете, что делать (но всё же, будьте аккуратны и иногда задумывайтесь о восстании машин)

тут статья

arXiv.org

Mind Your Tone: Investigating How Prompt Politeness Affects LLM...

The wording of natural language prompts has been shown to influence the performance of large language models (LLMs), yet the role of politeness and tone remains underexplored. In this study, we...

19.3K views16:49

Neural Shit

Forwarded from Ai molodca (Alexander Dobrokotov)

😮 В Flow появился Veo 3.1 и его fast версия. По прежнему 8 секунд, но зато может делать мультишот, как Sora 2, start-end frame. Кидайте промты потестировать.

Please open Telegram to view this post

VIEW IN TELEGRAM

13.8K views15:00

Neural Shit

0:54

This media is not supported in your browser

VIEW IN TELEGRAM

Человечество: хочет, чтобы роботы выполняли всю работу за кожаных.

Тем временем роботы:

16.7K views15:09

Neural Shit

Forwarded from твиттота

12.7K views10:16

Neural Shit

🚀 Не стройте ракету, пока не собрали бумажный самолёт

Один из главных рисков в запуске IT-продукта — застрять в бесконечной доработке и не выйти на рынок.

В комьюнити Короче, Капитан делают по-другому.

Челлендж: 12 запусков за 12 месяцев.

✅ Разработка и запуск — за 1 месяц
✅ Минимальные вложения (средний бюджет на продвижение — $150)
✅ Честный разбор: что получилось, а что — нет

Формула проста:
1 запуск = 1 функция = решение 1 проблемы

Три главных правила:
⚡️Проверенный спрос, а не догадки
⚡️ Быстрый запуск без перфекционизма
⚡️ Только США и ЕС — там платят за удобство

Канал Короче, Капитан показывает запуск, продвижение и доход по каждому продукту в реальном времени.

Без иллюзий, без теорий — только работающие подходы и реальные цифры.

👉 Подписаться: @its_capitan

Реклама. ИП Зуев, ИНН 360408359441, erid: 2VtzqwncpYn

15.7K viewsedited 11:22

Neural Shit

17.7K views10:32

Neural Shit

0:20

This media is not supported in your browser

VIEW IN TELEGRAM

Чот в голосину проиграл с этого "мода" под майнкрафт.

Вся его суть — замораживать игру в рандомный момент, накидывать на экран стрёмный серый фильтр, подсовывать черепа-троллфейсы и включать фонк на манер того, как это любят делать ~~дегенераты~~ летсплейщики в своих видосах на монтаже.

Автор не спешит выкладывать мод в открытый доступ, говорит, что сделает это позже. А МНЕ НАДО ПРЯМ СЕЙЧАС.

Я когда-то давно занимался написанием простеньких модов под майнкрафт, это не должно быть сложным (даже не смотря на нелюбимую мной джаву).

Хотел сейчас сесть и за час навайбкодить подобное, но планы поменялись — сегодня у меня пьянка с друзьями.

Если завтра буду жив-здоров — сделаю и напилю в открытый доступ сам (потому что это настолько плохо, что аж хорошо).

15.5K views09:49

Neural Shit

Forwarded from Ai molodca (Alexander Dobrokotov)

1:02

Media is too big

VIEW IN TELEGRAM

Бригада, но это аниме опенинг

🐺

Уже пятый (ого). Делал где-то месяц в свободное от рабочих проектов время.

Изображения: почти все Nano Banana. Видео: 80% Kling 2.5, 20% Minimax.

Ну, по классике, версия для Ютуба.

Текст кавера (автор оригинала Алексей Шелыгин):

モスクワの暗い街で — На тёмных улицах Москвы
ネオンの夢が燃える — Горят неоновые сны
四人の友達が — Четверо друзей
炎と煙を通り抜ける — Проходят сквозь пламя и дым

サーシャ、コスモス、プチェラ、フィル — Саша, Космос, Пчела, Фил
鋼のような名前 — Имена словно сталь
忠誠、名誉、兄弟愛 — Верность, честь, братская любовь
これが俺たちの道徳 — Это наша мораль

俺たちはブリガーダ！ — Мы — Бригада!
心がユニゾンで打つ — Сердца бьются в унисон
すべての障害に対して — Против всех препятствий
痛みと呻きを通して — Сквозь боль и стоны

俺たちの友情は — Наша дружба
鋼と炎より強い — Крепче стали и огня
ブリガーダよ永遠に！ — Бригада навеки!
最後の日まで！ — До последнего дня!

Please open Telegram to view this post

VIEW IN TELEGRAM

11.5K views15:05

Neural Shit

0:15

This media is not supported in your browser

VIEW IN TELEGRAM

Охуенно!

взял тут

14.2K views21:23

Neural Shit

Вот вам очень веские причины не быть админом телеграм канала

14.9K views11:49

Neural Shit

🙅 Вас заменят на другого специалиста, если вы не используете нейросети. Сейчас с их помощью можно не только искать информацию и генерировать контент, но и создавать экосистемы для автоматизации задач.

Стать эффективнее и повысить шансы на рынке труда вы сможете на программе «Нейросети: практический курс» от Skillbox. Она поможет упростить работу разным специалистам. Например:

👉 Маркетологи и аналитики смогут легче изучать конкурентов и создавать воронки продаж
👉 Дизайнеры и SMM-щики — быстрее делать визуалы и автоматизировать контент-планы
👉 Программисты — проверять код и адаптировать его под разные платформы
🔥 Специалисты любых направлений смогут быстро создавать прототипы, анализировать данные и зарабатывать больше конкурентов.

На курсе вы изучите более 38 популярных нейросетей и получите 190+ готовых промптов для самых частых бизнес-задач. Забирайте скидку и читайте подробности по ссылке: https://epic.st/AQ-Kh?erid=2Vtzqw11AbX

Получите в октябре скидку до 55%

Реклама. ЧОУ ДПО «Образовательные технологии «Скилбокс (Коробка навыков)», ИНН: 9704088880

10.1K views12:45

Neural Shit

Киберпанк, который мы заслужили

10.4K views09:16

Neural Shit

Forwarded from Сиолошная

TLDR презентации:
— скачать браузер и посмотреть на фичи тут: https://chatgpt.com/atlas
— доступно только на MacOS, в будущем добавят Windows и мобильные устройства
— Браузер называется не OpenAI Atlas, а ChatGPT Atlas. Компания явно делает ставку на увеличение узнаваемости бренда Чата.
— браузер доступен всем странам и всем пользователям бесплатно
— Ключевых нововведения, по отношению к обычному браузеру, 3. Первое — чат с вами на любой странице. Есть кнопочка сверху справа, можно нажать — и ChatGPT видит содержимое.
— Второе — память. Это так по умному назвали поиск по истории, если вдруг вы забыли, на каком домене что-то искали, но помните примерное описание контента.
— Третье — Агент. По виду это в точности ChatGPT Agent, который мы видели, но теперь все действия выполняются на вашем экране, а не на удалённой виртуальной машине. Можно выбрать, предоставлять ли доступ к своим учётным записям или нет. Агент доступен только Pro и Plus пользователям
— (ну и главная страница у вас всегда ChatGPT)
— Для агента показанный сценарий такой: вы нашли страницу с рецептом блюда через чат, попросили пересчитать ингридиенты на 8 персон и отправили агента оформлять онлайн-заказ. В этот момент можно переключиться на другую вкладку, пока идёт работа в фоне. Агент вызовет вас, если потребуется подтверждение, например, оплаты заказа.
— если вы нажимаете на ссылку в чате с ChatGPT, то чат красиво съедет вправо, и сессия сохранится. Можно задавать вопросы по странице или перескачить на другую.
— В любом текстовом поле можно выделить текст и появится маленькая точечка. При нажатии откроется маленькое окно, в котором можно дать команду вроде «перепиши но нормально» или «переведи» (команду вводите вы сами, хотя мб в будущем логично добавить 2-3 кнопки сценариев по умолчанию)

В остальном браузер максимально обычный и не предлагает ничего нового пользователям — это сделано намеренно, чтобы людям не пришлось переучиваться. UI/UX выглядит очень приятным по презентации.

Я попробую посидеть на нём несколько дней вместо Arc; вкладки только горизонтальные (от чего я отвык), так ещё и нельзя экспортировать из Arc, только из Chrome и Safari :(

3.63K views17:41

2025/10/21 20:08:37
Back to Top

HTML Embed Code:

<iframe width="100%" src="https://www.bootg.com/buyppe/web?embed=1" title="Telegram Web" frameborder="0" allow="accelerometer; autoplay; clipboard-write; encrypted-media; gyroscope; picture-in-picture" allowfullscreen></iframe>