Telegram Web Link
Нам нужен backend developer на аутсорс, готовы сгружать много много задачек) Буду признателен рекомендациям

про стэк посмотреть тут
Пишите мне в лс @olegyusupov
Forwarded from AI для Всех
🌿 Промпт устал – теперь рулит контекст

В свежем июльском обзоре “A Survey of Context Engineering for LLMs” разбираются все элементы целой фабрики по производству контекста для LLM. Так дешевле, стабильнее и быстрее.

🤔 Откуда шум?

Последние пару недель почти каждый день объясняю кому-нибудь что такое Context Engineering, а тут как раз и разбор подвезли на 165 страниц.

Пока мы гордились «идеальными» промптами, авторы обзора перечитали 200+ статей за 2023-25 гг. и увидели три тренда:
• диалоги растянулись до миллионов токенов;
• в продакшн заехали RAG-поиск и функции;
• пользователи ждут долговременную память.

Одна строка-промт не справляется → рождается context engineering — логистика данных для модели.

🔄 Что именно меняем - быстро и без боли

CLEAR-prompt. Это чек-лист: Concise (коротко), Logical (без скачков), Explicit (никаких «догадайся»), Adaptable (можно менять), Reflective (модель может на себя сослаться). Работает как код-ревью для промпта.

PREMISE & друзья. Микросервис, который проходит по тексту и оставляет только важные 20 %. Представь auto-summary кнопкой «Trim».

Self-RAG. Вместо постоянного поиска модель сама решает, нужен ли внешний факт. Похоже на «lazy load» в вебе: грузим картинку только когда пользователь доскроллил.

Rolling-buffer. Храним последние N сообщений + краткое summary старых. Диалог длинный, окно модели короткое — и все довольны.

Lost-in-the-middle. Если важное спрятать в середину, LLM чаще промахнётся. Решение банально: правила наверх, факты вниз, середину можно ужать.

Эти пять трюков — квинтэссенция трёх китов обзора (как собирать, как обрабатывать, как хранить).

🌍 Почему это важно прямо сейчас
💰 Меньше токенов — меньше счёт от GPT-4o/Claude/Qwen.
🔒 Больше надёжности - модель видит только нужные данные, меньше галлюцинаций.
Быстрее ответ - короткий контекст рендерится быстрее.

🦦 Капибары-логисты

В прикреплённой картинке семейство капибар собирает, фильтрует и сжимает данные, прежде чем скормить их модели. Запомнить схему «собрал → отфильтровал → сжал → скормил» проще некуда.

💬 Как вы уже оптимизируете контекст? Делитесь лайфхаками в комментах.

Если пост полезен — поделитесь с коллегами, сэкономим токены вместе! 😉

🔗 Обзор
Forwarded from Сиолошная
Потратил утро на то, чтобы почитать эссе + вайтпейпер mechanize.work . Это новая компания Tamay Besiroglu и Ege Erdil, двух бывших сотрудников Epoch.AI, эссе, прогнозы и модели которых я часто упоминаю в канале. Ниже — краткое изложение того, как они видят ближайшие пробелмы и способы их решения в контексте полезных агентов.

Сегодня RL (метод дообучения) обычно порождает модели, которые очень эффективно выполняют узкий набор задач, на которых они были обучены, но плохо обобщаются за пределами знакомого. Фаундеры компании полагают, что это проблема данных, а не алгоритмов.

Авторы считают, что у RL скоро наступит собственный «GPT-3 момент». Вместо того чтобы дообучать модели на небольшом количестве виртуальных сред, ожидается переход к масштабному обучению в тысячах разнообразных окружений. Такой подход позволит создавать модели со способностями к само-обучению, не зависимому от задачи, и способные быстро адаптироваться. Другими словами, RL поможет выучить мета-навыки.

Некоторые из проектов написания программного обеспечения, над которыми работали люди, оцениваются в десят(ки) тысяч человеко-лет работы. Ребята считают, что расширение RL до такого масштаба (делать десятки-сотни попыток разработки схожих проектов) экономически целесообразно. Однако для этого необходимо кардинально увеличить масштабы сред RL (их глубину + длительность одной «попытки»), при этом сохраняя возможность автоматической оценки выполнения задач. Вероятно, для этого потребуются новые подходы к созданию RL сред.

Авторы считают, что GPT-3 момент для RL во многом станет возможен благодаря парадигме обучения через репликацию. Эта парадигма заключается в постановке перед ИИ задач по точному воспроизведению существующего программного обеспечения или отдельных его функций. Простые инструменты командной строки, реализующие малоизвестные алгоритмы хеширования и шифрования, представляют собой понятные для достижения цели, однако этот подход легко расширяется и на более сложные продукты, такие как веб-сайты, профессиональное ПО и игры.

Стоит заметить, что задачи репликации несколько искусственны, поскольку точное воспроизведение существующего ПО не является типичным для повседневной разработки. Но несмотря на это обучение через репликацию даёт понятный путь для масштабирования сред RL до огромных объёмов, необходимых для содержательного обобщения. Будет ли обучение через репликацию последней парадигмой, которая позволит полностью автоматизировать человеческий труд? Ege и Tamay сомневаются в этом.

Однако обучение через репликацию может послужить мостом к следующей парадигме, аналогично тому, как претрейн моделей на всём интернете стал необходимой ступенью на пути к (достаточно слабым) агентам, которые есть сейчас.

===

(а читать я про это начал потому, что увидел их вакансию, где они предлагают зарплату в $500k/год программистам для разработки инфраструктуры всего этого)

((более чем уверен, что OpenAI думают в схожем направлении, и их команды уже трудятся над задачей))
Forwarded from Нейро Дзен
🔭 Сравнительная таблица цен токенов LLM средних и мини моделей

Но вот немного полезности, но всё же ныть)

Это сравнительная таблица по моделям с уровня gpt-4.1 и gpt-4.1-mini (то есть совсем маленьких, типа gpt-4.1-nano или gemini flash light тут нет), сколько стоит 1 запрос при учёте 10 тыс токенов на вход и 1 тыс на выход

Сделал в начале этой недели, поэтому информация свежая.
20% токенов заложил на размышление, что грубовато, но вариантов нет других

Вот тут сама таблица

#полезное

@oh_my_zen
Forwarded from Vladislav Czhen
https://techcrunch.com/2025/07/18/netflix-starts-using-genai-in-its-shows-and-films/

СЕО Нетфликса заявляет, что применение ИИ ускорило их в 10 раз и ЗНАЧИТЕЛЬНО сократило расходы
Forwarded from Forbes Russia
Figma планирует привлечь около $1 млрд в ходе IPO на Нью-Йоркской фондовой бирже. Популярный среди дизайнеров разработчик ПО и его акционеры предложат инвесторам почти 37 млн акций в диапазоне цен $25-28. Стоимость Figma по итогам IPO окажется меньше, чем оценка при сорвавшейся сделке с Adobe, отмечает Bloomberg
Твиттер заполонили рекламные ролики, сгенерированные в Veo 3. Это случилось после того, как завирусилась реклама для IKEA. Люди соревнуются в роликах для реальных брендов, а финальный результат зависит от того, насколько подробно вы пропишите промт.

Бюджет реклам — $0 🚬
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
Forwarded from Банкста
Стоимость Газпрома оказалась ниже, чем у производителя игрушек Labubu. Газпром стоит 38 млрд долларов, а Popmart стоит 41 млрд. @banksta
This media is not supported in your browser
VIEW IN TELEGRAM
3D-художник Эрик Джанг создал концепт рекламы для IKEA с помощью Veo3. Получилось прям прикольконо #AI #brand

@HotDigital
👍1
Forwarded from AI для Всех
This media is not supported in your browser
VIEW IN TELEGRAM
🎨 Битва вкусов: Design Arena

Тут решают не токены, а чувство прекрасного. Арена для того, что бы узнать какая нейросеть в 2025-м рисует самый «глянцевый» UI.

Каждый день языковые модели пишут код быстрее и дешевле, но для конечного пользователя код не так уж и важен, важно то как продукт выглядит. Design Arena - одна из первых попыток измерить эстетику сгенерированных интерфейсов.

🔍 Как всё устроено

1. Пишете короткий prompt.
2. Платформа случайно выбирает 4 модели — названия скрыты.
3. Выбираете какой дизайн самый лучший
4. Win Rate + Elo обновляются в реальном времени.

🏆 Кто в топе прямо сейчас?

🥇 Claude Opus 4 — 71 % побед
🥈 DeepSeek-R1-0528 — 69 %
🥉 Claude Sonnet 4 — 68 %

Open-source DeepSeek уже дышит в спину гигантам — любопытно, согласитесь?

Попробовать самому можно тут
Forwarded from All is Gucci
Пишут, что Netflix и Disney потихоньку тестируют инструменты от Runway AI, которые специализируются на генерации видео. «Мышиная» корпорация пока не планирует внедрять ИИ в продакшен, но обсуждает потенциал технологий в кулуарах, хотя недавно судилась с Midjourney за нарушение авторских прав. А вот Netflix уже активно пытается скостить затраты в рабочих процессах. Недавно на площадке вышел аргентинский сериал Этернавт, где сцену с разрушенным зданием генерили в нейросетях.

Runway начинала с неровных трехсекундных клипов по текстовым промптам, но за полтора года очень сильно выросла в позициях. Сегодня стартап оценивается в более чем 3 миллиарда долларов и активно развивает систему Act-Two, которая должна стать альтернативой классической (и дорогой) Motion Capture. Ее можно использовать в анимации и VFX без маркеров, костюмов и студийных съёмок. Для этого Lionsgate уже обучает модель Runway на собственном контенте.

СЕО Netflix Тед Сарандос говорит, что AI помогает ускорить производство, но в индустрии, которая только оправилась от забастовок сценаристов и актеров, это звучит как приглашение к новым спорам.
Forwarded from Incrypted
This media is not supported in your browser
VIEW IN TELEGRAM
Microsoft добавила в Windows 11 новые «умные» ИИ-функции

Компания Microsoft представила новый набор «умных» функций на базе искусственного интеллекта:

- Copilot Vision — визуальный помощник, который «видит» экран, подсказывает, помогает ориентироваться в приложениях и документах.
- Агент для управления настройками — позволяет изменять системные параметры через текстовые команды (например: «включи тихий режим»).
- Генератор стикеров в Paint — создает уникальные стикеры по текстовому запросу.
- Relight — добавляет виртуальное освещение к фото в приложении «Фотографии».
- Click to Do и Color Picker — контекстные действия по экрану и подбор цветов.

Функции уже доступны на устройствах Copilot+ с чипами Snapdragon. Поддержка Intel и AMD — позже.

Tokensales | News | WaitingRoom
Forwarded from DevHub
В генераторе изображений в ChatGPT теперь есть готовые художественные стили

Теперь в ChatGPT стало проще создавать картинки в нужной стилистике — OpenAI добавила в генератор изображений функцию выбора готовых художественных стилей.

Пользователю больше не нужно вручную описывать желаемый визуальный эффект: достаточно выбрать подходящий вариант из предложенного списка.

1️⃣ DevHub
Please open Telegram to view this post
VIEW IN TELEGRAM
Forwarded from БлоGнот
Довольно примечательное письмо разослал Сатья Наделла сотрудникам Microsoft. CEO попытался объяснить, почему компания одновременно увольняет людей тысячами (более 15 тысяч с начала 2025 года) и вкладывает рекордные суммы в AI-инфраструктуру.

"Загадка успеха", как он это называет. Хотя ранее президент Microsoft Брэд Смит в интервью GeekWire довольно прямо сказал — капитальные расходы в $80 млрд за год создают давление на операционные расходы. А в техкомпаниях это обычно означает сокращение персонала.

При этом Microsoft активно переманивает AI-специалистов, мало уступая в этом Meta. Financial Times насчитала более 24 человек из Google DeepMind, перешедших в Microsoft за последние полгода.

Внутри компании реакция неоднозначная. Джеймс МакКафри, бывший старший инженер-исследователь, написал, что Microsoft превратилась из хорошей компании в "позорную компанию с минимальной внутренней целостностью". Сотрудники говорят о возвращении культуры страха после десятилетия "сострадательного лидерства" Наделлы.

Как тут не вспомнить статью Мэтта Столлера, которую я пересказывал буквально вчера — проблема не в AI, а в том, что компании просто нашли аргумент для оптимизации расходов.

https://www.geekwire.com/2025/in-new-memo-microsoft-ceo-addresses-enigma-of-layoffs-amid-record-profits-and-ai-investments/
Forwarded from Банкста
Intel за этот год сократит персонал на 22%, заявила компания в четверг.

До конца 2025 года Intel собирается оставить в штате 75 тысяч «основных» сотрудников — на конец 2024-го у компании было 99,5 тысячи таких работников.

Новый гендиректор Лип Бу Тан начал оптимизацию затрат. Intel также отказался от планов строительства заводов в Германии и Польше. @banksta
Forwarded from Хабр
Топ-24 бесплатных нейросетей и AI-сервисов на все случаи жизни

Кажется, ещё вчера мы с удивлением смотрели, как нейросеть пытается заставить Уилла Смита есть спагетти. А сегодня алгоритмы помогают с кодом, пишут музыку и редактируют тексты. Вместе с возможностями пришёл и новый вызов: как разобраться во всём этом многообразии?

Вот большая подборка из 24 надёжных и удобных бесплатных нейросетей на все случаи жизни — от генерации текста и изображений до создания видео и музыки.
Forwarded from Innovation & Research
Amazon отправила спутники Kuiper на ракете SpaceX, несмотря на конкуренцию с Маском

Amazon запускает следующую партию спутников проекта Kuiper с помощью ракеты Falcon 9 от своего главного конкурента SpaceX. С площадки во Флориде на орбиту отправили ещё 24 аппарата.

Несмотря на нарастающую конкуренцию с Илоном Маском, Amazon уже забронировала до 3 запусков у SpaceX. Это необходимо компании и для того, чтобы выполнить требования американской Федеральной комиссии по связи: к июлю 2026 г. Amazon должна вывести не менее 1600 спутников из запланированных 3200. С учётом нового рейса на орбите окажется 78 аппаратов Kuiper.

Сейчас Starlink от SpaceX доминирует на рынке спутникового интернета: около 8 тыс. спутников и 5 млн клиентов по всему миру. Kuiper — крупнейшая инфраструктурная ставка Amazon: на проект выделено свыше $10 млрд, а общие затраты могут достигнуть $23 млрд, без учёта стоимости пользовательских терминалов.

По оценке Bank of America и BCG, к 2032 г. Amazon может зарабатывать до $7,1 млрд в год на спутниковом интернете, если захватит хотя бы 30% глобального рынка, который к 2030 г. может вырасти до $40 млрд.

Видеозапись запуска

#news #бигтехи #космос

https://www.cnbc.com/2025/07/15/amazon-teams-up-with-rival-musks-spacex-to-launch-kuiper-satellites.html
Шанхайское правительство намеревается к 2027 году построить 5 тыс. км дорог для автомобилей с автономным вождением четвертого уровня (L4), что подразумевает высокий уровень автономности в определенных условиях и минимальное участие водителя в управлении транспортным средством. Как ожидается, к 2027 году такие автомобили совершат более 6 млн поездок на дорогах Шанхая.

Правительство города также хочет добиться, чтобы 90% новых автомобилей, регистрируемых в мегаполисе, были оснащены функциями автономного вождения L2 (частичная автоматизация с постоянным присутствием водителя) и L3 (автономность с участием водителя в сложных условиях).

План предполагает расширение зон для автономного вождения: обеспечение полного охвата в районе Пудун и постепенное открытие других районов, таких как Фэнсянь и Миньхан. ТАСС
2025/10/27 06:54:22
Back to Top
HTML Embed Code: