Telegram Web Link
Alibaba представила Qwen VLo — новую мультимодальную модель для создания и обработки визуального контента.
Возможности:
🔴Генерация изображений по тексту (text‑to‑image).
🔴Редактирование изображений (image‑to‑image): например, загружаете фото кота и добавляете кепку.
🔴“Прогрессивная генерация”: можно наблюдать, как картинка формируется по шагам .
🔴Улучшения по сравнению с Qwen 2.5‑VL: более точное понимание, гибкость инструкций, мультиязычная поддержка .

🧑‍💻 Превью доступно в Chat Qwen

Бесплатный GPT | Экспертный канал
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥117👎2👍1😁1
Голографические технологии активно развиваются: в 2021 году компания Proto представила капсулу для голографической передачи человека в реальном времени, а NBA использует 3D-проекции игроков на открытиях матчей. Microsoft работает над технологией Holoportation, позволяющей воссоздавать человека в объеме с помощью камер и AR-очков.

В 2023 году стартап Looking Glass продемонстрировал голографический дисплей без очков с поддержкой движения. Хотя полноценные воздушные голограммы пока не реализованы, прогресс в световых полях и объемных дисплеях делает массовые голографические трансляции матчей всё более реальными.

Бесплатный GPT | Экспертный канал
17😁7👎3🥱3💩2
This media is not supported in your browser
VIEW IN TELEGRAM
😊 ИИ, который понимает кошек

Американская компания Pattern разработала систему, способную распознавать значение кошачьих мяуканий в реальном времени с точностью до 95%. Технология основана на машинном обучении: в модель загружаются тысячи записей кошачьих звуков, которые связаны с конкретными ситуациями — голод, тревога, приветствие и т.п.

Алгоритм преобразует мяуканье в спектрограмму — визуальное представление звука — и анализирует его с помощью нейросетей. Причём ИИ адаптируется под «диалект» каждой конкретной кошки, делая выводы не только по тембру, но и по интонации и контексту.

Система не «переводит» речь в привычном смысле, а распознаёт эмоциональные сигналы: “покорми меня”, “оставь меня в покое”, “поиграй со мной”. Это помогает людям точнее понимать своих питомцев и реагировать на их потребности.

Речь не о волшебстве, а об анализе звуковых паттернов и поведенческих ассоциаций. Но даже это — большой шаг к более осознанному общению с животными.

Бесплатный GPT | Экспертный канал
Please open Telegram to view this post
VIEW IN TELEGRAM
27👍14🤔8👏21
Media is too big
VIEW IN TELEGRAM
📱 Google официально запустила Gemma 3n — новейшую открытую модель искусственного интеллекта для работы прямо на устройствах (смартфонах, планшетах, ноутбуках), способную обрабатывать текст, изображения, аудио и видео полностью офлайн, даже на устройствах с 2 ГБ оперативной памяти.

Бесплатный GPT | Экспертный канал
Please open Telegram to view this post
VIEW IN TELEGRAM
👍166🔥6👌2🤩1
🎮 Runway запустила Game Worlds — браузерный инструмент для создания текстовых приключенческих игр с генерацией изображений.

Пользователь пишет сюжет, а ИИ добавляет визуальные сцены. Платформа не требует кода и подходит для прототипов или простых историй. Позже появятся механики с очками, мультиплеер и видео.

Runway уже сотрудничает с Amazon в кино и обсуждает доступ к игровым датасетам. Есть вопросы по авторскому праву: модели обучены на чужом контенте. Платформа — шаг к ИИ, создающему полноценные виртуальные миры.

Сейчас платформа доступна в режиме бета — полный запуск ожидается в ближайшие недели.

Бесплатный GPT | Экспертный канал
Please open Telegram to view this post
VIEW IN TELEGRAM
16👍6👀3👎1
Please open Telegram to view this post
VIEW IN TELEGRAM
👍25🍓94🤡1
This media is not supported in your browser
VIEW IN TELEGRAM
🔬 Chai Discovery и OpenAI разработали Chai-2 — искусственный интеллект, который генерирует рабочие антитела для лечения различных заболеваний.

Обычно для поиска нужной молекулы приходится тестировать миллионы вариантов и тратить месяцы, а Chai-2 справляется за две недели, проверяя всего несколько десятков кандидатов. Это позволяет быстрее переходить к лабораторным испытаниям и экономит ресурсы.

В перспективе такие технологии упростят создание новых лекарств, сделают их доступнее и позволят быстрее реагировать на появление новых заболеваний или мутаций известных вирусов.

Бесплатный GPT | Экспертный канал
🔥16👌53👏3👎1
This media is not supported in your browser
VIEW IN TELEGRAM
Baidu открыла исходный код семейства моделей ERNIE 4.5 — это крупные мультимодальные ИИ, которые могут обрабатывать текст, изображения, аудио и видео.

Всего выпущено 10 вариантов, включая модели с архитектурой Mixture-of-Experts и максимальным размером до 424 млрд параметров.

Модели обучены на PaddlePaddle и доступны под лицензией Apache 2.0, что позволяет использовать их для исследований и разработки по всему миру. ERNIE 4.5 показывает сильные результаты в понимании языка, логике, генерации кода и мультимодальных задачах.

Бесплатный GPT | Экспертный канал
12👍4🤷‍♂3🤔2👎1
This media is not supported in your browser
VIEW IN TELEGRAM
Полностью сгенерировано в Higgsfield.

Изображения созданы с помощью технологии Higgsfield SOUL.
Сценическая согласованность достигнута через Kontext Flux.
Монтаж выполнен с использованием Canvas.

Финальные эффекты и анимация добавлены на завершающем этапе.
higgsfield.creators
higgsfield.ai

Бесплатный GPT | Экспертный канал
🔥208👎5😁2
This media is not supported in your browser
VIEW IN TELEGRAM
В Пекине прошёл первый в Китае турнир по футболу 3×3 среди гуманоидных роботов — и это было весело наблюдать.
🤖 На поле вышли четыре команды из топ-вузов.
Два робота отправились за кулисы на носилках — VAR для железяк пока не придумали.
🤹 Падения, запутанные ноги, периодические «а где мяч?» — всё полностью автономно, без подсказок людей.
Хорошая новость: наши рабочие места пока вне опасности — уровень игры всё ещё детсадовский.
Плохая новость: через пару лет может стать интереснее.

Бесплатный GPT | Экспертный канал
Please open Telegram to view this post
VIEW IN TELEGRAM
19🤣124👎3👀1
ThatNeedle Gist — расширение для Chrome и Firefox, которое добавляет в YouTube боковую панель с кратким AI-конспектом любого видео. Открыл ролик, кликнул на иконку — через пару секунд видишь основные тезисы, перевод субтитров и таймкоды.

Помогает просмотреть длинные лекции, вебинары или интервью, не пропуская важного, и экономит время на перемотках. Никаких учётных записей, размер всего пару десятков килобайт. Работает бесплатно, обновляется автоматически. Поддерживает светлую и тёмную темы, не собирает личные данные и открывается горячей клавишей при желании.

Бесплатный GPT | Экспертный канал
12👍5🔥3💋2👌1
This media is not supported in your browser
VIEW IN TELEGRAM
🔮Samsung подтвердил: домашний робот Ballie выходит летом 2025.

Шарообразный корпус перемещается по дому, собирает данные с камеры и датчиков, понимает голос. Интегрированная модель Gemini от Google Cloud обрабатывает текст, изображение и контекст, позволяя Ballie отвечать на вопросы, составлять расписания, напоминать о задачах.

Робот управляет светом, температурой, безопасностью, встречает гостей. Встроенный проектор выводит видео-звонки, тренировки или фильмы на любую поверхность. Цена пока не объявлена. Расширенные датчики помогают распознавать питомцев и автоматизировать сценарии.

Бесплатный GPT | Экспертный канал
Please open Telegram to view this post
VIEW IN TELEGRAM
20🔥8👏3👻3🗿2
This media is not supported in your browser
VIEW IN TELEGRAM
🩺 ИИ-прототип Microsoft MAI-DxO уже диагностирует точнее врачей

Новый исследовательский сервис сопоставили с 21 клиницистом на 304 труднейших случаях из NEJM.

🔴Верно поставил диагноз в ~85% эпизодов против 20% у экспертов-людей.
🔴Использует «консилиум» из нескольких LLM: GPT-4o, Gemini, Claude, Llama, Grok.
🔴Снижает число ненужных анализов — алгоритм штрафует за лишние назначения.
🔴Пока не сертифицирован, испытания шли только на описаниях историй болезни.
🔴Требуются клинические тесты и одобрение FDA/EMA.

MAI-DxO не заменяет врачей: система предлагает дифференциальный список, решение остаётся за клиницистом. Если пилоты подтвердят эффективность, подход «ИИ-консилиума» может сократить диагностические ошибки и расходы здравоохранения.

Бесплатный GPT | Экспертный канал
Please open Telegram to view this post
VIEW IN TELEGRAM
11🔥9😁6🐳1👀1
This media is not supported in your browser
VIEW IN TELEGRAM
Replit официально запустила «Dynamic Intelligence» для AI-агента — набор функций, который делает помощника заметно умнее и полезнее для сложных задач разработки.

Что включает Dynamic Intelligence:
🔴Extended Thinking – глубокое «размышление» агента с промежуточными выводами.
🔴High Power Mode – переключение с Claude Sonnet на более мощную модель Claude Opus.
🔴Web Search – встроенный интеллектуальный поиск в интернете для заполнения пробелов в знаниях.

Обновление уже развёртывается для всех пользователей. Переключатели видны сразу после появления новой версии интерфейса; постепенно они станут доступны на Free, Pro и Team-планах с указанными лимитами High Power-запросов.

Бесплатный GPT | Экспертный канал
Please open Telegram to view this post
VIEW IN TELEGRAM
8👍4🔥3😐2👀1
Media is too big
VIEW IN TELEGRAM
Timekettle выпускает наушники-переводчики с тремя режимами (Simul, Touch, Speaker): WT2 Edge переводит с задержкой до 3 с, «понимает» 40 языков и 93 диалекта, а офлайн-пакеты охватывают восемь популярных пар.

M3 добавляет ANC и режим прозрачности, W4 Pro хранит стенограммы и предлагает AI-репетитора. X1 автономен благодаря eSIM-связи.

Перевод работает через гибридный движок HybridComm, объединяющий серверы DeepL, Google, Microsoft и iFlytek.

Бесплатный GPT | Экспертный канал
21👍9🗿5🔥2👏1
Маск запустил XChat внутри соцсети X. Чаты и группы шифруются, телефон не спрашивают — достаточно профиля X. В бета-тесте приложение умеет исчезающие сообщения, файлы любого типа, а ещё голосовые и видеозвонки. Код написан на Rust, подробностей о протоколе пока нет. Пользователи беспокоятся о прозрачности шифрования, эксперты ждут аудита. Расширенный рол-аут обещан через несколько месяцев. Увидим, согласится ли публика менять привычные WhatsApp, Signal или Telegram на свежий инструмент. Всё решит удобство, доверие и время для каждого пользователя.

Бесплатный GPT | Экспертный канал
14🥴7🔥3🗿3👎2
This media is not supported in your browser
VIEW IN TELEGRAM
🗣 Conversational AI 2.0 от ElevenLabs — это инструмент для создания голосовых агентов, которые общаются естественно.
Он понимает, когда нужно говорить или слушать, распознает язык собеседника и поддерживает более 30 языков. Агенты работают как через голос, так и через текст, что удобно для разных ситуаций.

Бесплатный GPT | Экспертный канал
Please open Telegram to view this post
VIEW IN TELEGRAM
10🔥7👌5
Media is too big
VIEW IN TELEGRAM
📱 Google представил Veo 3 и открыл доступ по всему миру. Модель превращает текст в восьмисекундное видео с движением, светом и автогенерированным звуком. Работает внутри приложения Gemini и на Vertex AI, но только у платных подписчиков, три ролика в день. Каждый файл помечается видимым водяным знаком SynthID, чтобы не путать с реальностью. Для соцсетей этого хватит с головой. Ждём апдейт с image-to-video и более длинными клипами.

Бесплатный GPT | Экспертный канал
Please open Telegram to view this post
VIEW IN TELEGRAM
👍149🔥6😁5🗿5
🍏 Apple запатентовал революционный stacked-сенсор, который теоретически даёт 20 ступеней динамического диапазона и борется с шумом на уровне самого пикселя.

Если компания сумеет вывести технологию из лаборатории в серийное производство, будущий iPhone 17 Pro может впервые приблизить мобильную камеру к возможностям человеческого зрения – и переиграть даже профессиональные кинокамеры по диапазону. Пока же это захватывающая, но всё-таки патентная заявка: окончательные выводы сделаем после реальных тестов устройства.

Бесплатный GPT | Экспертный канал
Please open Telegram to view this post
VIEW IN TELEGRAM
26👏7🤣4🤡3👎2
2025/07/09 22:52:21
Back to Top
HTML Embed Code: