Telegram Web Link
Forwarded from Machinelearning
✔️ Google представила новые геопространственные модели для анализа данных.

Google анонсировала запуск тестовой программы новых геопространственных и Population Dynamics моделей.

Эти инструменты объединяют генеративный ИИ (под капотом - Gemini), с данными спутниковых снимков и социальными индексами, чтобы ускорить анализ в сферах урбанистики, экологии и кризисного управления.

Модели позволяют находить объекты по описанию («дороги с заторами»), сегментировать ландшафты и предсказывать динамику населения. Интеграция с Google Cloud и Earth Engine дает разработчикам возможность для создания собственных решений — от медиапланирования до мониторинга сельхозугодий.

Первыми тестерами стали Airbus, Maxar и Planet Labs: они используют модели для анализа спутниковых данных в реальном времени. Сейчас доступ к моделям открыт через программу Trusted Tester, а детали Google обещает раскрыть в ближайшие месяцы.

🔗 research.google

@ai_machinelearning_big_data

#google #geospatialreasoning
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
📦 ML Crate — структурированная песочница для ML-экспериментов. Проект предлагает начинающим чёткий шаблон для своих работ: от датасетов и Jupyter-ноутбуков до готовых веб-приложений на Flask/Streamlit.

Проект предлагает начинающим чёткий шаблон для своих работ: от датасетов и Jupyter-ноутбуков до готовых веб-приложений на Flask/Streamlit.

Важно, что репозиторий не просто хранит код, а учит правильному workflow:
▪️отдельные папки для данных, визуализаций и моделей
◾️обязательные requirements.txt и README-файлы


🔗 GitHub

@bigdatai
This media is not supported in your browser
VIEW IN TELEGRAM
🌟 HunyuanPortrait: высокое качество анимации портретов

Новая технология от Hunyuan, превращающая статичные изображения в реалистичную анимацию с беспрецедентной чёткостью и стабильностью!

🆕 Что нового?
1⃣ Статичное изображение превращается → живое видео
2⃣ Невероятная реалистичность: Implicit Control + Stable Video Diffusion
3⃣ Плавность и сверхчёткая детализация в анимации лица и головы

Легко адаптируется под любые стили изображений.

Анимация создается по одному фото, нужен только видео-референс в качестве шаблона для генерации.

Работает в один клик
Синхронные мимика и движения головы
Сохраняется черте даже при смене стиля

🟡 Проект
🟡 ArXiv
🟡Github (Коммент от разработчиков - проходим внутреннюю проверку перед открытым исходным релизом и загрузим код и веса сразу после её завершения.)

#Hunyuan
Please open Telegram to view this post
VIEW IN TELEGRAM
📌 Kor — прототип для извлечения структуры из текста через LLM

Проект имеет интеграцию с LangChain, но предлагает свой подход: вместо JSON-режима или function calling он полагается на шаблонизацию промптов. Это позволяет работать даже с моделями, не поддерживающими новые режимы вроде GPT-4-turbo.

Новая версия 1.0.0 принесла совместимость с Pydantic v2, хотя разработчики предупреждают, что работа может заметно замедлиться

🤖 GitHub

@bigdatai
⚡️Строим рекомендательную систему фильмов на Kaggle

Вы когда-нибудь хотели сделать свою собственную систему рекомендаций фильмов? 🎬

Приходите на бесплатный вебинар, где Савелий Батурин, Senior ML-Engineer и преподаватель курса по ML школы Simulative в прямом эфире покажет как построить рекомендательную систему фильмов на Kaggle.

Что будем делать на вебинаре:
🟠Разберем имеющиеся данные фильмов с их оценками
🟠Проведем предобработку данных
🟠Построим рекомендательную систему на основе машинного обучения
🟠Проведем расчет и анализ метрик на основе результатов работы модели

Вебинар будет интересен как новичкам, так и уже опытным специалистам

😶Зарегистрироваться на бесплатный вебинар
Please open Telegram to view this post
VIEW IN TELEGRAM
👾 Griptape — фреймворк для создания AI-приложений без головной боли. В отличие от популярных решений вроде LangChain, акцент сделан на модульность: можно легко менять провайдеров LLM, векторных БД или инструментов поиска, не переписывая бизнес-логику.

В инструменте есть встроенные механизмы для работы с памятью и готовые движки для частых задач: суммаризации, извлечения структурированных данных и даже оценки качества ответов моделей.

🤖 GitHub

@bigdata_ai
✔️ Википедия выпустила датасет для обучения ИИ.

Википедия представила структурированный датасет на платформе Kaggle, чтобы облегчить разработчикам ИИ доступ к данным и снизить нагрузку на свою инфраструктуру. Вместо парсинга сырого текста ботамы, теперь доступны JSON-файлы на английском и французском языках с разделами статей, краткими описаниями, инфобоксами и ссылками на изображения.

Датасет оптимизирован для ML-задач: файнтюна моделей, анализа и тестирования. Это часть стратегии Викимедии, которая не только экономит ресурсы Википедии, но и упрощает работу с контентом — вместо борьбы с ботами разработчики получают готовый инструмент.

enterprise.wikimedia.com
Please open Telegram to view this post
VIEW IN TELEGRAM
🧪 Ragas — инструмент для объективной оценки LLM-приложений.

Платформа предлагает data-driven подход к тестированию языковых моделей, заменяя субъективные оценки точными метриками. С помощью Ragas можно не только анализировать качество ответов, но и автоматически генерировать тестовые датасеты, приближенные к реальным сценариям использования.

Проект выделяется глубокой интеграцией с популярными фреймворками — от LangChain до инструментов мониторинга. Особенно полезен при построении RAG-систем, где важен постоянный контроль качества на основе production-данных.

🤖 GitHub

@bigdatai
📂 Dot — локальный чат с документами на базе Phi-3.5. Этот проект выделяется на фоне корпоративных решений вроде Chat with RTX от Nvidia своей простотой и доступностью.

Разработанный студентом как side-проект, Dot предлагает минималистичный интерфейс для не-программистов, но при этом сохраняет всю мощь современных RAG-технологий под капотом.

Особенности:
▪️Готовые сборки для Windows и macOS
▪️Поддержка мультидокументных запросов
▪️Режим обычного чата без привязки к файлам

🔗 GitHub

@bigdatai
🔥 GhidrAssist — это плагин для Ghidra, предназначенный для интеграции локальных больших языковых моделей с целью облегчения процесса исследования бинарных файлов и реверс-инжиниринга!

🌟 Он поддерживает любые модели на основе LLaMA, такие как llama3.1:8b, а также другие модели, включая DeepSeek и ChatGPT.

🔐 Лицензия: MIT

🖥 Github

@bigdatai
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥 MiniCPM-o 2.6 — это мощная языковая модель с 8 млрд параметров, разработанная OpenBMB! Она поддерживает текст, изображения, видео и аудио, а также обеспечивает высококачественные ответы на естественном языке. Производительность модели сравнима с GPT-4o-202405, особенно в обработке мультимодального контента.

💡 Особенности MiniCPM-o включают расширенные возможности оптического распознавания символов (OCR), улучшенное понимание видео и поддержку голосовых диалогов в реальном времени на английском и китайском языках. Модель может адаптировать тембр, скорость и эмоции речи, что делает её полезной для голосовых ассистентов и интерактивных приложений.

🔐 Лицензия: Apache-2.0

🖥 Github

@bigdatai
Please open Telegram to view this post
VIEW IN TELEGRAM
⚡️Легкий способ получать свежие обновления и следить за трендами в разработке на вашем языке. Находите свой стек и подписывайтесь:

Python: www.tg-me.com/pythonl
Linux: www.tg-me.com/linuxacademiya
Собеседования DS: www.tg-me.com/machinelearning_interview
Нерйросети www.tg-me.com/ai_machinelearning_big_data
C++ www.tg-me.com/cpluspluc
Docker: www.tg-me.com/DevopsDocker
Хакинг: www.tg-me.com/linuxkalii
Devops: www.tg-me.com/DevOPSitsec
Data Science: www.tg-me.com/data_analysis_ml
Javascript: www.tg-me.com/javascriptv
C#: www.tg-me.com/csharp_ci
Java: www.tg-me.com/javatg
Базы данных: www.tg-me.com/sqlhub
Python собеседования: www.tg-me.com/python_job_interview
Мобильная разработка: www.tg-me.com/mobdevelop
Golang: www.tg-me.com/Golang_google
React: www.tg-me.com/react_tg
Rust: www.tg-me.com/rust_code
ИИ: www.tg-me.com/vistehno
PHP: www.tg-me.com/phpshka
Android: www.tg-me.com/android_its
Frontend: www.tg-me.com/front
Big Data: www.tg-me.com/bigdatai
МАТЕМАТИКА: www.tg-me.com/data_math
Kubernets: www.tg-me.com/kubernetc
Разработка игр: https://www.tg-me.com/gamedev
Haskell: www.tg-me.com/haskell_tg
Физика: www.tg-me.com/fizmat

💼 Папка с вакансиями: www.tg-me.com/addlist/_zyy_jQ_QUsyM2Vi
Папка Go разработчика: www.tg-me.com/addlist/MUtJEeJSxeY2YTFi
Папка Python разработчика: www.tg-me.com/addlist/eEPya-HF6mkxMGIy
Папка ML: https://www.tg-me.com/addlist/2Ls-snqEeytkMDgy
Папка FRONTEND: https://www.tg-me.com/addlist/mzMMG3RPZhY2M2Iy

😆ИТ-Мемы: www.tg-me.com/memes_prog
🇬🇧Английский: www.tg-me.com/english_forprogrammers
🧠ИИ: www.tg-me.com/vistehno

🎓954ГБ ОПЕНСОРС КУРСОВ: @courses
📕Ит-книги бесплатно: https://www.tg-me.com/addlist/BkskQciUW_FhNjEy
🎬 FunClip — open-source ИИ для автоматического монтажа видео

Alibaba представила любопытный инструмент для автоматической нарезки видео с помощью ИИ. FunClip использует speech-to-text модели, чтобы преобразовывать речь в текст с таймкодами, а затем вырезать нужные фрагменты.

Система поддерживает кастомизацию: можно задавать ключевые слова для улучшения распознавания или выбирать реплики конкретного человека. В последней версии добавили LLM-фичи — например, GPT и Qwen могут анализировать субтитры и предлагать моменты для монтажа.

🤖 GitHub

@bigdatai
This media is not supported in your browser
VIEW IN TELEGRAM
🚀 Transformer Lab — персональная лаборатория для работы с LLM прямо на ноутбуке или сервере!

▪️ Один бинарник — скачивай, запускай, дообучай и сравнивай модели (Llama 3, Mistral, Gemma, Qwen, Phi 4 и сотни других) в пару кликов.
▪️ Поддержка движков Transformers, vLLM, Llama CPP и MLX для Apple Silicon.
▪️ Fine-tune, RLHF (DPO / ORPO / SIMPO), встроенный RAG-конструктор и галерея датасетов Hugging Face.
▪️ Быстрые бенчмарки, чат-UI и REST API для прототипов.
▪️ Работает на Windows, macOS (M-чипы full power!) и Linux; можно разделять UI и backend.
▪️ Полностью open-source (AGPL-3.0) — подключай плагины или пиши свои.

💻 Проверь репозиторий: github.com/transformerlab/transformerlab-app
Собери свою LLM-песочницу и ускорь эксперименты сегодня!

https://github.com/transformerlab/transformerlab-app
Forwarded from Machinelearning
🦾 Berkeley Humanoid Lite — открытый человекоподобный робот

Калифорнийский университет Беркли представил проект Humanoid Lite — результат многолетних исследований и экспериментов по созданию простых в производстве человекоподобных роботов.

Платформа полностью придерживается принципов Open Hardware: в ней используются свободно распространяемое ПО, серийные комплектующие, доступные в розничной продаже, а также детали, напечатанные на 3D-принтере.

🌟 100 % open-source под MIT-лицензией: прошивки, схемы, BOM, STL-модели, RL-контроллеры
✔️ Open Hardware: доступные в рознице электро- и мехкомпоненты, детали печатаются на обычном FDM-принтере
➡️ Итоговая стоимость сборки — примерно 5 000 USD
⭐️ Модульная конструкция: легко превращается в квадропода или «кенавроподобного» робота
➡️ Экосистема: Isaac Lab / Isaac Sim / MuJoCo, телеметрия через SteamVR-контроллеры

Что доступно:

- Исходный код робота на C++ и Python
- Модели машинного обучения для контроллера движений
- Чертежи пластиковых деталей
- Полный список комплектующих с ссылками на покупку
- Пошаговый сборочный план
- Симуляционные окружения для тренировки и запуска робота


🌟 Что робот умеет уже сейчас
- локомоция: RL-контроллер приводит в заданную точку
- телеприсутствие: человек управляет манипулятором через VR-контроллеры
- навигация: экспериментальные алгоритмы обхода препятствий
- поддержка мелкой моторики

🔥 Как удалось удешевить:
- пластиковые шестерни, напечатанные на 3D-принтере
- циклоидные редукторы, повышающие надёжность пластика
- использование типовых драйверов и контроллеров без кастомных плат

*Clone → Print → Build → Hack!* 🤓

🔜 Проект
🔜 Код
🔜 Схемы

@ai_machinelearning_big_data


#robots #ai #ml #opensource
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
2025/07/01 07:03:48
Back to Top
HTML Embed Code: