Telegram Web Link
🔥 Cherry Studio — приложение для работы с разными моделями ИИ, такими как OpenAI, Anthropic, Gemini и другими!

🌟 Оно предназначено для использования на Windows, Mac и Linux, и включает в себя функции для работы с текстами, изображениями, PDF и другими форматами. Пользователи могут создавать кастомных ассистентов, а также управлять данными через WebDAV и интегрировать визуализацию с помощью Mermaid. Приложение поддерживает темы, синхронизацию данных и возможность работы с несколькими моделями ИИ одновременно.

🔐 Лицензия: Apache-2.0

🖥 Github

@machinelearning_ru
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥72👍1
Forwarded from Machinelearning
🌟 Google только что выпустили новую модель Gemini 2.0 Flash Thinking

Контекст с 1 миллионом токенов (5-х больше, чем o1 Pro)

#1 на арене чат-ботов
👑

Модель показала наивысший результат, обогнав Gemini-Exp-1206

+ 17 очков прироста по сравнению с предыдущей контрольной точкой 1219

- №1 по всем направлениям (генерации кода), за исключением управления стилем.

• AIME: 73.3%
• GPQA: 74.2%
• MMMU: 75.4%

Модель доступна в ai-gradio

pip install --upgrade "ai-gradio[gemini]"

Они так же выпустили Gemini2.0 Pro.

https://aistudio.google.com/prompts/new_chat?model=gemini-2.0-flash-thinking-exp-01-21

#google #gemini
Please open Telegram to view this post
VIEW IN TELEGRAM
1🤔1
🔥 DeepSeek Engineer — это мощный помощник для разработки кода, интегрированный с API DeepSeek для обработки пользовательских запросов и генерации структурированных JSON-ответов!

🌟 Через интуитивно понятный интерфейс командной строки он может считывать содержимое локальных файлов, создавать новые файлы и в реальном времени применять изменения к существующим файлам.

💡 Основные возможности DeepSeek Engineer включают автоматическую настройку клиента для использования сервиса DeepSeek с действительным ключом API, поддержку различных моделей данных для безопасной обработки файловых операций и использование системных подсказок для обеспечения строгого соответствия ответов JSON-формату. Кроме того, он предоставляет функции для чтения локальных файлов, создания новых файлов и применения изменений, а также поддерживает команду "/add" для быстрого добавления содержимого файла в разговор.

🖥 Github

@machinelearning_ru
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥74🤯3🥰2🤔2
🖥 ChatGPT получил новую функцию под названием Operator, которая позволяет ему управлять вашим компьютером.

Эта впечатляющая возможность была недавно продемонстрирована, и она способна взять на себя множество рутинных задач, таких как обработка электронной почты, заказ еды и работа с таблицами в Excel.

Тестировщики начнут получать доступ к этой функции уже сегодня.

https://openai.com/index/introducing-operator/
Please open Telegram to view this post
VIEW IN TELEGRAM
👍12👎82🔥2
📖 Эта статья посвящена задаче токенизации, которая в данном контексте рассматривается как задача сжатия набора данных до определенного числа символов!

🌟 Исследователи доказали NP-полноту двух вариантов токенизации: первый — это прямая токенизация, при которой создается словарь для представления данных, второй — токенизация снизу вверх, где используется последовательность операций объединения элементов. Оба этих метода могут быть использованы для сжатия данных и определения минимального количества символов для представления данных в сокращенной форме.

🔗 Читать: *клик*

@machinelearning_ru
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥6
🔥 Minima — это open source решение для RAG в контейнерах для развертывания на любых мощностях (клауд или локал), с возможностью интеграции с ChatGPT и MCP.

Minima также может использоваться как RAG на вашей машине.

Minima поддерживает три режима работы:

1. Изолированная установка — Работа в контейнерах без внешних зависимостей, таких как ChatGPT или Claude. Все нейронные сети (LLM, ранкер, эмбеддинг) и векторный сторедж запускаются на вашем сервере или ПК, обеспечивая безопасность ваших данных.
2. Кастомный GPT — Запросы к вашим локальным документам через приложение или веб-версию ChatGPT с использованием кастомных GPT. Индексатор работает на вашем сервере или локальном ПК, а основная LLM остаётся ChatGPT.
3. Anthropic Claude — Использование приложения Anthropic Claude для запросов к вашим локальным документам. Индексатор работает на вашем локальном ПК, а основная LLM — это Anthropic Claude.

В данный момент, Minima решает задачу RAG on-premises и призывает всех поставить звезду и форкнуть репозиторий, а так же не стесняться и принять участие в разработке.

📌 Лицензия MPL-2.0

Github

@machinelearning_ru
👍75🥰3👎1
This media is not supported in your browser
VIEW IN TELEGRAM
🔥 Llama 3.2 с ультрареалистичным звуком

> поддерживает клонирование голоса на английском и китайском языках
> обучен на 250 тысяч часов аудио
> модели 1B, 3B (скоро будет 8B)
> эмоциональная речь (счастье, сердитая речь, грустная, шепот)

> открытые весы и работа с трансформерами/ vllm

https://huggingface.co/HKUSTAudio/Llasa-3B
👍112🔥1
🔥 Kimi-k1.5 — это модель для генерации текста с открытым исходным кодом, разработанная MoonshotAI!

🌟 Она основана на современных архитектурах трансформеров и ориентирована на задачи создания контента, таких как написание текста, обработка языка и создание диалогов. Модель также обгоняет ChatGPT и Claude в бенчмарках.

🖥 Github

@machinelearning_ru
Please open Telegram to view this post
VIEW IN TELEGRAM
👍53👎2🔥2
This media is not supported in your browser
VIEW IN TELEGRAM
👩🍳🍽️ Pic2Cook

Мгновенно превращайте любую картинку с едой в подробный рецепт и список покупок.

Приложение написано на базе
MistralAI Pixtral 12B.

git clone https://github.com/sophiamyang/pic2cook.git
cd pic2cook


Github
👍7🔥32
Forwarded from Machinelearning
🖤 Open R1

Разработчики с Hugging Face повторил полный цикл разработки DeepSeek - от сбора данных до обучения! 🔥

Цель этого репозитория - объяснить все части конвейера создания R1 таким образом, чтобы каждый мог повторить его или построить поверх него свой проект.

Из чего состоит проект:
- src/open_r1 содержит скрипты для обучения и оценки моделей, а также для генерации синтетических данных:
- grpo.py : обучение модели с помощью GRPO
- sft.py: простой SFT
- evaluate.py: оценка модели на основе тестов R1.
- generate.py: генерация синтетических данных с помощью Distilabel.
- Makefile содержит простую в выполнении команду для каждого шага конвейера R1.

Github

@ai_machinelearning_big_data


#opensource #DeepSeekR1 #huggingface #OpenR1
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥26👍63
🔥 Ultravox — мультимодальная LLM, которая может работать как с текстом, так и с аудио в реальном времени!

🌟 В отличие от традиционных систем, Ultravox не требует отдельного этапа распознавания речи (ASR) — аудио напрямую преобразуется в высокоразмерное пространство, используемое языковой моделью. Это обеспечивает высокую скорость обработки и позволяет модели учитывать такие аспекты речи, как эмоции и тайминг.

💡 Ultravox был обучен с использованием моделей, таких как Llama 3, Mistral и Gemma, и достигает впечатляющих показателей производительности, например, время до первого токена (TTFT) составляет около 150 мс. Модель поддерживает потоковую обработку аудио в текст, а в будущем планируется реализация обратного преобразования текста в аудио. Ultravox доступен для тестирования через локальные Gradio-демоверсии и может быть развернут для более сложных случаев использования, таких как работа в реальном времени.

🔐 Лицензия: MIT

🖥 Github

@machinelearning_ru
Please open Telegram to view this post
VIEW IN TELEGRAM
👍43🔥1
⭐️ Загружается Новый Qwen

Версия Qwen2.5-VL.

https://huggingface.co/collections/Qwen/qwen25-vl-6795ffac22b334a837c0f9a5

@machinelearning_ru
Please open Telegram to view this post
VIEW IN TELEGRAM
👍52
Forwarded from Machinelearning
💰 Банк Китая выделит 1 триллион юаней (137 миллиардов долларов) в течение 5 лет для противостояния США в гонке искусственного интеллекта.

Это прямой ответ на проект «Звездные врата».

Евросоюз: максимум, что мы можем сделать, — это выделить 10 миллиардов на ИИ регулирование.

#ai #news #stargate #llm
Please open Telegram to view this post
VIEW IN TELEGRAM
👍212🔥2🤔2👎1
🖥Offline альтернативы ChatGPT

https://github.com/janhq/jan
5👎1
Forwarded from Machinelearning
🐋 DeepSeek только что выпустила еще одну модель ИИ с открытым исходным кодом, Janus-Pro-7B.

Она мультимодальная и выигрывает у OpenAI DALL-E 3 и Stable Diffusion на бенчмарках GenEval и DPG-Bench.

Модели
: https://huggingface.co/deepseek-ai/Janus-Pro-7B
https://huggingface.co/deepseek-ai/Janus-Pro-1B
Quickstart: https://github.com/deepseek-ai/Janus?tab=readme-ov-file#3-quick-start 📖
Tech report: https://github.com/deepseek-ai/Janus/blob/main/janus_pro_tech_report.pdf

@ai_machinelearning_big_data


#ai #deepseek #opensource #Janus
🔥16👍6😁4
🔥 Agent Service Toolkit — полный набор инструментов для создания и управления сервисом AI-агентов!

🌟 Построенный на базе LangGraph, FastAPI и Streamlit, он включает сервер для обслуживания агентов, интерфейс для взаимодействия с ними и чат-приложение с пользовательским интерфейсом. Проект предоставляет готовый шаблон для быстрой разработки проектов на основе LangGraph.

💡 Основные функции включают поддержку потоковой передачи токенов и сообщений, модерацию контента с использованием LlamaGuard, асинхронный дизайн для эффективной обработки запросов, а также интеграцию с LangSmith для обратной связи.

🔐 Лицензия: MIT

🖥 Github

@machinelearning_ru
Please open Telegram to view this post
VIEW IN TELEGRAM
5👍1
Forwarded from Machinelearning
⚡️NVIDIA выпустили Eagle 2 — 1B, 2B и 9B VLM.

Eagle 2 - это обновление семейство мощных vision language моделей.

Модель 9B
превосходит GPT4o ChartQA, OCRBench и MathVista, а также Llama 3.2 Vision 90B и llava 70B 🔥

Может работать с длинным контекстом, поддерживает 4K, HD.

> Eagle2-9B превосходит InternVL2-8B и MiniCPM-v2.6 по всем 14 тестам
> Он превосходит Qwen2-VL-7B в 9 из 14 тестов и превосходит его в OpenCompass
> Конкурирует с более крупными моделями, такими как InternVL2-26B, LLaVa-OneVision-72B и LLaMa-3.2-90B-Vision
> Eagle2-9B превосходит GPT-4o на ChartQA, OCRBench и MathVista и близок к GPT-4o на DocVQA, MMStar, AI2D и OpenCompass
> В открытом доступе выложены модель и чекпоинты

🤗Hf: https://huggingface.co/collections/nvidia/eagle-2-6764ba887fa1ef387f7df067

@ai_machinelearning_big_data


#eagle #nvidia #vision #ml #ai
Please open Telegram to view this post
VIEW IN TELEGRAM
6🔥3👍1😁1
😁31🔥52
2025/07/11 22:00:58
Back to Top
HTML Embed Code: