Найден годный конспект по LLM на русском языке
Авторы реально постарались, потому что раскрыто буквально все, что нужно, чтобы понять принцип работы современных моделей. Что внутри, если кратко:
– Необходимая математика: линал и матанализ на пальцах
– Все про механизм внимания и трансформеры
– Детальное объяснение процесса предобучения
– RL – с нуля до обучения ризонинг-моделей типа o3
– И даже полноценный гайд по тому, как самостоятельно зафайнтюнить модель.
Все – в иллюстрациях, схемах и интуитивно понятных примерах. Для наглядности прикладываю несколько страниц.
Забрать полную pdf-версию абсолютно бесплатно можно здесь
#промо
Авторы реально постарались, потому что раскрыто буквально все, что нужно, чтобы понять принцип работы современных моделей. Что внутри, если кратко:
– Необходимая математика: линал и матанализ на пальцах
– Все про механизм внимания и трансформеры
– Детальное объяснение процесса предобучения
– RL – с нуля до обучения ризонинг-моделей типа o3
– И даже полноценный гайд по тому, как самостоятельно зафайнтюнить модель.
Все – в иллюстрациях, схемах и интуитивно понятных примерах. Для наглядности прикладываю несколько страниц.
Забрать полную pdf-версию абсолютно бесплатно можно здесь
#промо
👍3
This media is not supported in your browser
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
StreamDiT: Real-Time Streaming Text-to-Video Generation
Генерация видео из текста в режиме реального времени, ресерч от Meta и ко.
Разрешение 512p, 16 fps на H100
Первая тройка видео - на модели 4B параметров
Вторая тройка видео - на модели 30B, не рилтайм
Кода нет
#realtime #text2video #research
Генерация видео из текста в режиме реального времени, ресерч от Meta и ко.
Разрешение 512p, 16 fps на H100
Первая тройка видео - на модели 4B параметров
Вторая тройка видео - на модели 30B, не рилтайм
Кода нет
#realtime #text2video #research
👍10
HumanOmniV2: From Understanding to Omni-Modal Reasoning with Context
Ресерч.
Если встретите название HumanOmniV2, не путайте его с OmniHuman
Проект HumanOmniV2 от Alibaba направлен на улучшение способности больших языковых моделей (LLM) понимать и интерпретировать человеческие намерения и эмоции через мультимодальные данные.
Если кому нужен код, вот
Код
#llm #research
Ресерч.
Если встретите название HumanOmniV2, не путайте его с OmniHuman
Проект HumanOmniV2 от Alibaba направлен на улучшение способности больших языковых моделей (LLM) понимать и интерпретировать человеческие намерения и эмоции через мультимодальные данные.
Если кому нужен код, вот
Код
#llm #research
huggingface.co
Paper page - HumanOmniV2: From Understanding to Omni-Modal Reasoning with Context
Join the discussion on this paper page
👍4
Media is too big
VIEW IN TELEGRAM
Проактивного ИИ-агента Proactor уже можно потестить
На бесплатном тарифе дают 30 минут транскрибации и 100 кредитов на прочие ИИ-ничтяки
Попробовать
#agent #realtime
На бесплатном тарифе дают 30 минут транскрибации и 100 кредитов на прочие ИИ-ничтяки
Попробовать
#agent #realtime
👍2🍌1
Dubnote
‼️ Бесплатную пожизненную подписку можно получить до 10 июля 11:00 МСК
iOS приложение для записи музыкальных идей
AI Split: автоматическое разделение аудио на секции.
- Smart & Manual Edits: возможность редактировать секции с помощью AI или вручную.
- Export Sections: экспорт отдельных секций в файлы .wav или .aac
- Auto-Tagging: автоматическое тегирование аудио.
- On-Device Speech-to-Text: преобразование речи в текст без подключения к интернету
Я до сих пор пользовался MusicMemo но тут кажется покруче
AppStore
#iOS #mobile #memo #assistant
iOS приложение для записи музыкальных идей
AI Split: автоматическое разделение аудио на секции.
- Smart & Manual Edits: возможность редактировать секции с помощью AI или вручную.
- Export Sections: экспорт отдельных секций в файлы .wav или .aac
- Auto-Tagging: автоматическое тегирование аудио.
- On-Device Speech-to-Text: преобразование речи в текст без подключения к интернету
Я до сих пор пользовался MusicMemo но тут кажется покруче
AppStore
#iOS #mobile #memo #assistant
Please open Telegram to view this post
VIEW IN TELEGRAM
👍3🔥2❤1😁1
Please open Telegram to view this post
VIEW IN TELEGRAM
🥴6🍌3🤷♂1🤔1🤯1
Media is too big
VIEW IN TELEGRAM
4DSloMo: 4D Reconstruction for High Speed Scene with Asynchronous Capture
Работа с участием NVIDIA.
Реконструкция #4D слоумошен сцены из видео с нескольких ракурсов, снятого обычными камерами в 25 fps. Эффективная частота кадров получается 100-200 fps
Под капотом 4D модель на гауссианах
Код ждем
#videoto4d #gaussian #4d
Работа с участием NVIDIA.
Реконструкция #4D слоумошен сцены из видео с нескольких ракурсов, снятого обычными камерами в 25 fps. Эффективная частота кадров получается 100-200 fps
Под капотом 4D модель на гауссианах
Код ждем
#videoto4d #gaussian #4d
👍5🤯1
This media is not supported in your browser
VIEW IN TELEGRAM
Perplexity Comet
Новый ИИ-браузер от Perplexity
Умный поиск Perplexity
Агентный поИСк
Умные вкладки
Блокировщик рекламы
Сейчас доступ дают только подписчикам MAX. Обещают в будущем бесплатный функционал.
Записаться в вейтлист
#search #browser
Новый ИИ-браузер от Perplexity
Умный поиск Perplexity
Агентный поИСк
Умные вкладки
Блокировщик рекламы
Сейчас доступ дают только подписчикам MAX. Обещают в будущем бесплатный функционал.
Записаться в вейтлист
#search #browser
👍4👎1
Forwarded from Метаверсище и ИИще (Sergey Tsyptsyn ️️)
This media is not supported in your browser
VIEW IN TELEGRAM
Higgsfield Soul ID
Тут были наезды на Higgsfield Soul, что у них лица слегка одинаковые и вообще похоже не на генерацию, а на вытаскивание максимально похожих из датасета.
На что разрабы ответили с помощью Higgsfield Soul ID
Это типа быстрая тренировка (внутренняя) лор под ВАШИ фотачки.
Теперь вы можете загрузить 10+ своих фотографий, и Soul создаст вашу версию, которая будет выглядеть, двигаться и вести себя как вы:
- остается неизменной независимо от угла, выражения лица или освещения
- почти никаких подсказок не требуется
Дальше резвитесь промптами.
https://higgsfield.ai/
@cgevent
Тут были наезды на Higgsfield Soul, что у них лица слегка одинаковые и вообще похоже не на генерацию, а на вытаскивание максимально похожих из датасета.
На что разрабы ответили с помощью Higgsfield Soul ID
Это типа быстрая тренировка (внутренняя) лор под ВАШИ фотачки.
Теперь вы можете загрузить 10+ своих фотографий, и Soul создаст вашу версию, которая будет выглядеть, двигаться и вести себя как вы:
- остается неизменной независимо от угла, выражения лица или освещения
- почти никаких подсказок не требуется
Дальше резвитесь промптами.
https://higgsfield.ai/
@cgevent
🔥2
Ты всё ещё делаешь это вручную?
Каждый день ты тратишь часы на рутину: контент, письма, отчёты... А ведь ИИ уже умеет это делать за тебя — быстрее и дешевле.
11–13 июля — бесплатный онлайн-интенсив от Дмитрия Ледовских:
«НЕЙРОПЕРЕЗАГРУЗКА-2025. Контент. Команда. Доход».
Ты узнаешь:
✔️ Как писать в 5 раз быстрее без потери качества
✔️ Как собрать ИИ-ассистентов без технарей и бюджета
✔️ Как автоматизировать продажи и уйти от «рукописных» воронок
🎁 Подарки за регистрацию:
— Чек-лист «10 промптов, которые заменят копирайтера»
— PDF: «Конструктор ИИ-команды»
— Гайд: «3 модели монетизации ИИ в твоей нише»
‼️ Успей зарегистрироваться → https://www.tg-me.com/LedovskihConsulting_bot?start=1107_tgp_bars1111
#промо
Каждый день ты тратишь часы на рутину: контент, письма, отчёты... А ведь ИИ уже умеет это делать за тебя — быстрее и дешевле.
11–13 июля — бесплатный онлайн-интенсив от Дмитрия Ледовских:
«НЕЙРОПЕРЕЗАГРУЗКА-2025. Контент. Команда. Доход».
Ты узнаешь:
✔️ Как писать в 5 раз быстрее без потери качества
✔️ Как собрать ИИ-ассистентов без технарей и бюджета
✔️ Как автоматизировать продажи и уйти от «рукописных» воронок
🎁 Подарки за регистрацию:
— Чек-лист «10 промптов, которые заменят копирайтера»
— PDF: «Конструктор ИИ-команды»
— Гайд: «3 модели монетизации ИИ в твоей нише»
‼️ Успей зарегистрироваться → https://www.tg-me.com/LedovskihConsulting_bot?start=1107_tgp_bars1111
#промо
🤷♂2