Telegram Web Link
Я с очередным гайдом — про Llama3

Вот шикарный гитхаб, на котором можно самому, словно Лего, собрать Llama 3. Причём там всё максимально пошагово и весь необходимый код прилагается, так что реально такое собрать даже если совсем не разбираешься. А если интересна теория, то можно спросить у нового чат GPT или Gemini.

За основу берутся веса лламы с официального сайта, ну а потом вся вот эта дребедень: трансформеры, эмбединги, матрицы, токенайзеры — всё ручками. Так что, как известно, лучший способ что-то понять — построить самостоятельно.

Ну а вишенка на торте — всё очень мило показывает аниме персонаж.

Делитесь потом результатами, если кто вдруг возьмётся.

Пора бы уже самому новые гайды какие-нибудь написать. Подкиньте идеи для гайдов и ликбезов в комментарии😉

Гайд на гитхабе

#туториал #ликбез
@ai_newz
This media is not supported in your browser
VIEW IN TELEGRAM
Мы наблюдаем невероятные гонки на ChatBot Arena в этом году. На графике показано, как менялся коэффициент Эло моделей от разных компаний. Коэффициент Эло - это метод для оценки рейтинга индивидуальных игроков, он изначально был использован в Шахматах, и его же применяют на Чатбот Арене.

Интересно, что из традиционных Биг-Техов в топах рейтинга есть только Google и Мета. Никакими Майкрософтами, Эплами и прочими нетфликсами тут не пахнет – хотя каждый из них вытается обучать свои модели.

Хоть недавняя преза у Гугла и была скучновата, нельзя отрицать, что они довольно быстро выбились в топ. И сейчас Gemini 1.5 Pro занимает второе место после GPT-4! А это прям классный результат, учитывая как сильно Гугл отставал все это время.

Еще в этом месяце появился довольно сильный игрок из Китая - 01.ai со своей Yi-Large-preview (ее в open-source нет). Но об этой модели я напишу позже.

@ai_newz
This media is not supported in your browser
VIEW IN TELEGRAM
Конечно же, первое, что пришло людям в голову, когда они получили в руки GPT-4o — это заставить их говорить друг с другом (даже OpenAI не удержались). Ну такое всегда с голосовыми ассистентами.

Вот, пожалуй, мой любимый вариант 😂

Орнул с того, как в конце они, как настоящие кожаные, начали просто ругаться, вообще игнорируя друг друга...

What a time to be alive!

Ориг

@ai_newz
У /r/LocalLlama новое развлечение

В сабреддите начали байтить компании на релиз моделей. Началось всё с Phi-3 - очень скоро после поста на реддите о том что как-то долго не релизят веса вышли обещанные Small и Medium размеры.

Но вдобавок к ним шли сюрпризы – Phi-3 Vision и подробнейший гайд, о том как пользоваться моделями семейства на любой кофеварке.

Сразу за этим этого вышло развести Mistral на релиз Mistral-7B-0.3 вместе с Mixtral-8x22B-0.3 (base. instruct), после чего на Reddit почувствовали вкус крови и начали последовательно пинговать разные компании и просить релизы.

Таким образом у Cohere, авторов Command R, выпросили Aya - многоязычные Instruct версии их моделей. Идут в размерах 8B (base версию, кстати, не релизили) и 35B, хорошо понимает 23 языка - бьёт на многоязычных бенчмарках Gemma и Mistral 7B/Mixtral 8x7B. Ждём Aya 104B, на базе Command R+ .

Прямо сейчас сабреддит ещё раз байтит Microsoft, просят веса BitNet 1.58 Bit.

Даже если это новый вид маркетинга, релиз новых моделей всё равно радует

@ai_newz
Ну че, парни и дамы, мы?

@ai_newz
На 4chan зачем-то слили Stable Audio 1.0
[UPD: Это все же 2.0]

Я скачал, запустил и качество там не очень. И не удивительно: даже вторая версия модели отстаёт от конкурентов, а эта, по ощущениям, отстаёт даже от MusicGen годовой давности.

Веса тут (как и со всеми утечками, ни в коем случае не трогайте ckpt, только safetensors)
Код

Лучше бы слили SD3

@ai_newz
This media is not supported in your browser
VIEW IN TELEGRAM
Яндекс впервые проведет Young Con — фестиваль про карьеру в IT и современные технологии

6000 участников
Более 10 часов нетворкинга и интерактивных активностей
9 тематических «миров», которые погрузят участников в разные сервисы компании
30 руководителей Яндекса, которые расскажут, как создаются технологии, а также поделятся опытом и советами, как начать карьеру в Яндексе

Фестиваль в стиле гик-приключения понравится тем, кто интересуются технологиями и хочет узнать больше про работу и возможности для развития в крупных IT-компаниях.
Young Con состоится 27 июня на Live Arena.

На фестивале станет известен победитель масштабного студенческого турнира по спортивному программированию «Баттл вузов». Участники команды-победителя разделят между собой призовой фонд в 1 млн рублей.

А в конце фестиваля выступят группы The Hatters и Хлеб.

Young Con пройдет в онлайн- и офлайн-формате. Чтобы попасть на фестиваль, нужно заполнить форму на сайте. У начинающих айтишников также будет возможность пройти экспресс-собеседование прямо во время ивента, чтобы в будущем получить приглашение на стажировку в Яндекс.

Регистрация уже открыта.
#промо
Есть такая настолькня RPG – DnD (Dungeon and Dragons). Но я как-то особо не видел чтобы говорили о возможности не просто ролплея с ЛЛМ, а полноценной игры с неограниченными возможностями и бесконечным количеством сюжетных линий, как в DnD.

Вот вам пример, который неведанно залетел в топ в gpt store. Там на выбор даже несколько сюжетов/сеттингов. Но можно и свой задать - я выбрал фентези.

Меня GPT запихнул в какой-то дремучий лес. Там я встретил какого-то подозрительного эльфа, и я ожидал, что сломаю сюжет, когда скажу, что посылаю на хрен этого старого подозрительного деда, но нет, игра продолжилась. Я пошёл дальше по лесу, и затем gpt-шка подкинула мне пару интересных испытаний: сначала на меня напал какой-то защитник леса. Я отправил его в ущелье (по сюжету я стоял на краю ущелья и на меня напал этот перепес недооборотень), потом я пробрался через поле, где летали каменные горгульи. Причём я отвлёк их небольшим костром, здесь прям подумать пишлось тк я не хотел ломать рп, говоря что я могу на изи забороть волшебных монстров. После добрался до какого-то замка, и там тоже было довольно интересно, и тд.

Если у вас есть премиумная подписка на GPT, то он еще по ходу игры будет и картинки генерить (в аттаче). Вот бы он еще и видео в риалтайме генерил, да еще и в 3D для Quest! 🎮 Ладно, что-то я замечтался - не все сразу.

Эта тема напоминает мне игру для тестирования из фильма "Игра Эндера" (ещё помните такой?). Как такое реализовать в современных тайтлах? Поговаривают, новый Baldur's Gate очень в этом преуспел, но самому проверить некогда🥲

Вот ссылка на эту игрушку, можно даже и без подписки потестить (с лимитом сообщений).

Я попытался экстрактнуть кастомный промпт, и он на удивление очень простой. Просто базовые инструкции и как начать диалог - всё. Я ожидал какой-то заготовленной истории или что-то типа того, чтобы хоть как-то запустить сюжет, но нет, гпт сам всё придумывает. Что удивительно, ведь сюжет реально неплохой.

Ставьте 🦄, если интересно про экстракшен промптов из кастомных gpt ; )

@ai_newz
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
эйай ньюз
Photo
Кажется, я в правом верхнем сегменте. Делитесь в комментах, в каком вы.
This media is not supported in your browser
VIEW IN TELEGRAM
Теперь погружаться в кроличью нору знаний можно не только с википедией, но и с GPT. Я потыкался немного, так очень классно учить новые концепты, надеюсь такое интерфейсное решение приживётся.

Интерфейс подсвечивает ключевые слова, на которые можно нажать и попросить LLM подробнее про них рассказать в контектсе текущей темы.

Попробовать можно тут. Только аккуратно – эта штука может конкретно затянуть!

@ai_newz
Маск привлёк в XAI инвестиций на $6 млрд в раунде B!

Деньги нужны явно на GPU - если Grok-2, для тренировки, нужно 20 тысяч H100, то для Grok-3 нужно будет уже 100 тысяч. Маск думает что AGI будет доступен в течении двух лет и пытается включиться в гонку, но эстимейты Илона никогда не были особо надёжными.

Ещё хочу сказать, что прошло меньше года с момента создания XAI в июле 2023, и они все это время неплохо двигаются и выкидывают модели в опенсорс.

Правда, Grok-1.5V так и не релизнули. Ждём!

@ai_newz
Стартовал прием научных статей для публикации в журнале «Доклады Российской академии наук. Математика, информатика, процессы управления» и его англоязычной версии Doklady Mathematics. У вас есть отличная возможность представить свое исследование перед научным сообществом на площадке конференции AI Journey. Более того, автор лучшей статьи получит 1 миллион рублей!

Дедлайн подачи статей — 20 августа. Статьи можно писать как на русском, так и на английском языках. Материалы должны быть новыми и актуальными, не опубликованными ранее. С более детальной информацией можно ознакомиться в Правилах отбора на сайте. Если у вас уже есть готовая статья или она почти завершена, обязательно участвуйте в отборе.

Подайте заявку, опубликуйте свое исследование в научном журнале крупнейшей конференции по ИИ и получите миллион рублей!

#промо
Вау, вау, вау. Microsoft официально запилил Copilot бота для Telegram. Если кто не в курсе, то это ChatGPT в интерфейсе от Microsoft.

И это реально официалный бот от Microsoft – вот анонос. Я такого совсем не ожидал. Кажется, БигТехи начинают осознавать потенциал Телеграма, ну либо Бинг просто ищет любые дополнительные источники трафика.

Наверное, это первое появление официального представителя компании-разработчика крупных LLM в Телеге.

Пообщаться можно тут: @CopilotOfficialBot. Он, гаденыш, правда, просит телефон верифицировать – мне такое не очень нравится.

ПС. В комментах пишут, что можно дать ему фейковый номер.

@ai_newz
Лучше поздно, чем никогда 😀– наконец делюсь своими впечатлениями от поездки в Калифорнию после нашего успешного апрельского релиза Imagine Flash в Meta-ai.

Я уже писал про то, как я организовал там тусовку с подписчиками в апреле. На самом деле у нас было даже две тусовки: одна маленька в грузинском ресторане в Менло Парк, другая в доме у одного из подписчиков недалеко от СФ.

Теперь хочу поделиться впечатлениями от поездки с точки зрения работы в Мете – ведь это и было моей основной целью поездки. У меня был план встретиться с коллегами и со всеми боссами лично, а так же отпраздновать успешный релиз.

Заранее назначил 1:1 встречи с четырьмя босами в цепочке от меня до Марка. Чем выше двигаешься по цепочке, тем больше разговоры удаляются от работы руками, и тем больше фокуса на стратегию и high-level цели. Со старшим VP у меня был всего 15-минутный митинг, но было очень круто поговорить с ним о стратегических планах в Gen AI, а также было приятно услышать от него лично, как он оценил мой проект Imagine Flash.

Почему такие встречи важны? Когда говоришь с топами напрямую, о тебе узнают и больше ценят твою работу и твой вклад, плюс всегда можно получить какой-нибудь нетривиальный совет по карьере от более опытных людей. Поэтому я всегда стараюсь выбивать время, чтобы пообщатсья c ними вживую.

Кроме запланированных встреч я всю неделю общался с людьми из своей команды (мы тренируем модели Emu и занимаеся visual synthesis) и с ребятами из соседних команд о смежных проектах. Дни были максимально плотные - митинги и кодинг. Я даже наладил режим, вставал в 6 утра, плавал в бассейне, затем завтракал и к 8 ехал офис, а завершал день после 18.

Так прошла вся неделя, кроме четверга. В этот день я впервые увидел Марка Цукерберга в живую, он делал Q&A для сотрудников на открытой сцене и отвечал на вопросы. Эх, жаль лично пообщаться не удалось 🙂

[продолжение в следующем посте]

#personal #карьера
@ai_newz
2024/05/29 02:46:26
Back to Top
HTML Embed Code: