Telegram Web Link
А вы?:)
________________________________
🔥 - СNN остались
❤️ - Трансформеры только!
😱 - XGBoost, зачем CNN?!
💩 - О чем это?!
________________________________

Вообще, как мне кажется, это возможно в сегодняшнем мире. Но:
1) У вас должны быть подходящие вычислители (которые быстро молотят трансформеры и позволяют просто экспортнуть на них сетки).
2) У вас должны быть хорошие мощности для обучения.
3) Большие (очень большие) датасеты. В первую очередь для претрейна, но неплохо и для целевых задач.
4) Достаточно много людей которые могут все это настроить.

Очевидно, что у Тэслы это есть. И очевидно что для 90% задач это не надо.

P.S. - в комментах ссылка на оригинальный пост, это из срача Маска и ЛеКуна
P.S.S. - Если я правильно помню прошлый опрос в канале, то в проде трансформеры для детекции были всего у десятка процентов компаний.
На прошедшем Embedded World мне перепал бесплатный MAX780000. Это достаточно интересная плата от Analog Devices. Там есть нативная поддержка PyTorch, низкое энергопотребление, нормальная документация. На практике, как мне кажется, плата очень специфичная и почти бесполезная в Computer Vision.
Наверное, она имеет смысл для аналитики какого-то звука, или внетренних параметров систем. Но. Зачем брать эту плату которая дороже RV1106? Энергопотребление? Малый процент задач.
Но посмотреть интересно!
https://youtu.be/0gUnF3mSXCc
Мне понравились сегодняшние новости про RPi Hailo AI kit. По сути Hailo, как я и говорил пару месяцев назад, де-факто стало третьей платформой после Nvidia и Intel для инференса нейронок. Самое интересное в этом релизе - Hailo открывает свободную регистрацию чтобы получать документацию и форум где можно обмениваться опытом. Кажется что такая тесная интеграция с комьюнити - это очень важный шаг которого я ждал последние полтора года от них. Плата не может стать массовой пока нет сообщества и точек обмена информацией. И в этом плане официальная интеграция с RPi - лучшее что могло случиться. Теперь RPi рекомендует использовать именно Hailo!
Хотел напомнить что у меня есть несколько видео про Hailo на канале:
1) Недавнее видео с множеством трюков как надо использовать Hailo.
2) Видео конца 22 года где я рассказываю базовые идеи работы с Hailo и сравниваю с другими платформами
Кстати, про эту лекцию. Ребята запарились и по ней сделали домашнее задание на реальных бордах рокчиповских. Все пошло хорошо, не считая наводнения в промежутке, после которого пришлось менять часть сетапа.

На фото три платы залитые водой сквозь закрытое окно:)
И снова всем привет!
Недавно в LinkedIn перезалил своё видео про сравнение YOLOv(N) c YOLOv(N+1). Оно собрало 100к просмотров. Я понимаю, что там треть смотрящих и комментирующих сарказма не выкупило. Но забавно.
Решил написать на этот повод подробный гайд. А нужно ли вообще пихать в прод N+1 версию модели когда у вас крутиться в проде N. Вопрос не столь однозначный, так что попробовал расписать все возможные варианты. Так что ловите статью.
Скорее всего я на хабр версию тоже сделаю, но пока только такая:)
То самое видео в линкедине.
Заметки Computer Vision инженера
И снова всем привет! Недавно в LinkedIn перезалил своё видео про сравнение YOLOv(N) c YOLOv(N+1). Оно собрало 100к просмотров. Я понимаю, что там треть смотрящих и комментирующих сарказма не выкупило. Но забавно. Решил написать на этот повод подробный гайд.…
Кстати, про биасы нейронок. Ничего нового, но все же. Когда генерил заглавную картинку для статьи выше (через DALLE-2) запрос был такого плана: "Super crazy Data Scientist and his Super Crazy manager want to integrate the new Computer Vision model. Madness around. A lot of madness, everyone crazy." Картинки были похожи на вот эти две.
Мне они не нравились так как слишком много деталек и недостаточно безумно. Но спустя какое то время и лишь штук пять сгенерённых картинок до меня дошло. Датасайнтист всегда китаец а его менеджер - девушка с африканскими/южноамериканскими мотивами. Если не указывать какие-то другие характеристики персонажей.
Media is too big
VIEW IN TELEGRAM
Затестил MASA (Matching Anything By Segmenting Anything). Код появился пару часов назад. Последние пару дней вокруг этого трекера нагоняли массу хайпа. "Решение проблемы трекинга", "универсальный трекер". Было сразу понятно что "meh", но все же решил потестить. Ожидаемо работает так себе. Но прикольно что это из коробки.
Разбор всех проблем и ограничений этого трекера сделаю в отдельном видео, может быть сегодня успею либо завтра.
Так. В дополнение к тесту выше сделал видео про MASA.
Показываю несостыковки в статье + куда смотреть в примерах, где трекер сильно лажает.
В целом всё равно приятно что из коробки. Но далеко от идеала все ещё.
https://youtu.be/XZJFMOntJ2A
На тему того чем хороший DS отличается от плохого меня спрашивали давно. Понятно, что видео не совсем по тем темам на которые у меня большинство видео. Но иногда полезно проговорить. И явно может быть полезно тем людям которые хотят сформировать свой взгляд на эти вопросы.
Опять же, давно не было видео на русском, надо добавить;)
Так что немного воскресного трёпа.
https://youtu.be/RS_H3GXRSnA
Вчера схватил немного культурного кринжа.
В английском фраза "Средняя температура по больнице" не считывается, так как не имеет контекста. Мне кажется это важнейшее описание особенностей статистик для выборок с большим числом кластеров! Пришлось пояснять:)
Наконец дополз затестить OrangePi AiPro.
Это плата на базе Huawei. Интересная плата:
1) Скорость почти как у RK3588 на максималках (но без возни с 12 потоками)
2) Насквозь китайская. Информации вне китайского интернета нет от слова совсем.
3) Сделаная хорошо.

Короче реально интересное комбо, интересно было изучить. Мне немного сложно придумать проекты где плата будет лучше Рокчипа, особенно вне Китая. Но представить в теории могу.

Так как в видео было ОЧЕНЬ много ссылок на разные ресурсы - через пару дней сделаю статью где будет все собрано. Плюс уже когда записал видео - нашел пару интересных апдейтов.

https://youtu.be/qK7GHV_cH98
На прошлой неделе выступал онлайн на конференции DataDay, которую проводил Евгений, с которым недавно было интервью на канале. Сделал видео с небольшим форком выступления. Пять наиболее очевидных причин почему ваше Computer Vision решение не будет работать.
https://youtu.be/2gzXSoHdG0k
Возможно ещё сделаю версию более приближенную к докладу на конфе.
Всем привет!
Я стараюсь вести этот канал больше про Computer Vision и вокруг. Есть пару тем которые более менее за кадром, но про которые могу рассказать достаточно много. Одна из них это стартапы. Как оцениваются, как привлекают инвестиции, в чем разница Европы и Америки, почему в Америке выгодно инвестировать ангелам, на что смотрят инвесторы, что из CV сейчас в треде, сколько ресерча должно быть в стартапе, чем инвестиции отличаются от гранта, итд.
Я не считаю себя прямо экспертом в этом, но насмотрелся порядочно, сам участвовал во многих и на самых разных страдиях. А если вдруг на какие то вопросы ответить не смогу - всегда могу спросить.
Давайте попробуем так. Под этим постом задавайте ваши вопросы, если их соберётся достаточно - запишу видео с ответами на вопросы и рассказом про все.
(З.Ю. фоточка с прошедшей конфы, она как раз была где то между CV и бизнесом, прошлый мой пост был про CV часть)
Заметки Computer Vision инженера
Всем привет! Я стараюсь вести этот канал больше про Computer Vision и вокруг. Есть пару тем которые более менее за кадром, но про которые могу рассказать достаточно много. Одна из них это стартапы. Как оцениваются, как привлекают инвестиции, в чем разница…
Так. Вопросов было много. Попробовал ответить на все. Решил для этого использовать не свой основной канал, а старый вспомогательный. А то тема совсем не про Computer Vision. Пусть будет в другом месте.
Несколько моментов. Был популярный вопрос про обзор стартапов про Computer Vision, его в конце рассмотрел. В видео обзора нет, рассказываю почему. Но если будет много интересных вариантов - сделаем.
https://youtu.be/ndaXJdPTI-E
Привет!
Пока новые платы где-то в доставке и в ближайшее время не предвидятся - я захотел сделать пачку интересных интервью. Мне понравились вопросы которые в прошлый раз вы накидали. Давайте попробуем так же с интервью?
Первое интервью будет с легендарным Вовой. Ternaus не только GM в Kaggle, одна из самых известных фигур в ODS, но и один из авторов автопилота от Lyft. Сейчас он основной мэйнтейнер Albumentations (думаю что 90% читателей так или иначе им пользовались, даже если не знали об этом).
Именно про Albumentations я и хочу поговорить с ним. Почему спустя несколько лет Вова решил вернуться к проекту, как сейчас можно зарабатывать на Open Source, чем Open Source похож на стартап, и.т.д.
Но, понятно, можно не ограничиваться этими топиками. Всё в ваших руках!:)
О, по Data Day 2024 выложили записи докладов!
Так что тем кто не осилил прошлое видео на английском, то вот русская версия(она чуть короче).
А вот тут все остальные записи докладов и панельных дискуссий. Некоторые панельные дискуссии были супер интересные.
Большое спасибо Евгению за приглос и проведение.
2025/06/30 20:09:01
Back to Top
HTML Embed Code: