Telegram Web Link
То что сегодня выйдет Yolov11 было понятно уже несколько дней назад. В конце прошлой недели была конференция YOLO Vision, где представили новую модель. Так что я подготовился заранее. Все 9 часов презентации я не посмотрел, но полистал в поисках хайлайтов и того о чём рассказыть:)

В презентации был один интересный момент. Sony рассказывала о своей новой технологии где совместило камеру и npu вычислитель (прямо как OAK, но на одном чипе). Я, как любитель таких железяк - попробовал загуглить и найти пример платы - но всё было пусто. Выглядело как что-то находящееся в глубокой разработке.
А сегодня внезапно вот это выходит - https://www.raspberrypi.com/news/raspberry-pi-ai-camera-on-sale-now/
Очень интересно теперь протестить.
С момента моего прошлого обзора Edge плат прошло уже два года. И кажется, что с тех пор многое поменялось. Jetson уже не самая популярная плата (но самая удобная). Стало больше крупных игроков. Те кто были игроками второго плана (Hailo и Jetson) - стали де-факто стандартами.
За последний год было столько релизов Edge - плат сколько не было за предыдущие года два.
Пора делать новый обзор!
Мне кажется что он получился достаточно всеобъемлющим. И может его хватит на следующие пол года - год. Я попробовал уйти от прошлой логики где все платы были отбенчмарканы, так как их стало слишком много.
Удобнее всего читать статью. Но записал и видео, чтобы можно было посмотреть в фоне.
статья - https://medium.com/@zlodeibaal/cookbook-for-edge-ai-boards-2024-2025-b9d7dcad73d6 (не забывайте ваши хлопочки)
видео - https://youtu.be/wnMFBqDalnE
Возможно будет ещё версия на хабре, но пока не знаю.
Что-то не удержался.
Вчера вышел Depth Pro. По качеству монокулярного зрения впереди всего вокруг. Прямо звенящая резкость. А ещё "metric depth" из коробки. А главный то вопрос, главный.... Насколько это вообще сопоставимо с 3D камерами?:)
Давно хотел показать!
https://youtu.be/UQBIKsUQZOc
This media is not supported in your browser
VIEW IN TELEGRAM
Ахахаха, я запустил вышедшую пару часов назад контру. Графика и фпс примерно как в клубах конца 90х :D
Раз в год, под новый год, я делаю на канале пост с статистикой канала. С инсайтами про канал, с гипотезами и их проверкой. С тем насколько публике интересны какие темы. Почему? Люблю статистику:) И кажется, что части подписчиков тоже любопытно.
Статистика которую я смотрю - это youtube, tg, vk. И вся она более-менее ущербная. Youtube потому что GDPR, тут потому что мало инструментов. ВК потому что никто там не читает давно.

Долго собирался, и наконец накидал вопросов со статистикой которая мне любопытна - https://forms.gle/kLKiNMs7NFsY6rRM8
1) Опрос анонимный
2) Результатами поделюсь в итоговом посту за год
3) Рекламы, как вы знаете, на канале нет. Так что эти данные никак не повлияют на её содержание.
4) Возможно результаты как-то повлияют на контент, но это не точно.
5) Вопросы про канал сделал обязательными, а социологические сделал необязательными, если кому неудобно отвечать

Короче буду рад если ответите:)
Уже почти год живу в Норвегии. Понятно, что 95% заказов из-за пределов Норвегии, но какие-то знакомства тут есть, иногда помогаем местным робототехникам, записываем демки у них и общаемся с людьми. Так что немного посмотрел на то как тут ML и AI выглядит.
Понятно, что это видео не под тему основного канала, так что выложил на втором.
https://youtu.be/JPOicvpTGLw
В моём большом обзоре 3D камер который был весной не было камеры ORBBEC. А ведь это один из известных производителей. Впервые с их камерами я работал ещё в 2014 году.
И что-то ни у кого рядом этой камеры не было.
Так что я написал им напрямую с вопросом - а не хотят ли они прислать камеру чтобы про неё было отдельное видео. Теперь у меня есть ещё одна камера для роботов, а у вас - ещё один обзор. Считаю для всех win-win:)
https://youtu.be/kMLQuPLUq-M

Мне камера по конструктиву понравилась. Но главный вопрос сегодня. А кто-то вообще использует оригинальный 3D выход с камер? Или все уже сетками считают?
После прошлого видео было удивительно много вопросов про то как вообще работает оценка глубины по стерео, как её запустить, и всякое такое. Попробовал в этом видео разобрать общую теорию.
https://youtu.be/mEs_8vxxSqI
Если зайдёт - попробую ещё сделать оценку точности для разных методов.
Полтора года назад я говорил что должны появиться NPUшки с уже заваренными в них нейронками, где ничего нельзя будет настраивать и всё будет из коробки. Зато дешево.
И что бы вы думали?
Они действительно начали появляться (50$). Пока что без изображений. Но это уже LLM + SST из коробки. Вообще без понятия на какие языки оно работает и насколько. Но прямо любопытно даже когда будут модули с VLM.
Я думал сделать видео про RK3588 с такими двумя сетками, но сейчас даже не думаю что надо, раз такое есть.

Как думаете, скоро будем скиллы для роботов отдельными картриджами покупать?
Дополз до тестов Hailo. Первое что мне хотелось посмотреть - а насколько Hailo вообще будет работать на разных платах. И, на удивление, все оказалось очень неплохо.
1) Заработало почти везде
2) Там где не заработало - вопрос скорее к вендорам железа, а не к Hailo
В ближайшие дни попробую ещё сделать небольшую статью с обзором как всё это дело запускать. А пока что видео с результатами бенчмарков
https://youtu.be/cUXSZcNgSz8
Так, обещанная статья про запуск Hailo на разных платах. Никакой магии, но всё собрано в одном месте с ссылками и возможными проблемами.
https://medium.com/@zlodeibaal/how-to-run-hailo-on-arm-boards-d2ad599311fa
После прошлых видео про 3D было много вопросов про точность, сравнение методов, и.т.д.
Решил сделать несколько наглядных примеров.
Тут в видео их разобрал (в комментах видео с примерами):
https://youtu.be/JnCCvnI8-jY
Я уже затрагивал тему прототипирования. Какие сетки для этого нужны. И решил сделать небольшую подборку с топом того что сегодня разумно использовать. Часто с удивлением узнаю что люди не знают часть этих сеток
https://youtu.be/mPXjE5AB9oA
Доступ к статистике YouTube канала иногда даёт интересные инсайты. Например можно посмотреть какое маркетинговоре решение было верным. Или посмотреть на то как растёт популярность разных платформ со временем.
На этом графике статистика моего видео про Hailo-8 выпущенного два года назад. Как вы думаете в какой точке графика Hailo объявило партнёрство с RaspberryPi и они выпустили AIHat? :)
Заметки Computer Vision инженера
Я уже затрагивал тему прототипирования. Какие сетки для этого нужны. И решил сделать небольшую подборку с топом того что сегодня разумно использовать. Часто с удивлением узнаю что люди не знают часть этих сеток https://youtu.be/mPXjE5AB9oA
Небольшое дополнение к прошлому видел. Выложил на втором канале.
Попробовал подробнее рассказать "а как вообще все эти VLM должны менять взгляд бизнеса на ML". Но не со стороны "сейчас промптов напишем и зашибём миллиарды", а со стороны "а что в реальности можно срезать за счет использования больших претрейнов, а что лучше оставить как есть".
https://youtu.be/E-vROjyjEQw
После каждого видео о 3D камере кто-нибудь да спрашивает: "А какую 2D камеру мне выбрать?". Когда пускаешься в пространные размышления про оптику, типы матриц и протоколы, человек всё равно перебивает и говорит: "Не, ну вот у меня проект простой, что выбрать то?!". И понимаешь всё бессилие.
Ведь зачастую "настроить камеру" для стартапа это 50% от работы. Понять куда вешать, как крепить, куда подключать. Но не кажется эта задача сравнимой с "сделать супер крутой AI алгоритм". Так, на пол часа.
У меня на канале было несколько отдалённых видео на эту тему. Но какого-то всеобъемлющего гайда я всё не решался сделать. Но слово за слово, обсудив с несколькими товарищами - решил таки написать статью. Писал её последний месяц, медленно шла, структура часто менялась. Понимаю, что она неполна, внутренне противоречива. Но очень надеюсь что достаточна чтобы любой человек который взялся строить свою систему - примерно понимал что надо делать, с чего начинать, и какие ключевые слова есть.
Я попросил трех человек, которые хорошо разбираются в своих областях, накидать идей и покритиковать. Считаю что их идеи были очень классными и помогли мне заметить много пропущенных лакун. Но... Многие из этих идей противоречили друг другу. Что лишь показывает что тема реально сложная, и есть очень много взглядов на то как решать этот вопрос.
Итак.
1) Видео - https://youtu.be/5ZTO4PPQ9Uo
2) Статья - https://medium.com/@zlodeibaal/how-to-choose-a-camera-for-a-computer-vision-project-1da6490bb3dd
Если просмотров / прочтений будет достаточно много - продублирую на хабр. Но пока что на это сил не хватило:)
Последние пару месяцев смотрю как все поголовно переходят на Сursor для питона. Интересно стало насколько это массово. Что используете вы? Если Сursor - то платную или бесплатную версию? Советуете?
Anonymous Poll
10%
Сursor
52%
VS Code
29%
PyCharm
2%
Spyder/IDLE/Eclipse прочие IDE
17%
Jupyter
9%
Текстовые редакторы (блокнот/vi/nano)
11%
Кто такой Питон?
Ещё с лета у меня лежала Rock 5C Lite. Наконец добрался её позапускать недавно. Ожидал что будут какие-то проблемы, но нет. Реально одна из самых лучших плат сейчас (если смотреть по компромиссу удобства, цены и скорости). В отдельности по каждой характеристики, естественно есть варианты лучше. Думаю что на следующей неделе выпущу ещё одно видео про рокчип.
https://youtu.be/eFI08oQN4rA
2025/06/30 07:41:26
Back to Top
HTML Embed Code: