Пришёл из отпуска, а тут yolov11!
Даже не выложил видео которое сегодня планировал:)
Ок, давайте быстренько глянем. В целом всё ожидаемо.
https://youtu.be/WUJMc4sDBMk
Даже не выложил видео которое сегодня планировал:)
Ок, давайте быстренько глянем. В целом всё ожидаемо.
https://youtu.be/WUJMc4sDBMk
YouTube
Ultralytics Yolo (Yolov11). Do you need it?
00:00:00 - Intro.
00:00:50 - The only comparison we have
00:01:53 - License. AGPL-3.
00:02:39 - OpenVino, TensorRT. But what about Qualcomm, RockChip, etc?
00:03:44 - Nvidia T4. The sad standard for comparison
00:05:25 - Code Base
00:06:50 - Augmentation…
00:00:50 - The only comparison we have
00:01:53 - License. AGPL-3.
00:02:39 - OpenVino, TensorRT. But what about Qualcomm, RockChip, etc?
00:03:44 - Nvidia T4. The sad standard for comparison
00:05:25 - Code Base
00:06:50 - Augmentation…
То что сегодня выйдет Yolov11 было понятно уже несколько дней назад. В конце прошлой недели была конференция YOLO Vision, где представили новую модель. Так что я подготовился заранее. Все 9 часов презентации я не посмотрел, но полистал в поисках хайлайтов и того о чём рассказыть:)
В презентации был один интересный момент. Sony рассказывала о своей новой технологии где совместило камеру и npu вычислитель (прямо как OAK, но на одном чипе). Я, как любитель таких железяк - попробовал загуглить и найти пример платы - но всё было пусто. Выглядело как что-то находящееся в глубокой разработке.
А сегодня внезапно вот это выходит - https://www.raspberrypi.com/news/raspberry-pi-ai-camera-on-sale-now/
Очень интересно теперь протестить.
В презентации был один интересный момент. Sony рассказывала о своей новой технологии где совместило камеру и npu вычислитель (прямо как OAK, но на одном чипе). Я, как любитель таких железяк - попробовал загуглить и найти пример платы - но всё было пусто. Выглядело как что-то находящееся в глубокой разработке.
А сегодня внезапно вот это выходит - https://www.raspberrypi.com/news/raspberry-pi-ai-camera-on-sale-now/
Очень интересно теперь протестить.
Raspberry Pi
Raspberry Pi AI Camera on sale now at $70 - Raspberry Pi
Create impressive vision AI applications with the Raspberry Pi AI Camera, on sale now at $70. Compatible with all Raspberry Pi models.
С момента моего прошлого обзора Edge плат прошло уже два года. И кажется, что с тех пор многое поменялось. Jetson уже не самая популярная плата (но самая удобная). Стало больше крупных игроков. Те кто были игроками второго плана (Hailo и Jetson) - стали де-факто стандартами.
За последний год было столько релизов Edge - плат сколько не было за предыдущие года два.
Пора делать новый обзор!
Мне кажется что он получился достаточно всеобъемлющим. И может его хватит на следующие пол года - год. Я попробовал уйти от прошлой логики где все платы были отбенчмарканы, так как их стало слишком много.
Удобнее всего читать статью. Но записал и видео, чтобы можно было посмотреть в фоне.
статья - https://medium.com/@zlodeibaal/cookbook-for-edge-ai-boards-2024-2025-b9d7dcad73d6 (не забывайте ваши хлопочки)
видео - https://youtu.be/wnMFBqDalnE
Возможно будет ещё версия на хабре, но пока не знаю.
За последний год было столько релизов Edge - плат сколько не было за предыдущие года два.
Пора делать новый обзор!
Мне кажется что он получился достаточно всеобъемлющим. И может его хватит на следующие пол года - год. Я попробовал уйти от прошлой логики где все платы были отбенчмарканы, так как их стало слишком много.
Удобнее всего читать статью. Но записал и видео, чтобы можно было посмотреть в фоне.
статья - https://medium.com/@zlodeibaal/cookbook-for-edge-ai-boards-2024-2025-b9d7dcad73d6 (не забывайте ваши хлопочки)
видео - https://youtu.be/wnMFBqDalnE
Возможно будет ещё версия на хабре, но пока не знаю.
Medium
Cookbook for Edge AI (2024–2025)
In this article, I will explain how to choose the best AI board for your Edge application, reviewing the market
Что-то не удержался.
Вчера вышел Depth Pro. По качеству монокулярного зрения впереди всего вокруг. Прямо звенящая резкость. А ещё "metric depth" из коробки. А главный то вопрос, главный.... Насколько это вообще сопоставимо с 3D камерами?:)
Давно хотел показать!
https://youtu.be/UQBIKsUQZOc
Вчера вышел Depth Pro. По качеству монокулярного зрения впереди всего вокруг. Прямо звенящая резкость. А ещё "metric depth" из коробки. А главный то вопрос, главный.... Насколько это вообще сопоставимо с 3D камерами?:)
Давно хотел показать!
https://youtu.be/UQBIKsUQZOc
YouTube
Depth Pro - monocular network from Apple. But can it do this?!
00:00:00 - Depth Pro: Sharp Monocular Metric Depth in Less Than a Second
00:02:44 - How stable is it?
00:06:00 - Comparison with OAK-D.
00:07:51 - Summary.
My LinkedIn - https://www.linkedin.com/in/maltsevanton/
My Telegram channel - https://www.tg-me.com/CVML_team…
00:02:44 - How stable is it?
00:06:00 - Comparison with OAK-D.
00:07:51 - Summary.
My LinkedIn - https://www.linkedin.com/in/maltsevanton/
My Telegram channel - https://www.tg-me.com/CVML_team…
Как и обещал - версия для Хабра. Поправил несколько мелочей, а так почти та же самая версия.
https://habr.com/ru/companies/recognitor/articles/846936/
https://habr.com/ru/companies/recognitor/articles/846936/
Хабр
Как готовить EdgeAI в 2024/2025 году
Есть у меня такое развлечение - разные платы для AI тестировать. Зачем? Я занимаюсь Computer Vision более 15 лет. Начинал с классического CV. Сейчас трансформеры и это всё. Но больше сейчас руковожу...
This media is not supported in your browser
VIEW IN TELEGRAM
Ахахаха, я запустил вышедшую пару часов назад контру. Графика и фпс примерно как в клубах конца 90х :D
Раз в год, под новый год, я делаю на канале пост с статистикой канала. С инсайтами про канал, с гипотезами и их проверкой. С тем насколько публике интересны какие темы. Почему? Люблю статистику:) И кажется, что части подписчиков тоже любопытно.
Статистика которую я смотрю - это youtube, tg, vk. И вся она более-менее ущербная. Youtube потому что GDPR, тут потому что мало инструментов. ВК потому что никто там не читает давно.
Долго собирался, и наконец накидал вопросов со статистикой которая мне любопытна - https://forms.gle/kLKiNMs7NFsY6rRM8
1) Опрос анонимный
2) Результатами поделюсь в итоговом посту за год
3) Рекламы, как вы знаете, на канале нет. Так что эти данные никак не повлияют на её содержание.
4) Возможно результаты как-то повлияют на контент, но это не точно.
5) Вопросы про канал сделал обязательными, а социологические сделал необязательными, если кому неудобно отвечать
Короче буду рад если ответите:)
Статистика которую я смотрю - это youtube, tg, vk. И вся она более-менее ущербная. Youtube потому что GDPR, тут потому что мало инструментов. ВК потому что никто там не читает давно.
Долго собирался, и наконец накидал вопросов со статистикой которая мне любопытна - https://forms.gle/kLKiNMs7NFsY6rRM8
1) Опрос анонимный
2) Результатами поделюсь в итоговом посту за год
3) Рекламы, как вы знаете, на канале нет. Так что эти данные никак не повлияют на её содержание.
4) Возможно результаты как-то повлияют на контент, но это не точно.
5) Вопросы про канал сделал обязательными, а социологические сделал необязательными, если кому неудобно отвечать
Короче буду рад если ответите:)
Google Docs
Опрос канала @CVML_team
Давно хотелось немного понять тенденции того кто меня читает. Это не будет использоваться ни для какой рекламы, чисто для моего любопытства + по результатам, ближе к концу года будет пост аналогичный прошлым двум годам где поделюсь всей этой статистикой:…
Уже почти год живу в Норвегии. Понятно, что 95% заказов из-за пределов Норвегии, но какие-то знакомства тут есть, иногда помогаем местным робототехникам, записываем демки у них и общаемся с людьми. Так что немного посмотрел на то как тут ML и AI выглядит.
Понятно, что это видео не под тему основного канала, так что выложил на втором.
https://youtu.be/JPOicvpTGLw
Понятно, что это видео не под тему основного канала, так что выложил на втором.
https://youtu.be/JPOicvpTGLw
YouTube
Есть ли AI в Норвегии?
Мой основной канал @AntonMaltsev
В моём большом обзоре 3D камер который был весной не было камеры ORBBEC. А ведь это один из известных производителей. Впервые с их камерами я работал ещё в 2014 году.
И что-то ни у кого рядом этой камеры не было.
Так что я написал им напрямую с вопросом - а не хотят ли они прислать камеру чтобы про неё было отдельное видео. Теперь у меня есть ещё одна камера для роботов, а у вас - ещё один обзор. Считаю для всех win-win:)
https://youtu.be/kMLQuPLUq-M
Мне камера по конструктиву понравилась. Но главный вопрос сегодня. А кто-то вообще использует оригинальный 3D выход с камер? Или все уже сетками считают?
И что-то ни у кого рядом этой камеры не было.
Так что я написал им напрямую с вопросом - а не хотят ли они прислать камеру чтобы про неё было отдельное видео. Теперь у меня есть ещё одна камера для роботов, а у вас - ещё один обзор. Считаю для всех win-win:)
https://youtu.be/kMLQuPLUq-M
Мне камера по конструктиву понравилась. Но главный вопрос сегодня. А кто-то вообще использует оригинальный 3D выход с камер? Или все уже сетками считают?
YouTube
Orbbec Gemini 335L. Let's check how it's working.
00:00:00 - Intro
00:01:52 - What are the direct competitors of 335L?
00:11:02 - Installing on Linux
00:12:15 - Complex objects overview (dark, curved, shiny, complex light, windows)
00:14:40 - What about reconstruction with neural networks?
If you…
00:01:52 - What are the direct competitors of 335L?
00:11:02 - Installing on Linux
00:12:15 - Complex objects overview (dark, curved, shiny, complex light, windows)
00:14:40 - What about reconstruction with neural networks?
If you…
После прошлого видео было удивительно много вопросов про то как вообще работает оценка глубины по стерео, как её запустить, и всякое такое. Попробовал в этом видео разобрать общую теорию.
https://youtu.be/mEs_8vxxSqI
Если зайдёт - попробую ещё сделать оценку точности для разных методов.
https://youtu.be/mEs_8vxxSqI
Если зайдёт - попробую ещё сделать оценку точности для разных методов.
YouTube
Depth estimation. From the theory to the Edge.
My big video about the comparison of different neural networks - https://youtu.be/JmZdSGtJHNw
My big article about different approaches of stereo reconstruction for 3D cameras - https://medium.com/@zlodeibaal/3d-cameras-in-2022-choosing-a-camera-for-cv-project…
My big article about different approaches of stereo reconstruction for 3D cameras - https://medium.com/@zlodeibaal/3d-cameras-in-2022-choosing-a-camera-for-cv-project…
Полтора года назад я говорил что должны появиться NPUшки с уже заваренными в них нейронками, где ничего нельзя будет настраивать и всё будет из коробки. Зато дешево.
И что бы вы думали?
Они действительно начали появляться (50$). Пока что без изображений. Но это уже LLM + SST из коробки. Вообще без понятия на какие языки оно работает и насколько. Но прямо любопытно даже когда будут модули с VLM.
Я думал сделать видео про RK3588 с такими двумя сетками, но сейчас даже не думаю что надо, раз такое есть.
Как думаете, скоро будем скиллы для роботов отдельными картриджами покупать?
И что бы вы думали?
Они действительно начали появляться (50$). Пока что без изображений. Но это уже LLM + SST из коробки. Вообще без понятия на какие языки оно работает и насколько. Но прямо любопытно даже когда будут модули с VLM.
Я думал сделать видео про RK3588 с такими двумя сетками, но сейчас даже не думаю что надо, раз такое есть.
Как думаете, скоро будем скиллы для роботов отдельными картриджами покупать?
Дополз до тестов Hailo. Первое что мне хотелось посмотреть - а насколько Hailo вообще будет работать на разных платах. И, на удивление, все оказалось очень неплохо.
1) Заработало почти везде
2) Там где не заработало - вопрос скорее к вендорам железа, а не к Hailo
В ближайшие дни попробую ещё сделать небольшую статью с обзором как всё это дело запускать. А пока что видео с результатами бенчмарков
https://youtu.be/cUXSZcNgSz8
1) Заработало почти везде
2) Там где не заработало - вопрос скорее к вендорам железа, а не к Hailo
В ближайшие дни попробую ещё сделать небольшую статью с обзором как всё это дело запускать. А пока что видео с результатами бенчмарков
https://youtu.be/cUXSZcNgSz8
YouTube
How fast is Hailo-8L with boards other than RPi5?
00:00:00 - Intro
00:00:48 - How easy is it to run Hailo on a random board?
00:01:07 - How is the speed related to PCLe lines and protocol?
00:01:25 - Is the inference speed related to the CPU?
00:01:48 - Our players: RPi5, NanoPC-t6 (RK3588), RockPi…
00:00:48 - How easy is it to run Hailo on a random board?
00:01:07 - How is the speed related to PCLe lines and protocol?
00:01:25 - Is the inference speed related to the CPU?
00:01:48 - Our players: RPi5, NanoPC-t6 (RK3588), RockPi…
Так, обещанная статья про запуск Hailo на разных платах. Никакой магии, но всё собрано в одном месте с ссылками и возможными проблемами.
https://medium.com/@zlodeibaal/how-to-run-hailo-on-arm-boards-d2ad599311fa
https://medium.com/@zlodeibaal/how-to-run-hailo-on-arm-boards-d2ad599311fa
Medium
How to run Hailo on ARM boards
Recently, I tested Hailo on different Edge boards. I was interested to see how much Hailo speed depends on the PCIe bus and how much it…
После прошлых видео про 3D было много вопросов про точность, сравнение методов, и.т.д.
Решил сделать несколько наглядных примеров.
Тут в видео их разобрал (в комментах видео с примерами):
https://youtu.be/JnCCvnI8-jY
Решил сделать несколько наглядных примеров.
Тут в видео их разобрал (в комментах видео с примерами):
https://youtu.be/JnCCvnI8-jY
YouTube
A short sample: Classic stereo Depth vs. Neural stereo Depth vs. Monocular depth.
00:00:00 - Intro.
00:01:52 - The first example
00:02:36 - The second example
Stereo on the Edge - https://youtu.be/mEs_8vxxSqI
Stereo vs mono - https://youtu.be/UQBIKsUQZOc
My LinkedIn - https://www.linkedin.com/in/maltsevanton/
My Telegram channel…
00:01:52 - The first example
00:02:36 - The second example
Stereo on the Edge - https://youtu.be/mEs_8vxxSqI
Stereo vs mono - https://youtu.be/UQBIKsUQZOc
My LinkedIn - https://www.linkedin.com/in/maltsevanton/
My Telegram channel…
Я уже затрагивал тему прототипирования. Какие сетки для этого нужны. И решил сделать небольшую подборку с топом того что сегодня разумно использовать. Часто с удивлением узнаю что люди не знают часть этих сеток
https://youtu.be/mPXjE5AB9oA
https://youtu.be/mPXjE5AB9oA
YouTube
Using big pre-trained models for prototyping
00:00:00 - Intro.
00:01:07 - Big VLM: ChatGPT, Qwen2 VL, LLAMA/LLAVA, NVLM, Molmo, etc.
00:03:38 - Grounding Dino, Grounding SAM, Florence 2, etc.
00:06:25 - SAM, SAM2
00:07:51 - CLIP, DINOv2, etc.
00:10:38 - From prototype to production.
My LinkedIn…
00:01:07 - Big VLM: ChatGPT, Qwen2 VL, LLAMA/LLAVA, NVLM, Molmo, etc.
00:03:38 - Grounding Dino, Grounding SAM, Florence 2, etc.
00:06:25 - SAM, SAM2
00:07:51 - CLIP, DINOv2, etc.
00:10:38 - From prototype to production.
My LinkedIn…
Доступ к статистике YouTube канала иногда даёт интересные инсайты. Например можно посмотреть какое маркетинговоре решение было верным. Или посмотреть на то как растёт популярность разных платформ со временем.
На этом графике статистика моего видео про Hailo-8 выпущенного два года назад. Как вы думаете в какой точке графика Hailo объявило партнёрство с RaspberryPi и они выпустили AIHat? :)
На этом графике статистика моего видео про Hailo-8 выпущенного два года назад. Как вы думаете в какой точке графика Hailo объявило партнёрство с RaspberryPi и они выпустили AIHat? :)
Заметки Computer Vision инженера
Я уже затрагивал тему прототипирования. Какие сетки для этого нужны. И решил сделать небольшую подборку с топом того что сегодня разумно использовать. Часто с удивлением узнаю что люди не знают часть этих сеток https://youtu.be/mPXjE5AB9oA
Небольшое дополнение к прошлому видел. Выложил на втором канале.
Попробовал подробнее рассказать "а как вообще все эти VLM должны менять взгляд бизнеса на ML". Но не со стороны "сейчас промптов напишем и зашибём миллиарды", а со стороны "а что в реальности можно срезать за счет использования больших претрейнов, а что лучше оставить как есть".
https://youtu.be/E-vROjyjEQw
Попробовал подробнее рассказать "а как вообще все эти VLM должны менять взгляд бизнеса на ML". Но не со стороны "сейчас промптов напишем и зашибём миллиарды", а со стороны "а что в реальности можно срезать за счет использования больших претрейнов, а что лучше оставить как есть".
https://youtu.be/E-vROjyjEQw
YouTube
Как современные LLM/VLM меняют подходы для ML ориентированных компаний?
Мой основной канал @AntonMaltsev
Мой TG канал - https://www.tg-me.com/CVML_team
Мой TG канал - https://www.tg-me.com/CVML_team
После каждого видео о 3D камере кто-нибудь да спрашивает: "А какую 2D камеру мне выбрать?". Когда пускаешься в пространные размышления про оптику, типы матриц и протоколы, человек всё равно перебивает и говорит: "Не, ну вот у меня проект простой, что выбрать то?!". И понимаешь всё бессилие.
Ведь зачастую "настроить камеру" для стартапа это 50% от работы. Понять куда вешать, как крепить, куда подключать. Но не кажется эта задача сравнимой с "сделать супер крутой AI алгоритм". Так, на пол часа.
У меня на канале было несколько отдалённых видео на эту тему. Но какого-то всеобъемлющего гайда я всё не решался сделать. Но слово за слово, обсудив с несколькими товарищами - решил таки написать статью. Писал её последний месяц, медленно шла, структура часто менялась. Понимаю, что она неполна, внутренне противоречива. Но очень надеюсь что достаточна чтобы любой человек который взялся строить свою систему - примерно понимал что надо делать, с чего начинать, и какие ключевые слова есть.
Я попросил трех человек, которые хорошо разбираются в своих областях, накидать идей и покритиковать. Считаю что их идеи были очень классными и помогли мне заметить много пропущенных лакун. Но... Многие из этих идей противоречили друг другу. Что лишь показывает что тема реально сложная, и есть очень много взглядов на то как решать этот вопрос.
Итак.
1) Видео - https://youtu.be/5ZTO4PPQ9Uo
2) Статья - https://medium.com/@zlodeibaal/how-to-choose-a-camera-for-a-computer-vision-project-1da6490bb3dd
Если просмотров / прочтений будет достаточно много - продублирую на хабр. Но пока что на это сил не хватило:)
Ведь зачастую "настроить камеру" для стартапа это 50% от работы. Понять куда вешать, как крепить, куда подключать. Но не кажется эта задача сравнимой с "сделать супер крутой AI алгоритм". Так, на пол часа.
У меня на канале было несколько отдалённых видео на эту тему. Но какого-то всеобъемлющего гайда я всё не решался сделать. Но слово за слово, обсудив с несколькими товарищами - решил таки написать статью. Писал её последний месяц, медленно шла, структура часто менялась. Понимаю, что она неполна, внутренне противоречива. Но очень надеюсь что достаточна чтобы любой человек который взялся строить свою систему - примерно понимал что надо делать, с чего начинать, и какие ключевые слова есть.
Я попросил трех человек, которые хорошо разбираются в своих областях, накидать идей и покритиковать. Считаю что их идеи были очень классными и помогли мне заметить много пропущенных лакун. Но... Многие из этих идей противоречили друг другу. Что лишь показывает что тема реально сложная, и есть очень много взглядов на то как решать этот вопрос.
Итак.
1) Видео - https://youtu.be/5ZTO4PPQ9Uo
2) Статья - https://medium.com/@zlodeibaal/how-to-choose-a-camera-for-a-computer-vision-project-1da6490bb3dd
Если просмотров / прочтений будет достаточно много - продублирую на хабр. Но пока что на это сил не хватило:)
YouTube
Choosing a 2d camera for Computer Vision product: The Сomprehensive Guide
Article - https://medium.com/@zlodeibaal/how-to-choose-a-camera-for-a-computer-vision-project-1da6490bb3dd
Pavel - https://www.linkedin.com/in/pavelryabenko/
Yuriy - https://www.linkedin.com/in/yuriy-bukhtiyarov-74790b20/
Andrey - https://www.linkedin.c…
Pavel - https://www.linkedin.com/in/pavelryabenko/
Yuriy - https://www.linkedin.com/in/yuriy-bukhtiyarov-74790b20/
Andrey - https://www.linkedin.c…
Последние пару месяцев смотрю как все поголовно переходят на Сursor для питона. Интересно стало насколько это массово. Что используете вы? Если Сursor - то платную или бесплатную версию? Советуете?
Anonymous Poll
10%
Сursor
52%
VS Code
29%
PyCharm
2%
Spyder/IDLE/Eclipse прочие IDE
17%
Jupyter
9%
Текстовые редакторы (блокнот/vi/nano)
11%
Кто такой Питон?
Ещё с лета у меня лежала Rock 5C Lite. Наконец добрался её позапускать недавно. Ожидал что будут какие-то проблемы, но нет. Реально одна из самых лучших плат сейчас (если смотреть по компромиссу удобства, цены и скорости). В отдельности по каждой характеристики, естественно есть варианты лучше. Думаю что на следующей неделе выпущу ещё одно видео про рокчип.
https://youtu.be/eFI08oQN4rA
https://youtu.be/eFI08oQN4rA
YouTube
Is the Radxa Rock5C Lite (RK3582) one of the best boards for hobby Computer Vision Right now?
My LinkedIn - https://www.linkedin.com/in/maltsevanton/
My Telegram channel - https://www.tg-me.com/CVML_team
e-mail: [email protected]
Twitter - https://twitter.com/Serious_WK
Video about:
Hailo on different boards - https://youtu.be/cUXSZcNgSz8
RK3576 - http…
My Telegram channel - https://www.tg-me.com/CVML_team
e-mail: [email protected]
Twitter - https://twitter.com/Serious_WK
Video about:
Hailo on different boards - https://youtu.be/cUXSZcNgSz8
RK3576 - http…