В этом году я попробовал множество AI coding assistants, как на работе, так и для сайд проектов и проектов для магистратуры.
Пока что такой рейтинг:
1. Claude Code (CLI)
Лучший из лучших. Не могу использовать на работе, но показывает очень хороший результат в сайд проектах и магистратуре. Люблю автоматическое сжатие истории, поэтому никогда runs out of context window. Также создание TODO листа перед началом разработки очень помогает.
2. Kiro (IDE)
Обожаю возможность Spec Driven Development. Использую каждый день на работе, так как создан Амазоном. Если кто не знает, в Kiro есть два разных режима: Vibe Mode и Spec Mode. Первый – это всеми нами любимый вайб кодинг, норм для маленьких задач, и кратковременных результатов. Второй – мой любимый, и очень полезный когда надо спроектировать большую систему.
Главная фича – для каждого проекта, создается spec в виде markdown файлов. Сначала создается requirements документ, где Kiro выписывает требования системы, user stories, и тд. После вашего ревью и фидбека, создается design документ, где Kiro расписывает дизайн всей системы. После этого создается tasks документ, где пошагово расписан TODO лист с задачами.
Дальше начинается development по каждой задаче. В Kiro нужно просто нажать на любую задачу из tasks.md и начнется имплементация.
Я таким образом завайбкодил POC (Proof-of-concept) для нашего нового проекта в Амазоне за 1-2 недели параллельно своей главной работе, сделал демо и теперь моя вся команда следует моему MVP.
Единственный минус – часто начинает генерировать всякую чушь, если оставить делать что-то без фидбека. Например, не может нормально импортировать нужные библиотеки, поэтому обходит это создавая fallback механизмы. Или генерирует много zombie code, чтобы соблюдать backwards compatibility – IMO you don’t need that in non-production code, когда просто экспериментируешь. Также генерирует слишком много markdown файлов для intermediate прогресса.
3. VS Code (IDE) + Cline (extension)
Норм, использовал какое-то время до появление Kiro, но очень минимальный стек. Нужно давать очень много контекста и инструкций самому.
4. Cursor (IDE)
Какое-то время был хорошим, сейчас скатился. Не рекомендую.
Однозначно не рекомендую: Amazon Q Developer, OpenAI Codex – something is just wrong with these.
Хочу попробовать Google Antigravity. Возможность давать фидбек на UI/UX сгенерированный через Nano Banana выглядит обещающе.
Пока что такой рейтинг:
1. Claude Code (CLI)
Лучший из лучших. Не могу использовать на работе, но показывает очень хороший результат в сайд проектах и магистратуре. Люблю автоматическое сжатие истории, поэтому никогда runs out of context window. Также создание TODO листа перед началом разработки очень помогает.
2. Kiro (IDE)
Обожаю возможность Spec Driven Development. Использую каждый день на работе, так как создан Амазоном. Если кто не знает, в Kiro есть два разных режима: Vibe Mode и Spec Mode. Первый – это всеми нами любимый вайб кодинг, норм для маленьких задач, и кратковременных результатов. Второй – мой любимый, и очень полезный когда надо спроектировать большую систему.
Главная фича – для каждого проекта, создается spec в виде markdown файлов. Сначала создается requirements документ, где Kiro выписывает требования системы, user stories, и тд. После вашего ревью и фидбека, создается design документ, где Kiro расписывает дизайн всей системы. После этого создается tasks документ, где пошагово расписан TODO лист с задачами.
Дальше начинается development по каждой задаче. В Kiro нужно просто нажать на любую задачу из tasks.md и начнется имплементация.
Я таким образом завайбкодил POC (Proof-of-concept) для нашего нового проекта в Амазоне за 1-2 недели параллельно своей главной работе, сделал демо и теперь моя вся команда следует моему MVP.
Единственный минус – часто начинает генерировать всякую чушь, если оставить делать что-то без фидбека. Например, не может нормально импортировать нужные библиотеки, поэтому обходит это создавая fallback механизмы. Или генерирует много zombie code, чтобы соблюдать backwards compatibility – IMO you don’t need that in non-production code, когда просто экспериментируешь. Также генерирует слишком много markdown файлов для intermediate прогресса.
3. VS Code (IDE) + Cline (extension)
Норм, использовал какое-то время до появление Kiro, но очень минимальный стек. Нужно давать очень много контекста и инструкций самому.
4. Cursor (IDE)
Какое-то время был хорошим, сейчас скатился. Не рекомендую.
Однозначно не рекомендую: Amazon Q Developer, OpenAI Codex – something is just wrong with these.
Хочу попробовать Google Antigravity. Возможность давать фидбек на UI/UX сгенерированный через Nano Banana выглядит обещающе.
❤21❤🔥4
My friends and I are applying to YC, and we need some people to validate our idea.
If you’re:
• vibe coder
• work in industry (big tech, startup – doesn’t matter) and ship a lot of code, work with a lot of code
Please DM me @abekek
If you’re:
• vibe coder
• work in industry (big tech, startup – doesn’t matter) and ship a lot of code, work with a lot of code
Please DM me @abekek
❤16🔥3❤🔥2
Thanks, y’all! We got a lot of people that we interviewed, and were able to validate our idea.
Glad to have such awesome and talented subscribers!
Glad to have such awesome and talented subscribers!
❤3❤🔥2
Кстати, я сюда не писал, но около месяца назад — когда у Амазона были массовые сокращения — меня и всю мою команду тоже сократили. Но мне "повезло": менеджер, с которым я работал раньше, позвал к себе в команду, и я перешёл на новую роль внутри компании. Лишний раз убедился, что личные связи и репутация — это, наверное, самое важное в карьере. Позже напишу отдельный пост с выводами и тем, чему эта ситуация научила.
❤48💔10❤🔥4👍2🤷♂1
Media is too big
VIEW IN TELEGRAM
I am doing apartment hunting, so did a quick MVP in 1 day to help me with that
❤🔥8❤2
Claude Code is doing magic: working iOS app + backend on AWS with infra and Strands SDK agent
❤🔥4💩1
You guys can try it: https://testflight.apple.com/join/XjDjmVvv
Apple
Join the Apartment AI beta
Available on iOS
❤7
Another cool product: https://www.pencil.dev/
Actually made Claude Code use their MCP to create me a design first
Actually made Claude Code use their MCP to create me a design first
❤3❤🔥2
Now Archaic is a fully redesigned desktop app, and integrates directly with your Claude/Kiro/Cursor workflow via MCP (bi-directionally): https://www.tryarchaic.com/
Download and check it out
Download and check it out
Tryarchaic
archaic - See your code as a system
archaic replaces the file tree with a living architecture map so you can understand any codebase as a system.
❤8⚡1🔥1💅1
Archaic is live on Product Hunt! Please upvote and comment: https://www.producthunt.com/posts/archaic-ai
Product Hunt
Archaic AI: A living architecture map — for you and your AI agent | Product Hunt
Archaic analyzes your codebase with AI and generates an interactive architecture map: services, connections, execution flows, and deep dives. But it's not just for you. Your AI agent can read it, reason about it, and update it as it works. The desktop app…
❤4💅1
If I had a company, I would enforce no-AI days (maybe once a week), where all access to AI is restricted (unless you have some urgent launch or task).
Costly, but the cost of your devs brain rotting might cost more.
Costly, but the cost of your devs brain rotting might cost more.
❤19❤🔥1👍1
I made a post on X yesterday and it kind of blew up. Lmk your thoughts and star if interested: https://github.com/abekek/arise
❤🔥12❤1
Сегодня был мой последний день в Амазоне. Bittersweet but excited about what’s next
❤24❤🔥2
Отдых от работы не проходит зря, с другом опубликовали препринт идеи которая пришла в голову.
AI-агенты всё чаще сами пишут себе инструменты и копят их в библиотеку. Но оценивают их только по тому, решили ли задачу. Это как судить разработчика только по "запустилось или нет", игнорируя repeated patterns, regressions и tech debt.
Мы сделали бенчмарк который смотрит на качество самой библиотеки. Главный вывод: системы с почти одинаковым результатом (63–68%) отличаются по качеству кода на 18%. Стандартные метрики эту разницу не видят.
Зачем это нужно: если агенты начнут массово генерить код в продакшене, нужно понимать не только "работает ли", но и насколько этот код поддерживаем и безопасен.
https://arxiv.org/abs/2604.00392
AI-агенты всё чаще сами пишут себе инструменты и копят их в библиотеку. Но оценивают их только по тому, решили ли задачу. Это как судить разработчика только по "запустилось или нет", игнорируя repeated patterns, regressions и tech debt.
Мы сделали бенчмарк который смотрит на качество самой библиотеки. Главный вывод: системы с почти одинаковым результатом (63–68%) отличаются по качеству кода на 18%. Стандартные метрики эту разницу не видят.
Зачем это нужно: если агенты начнут массово генерить код в продакшене, нужно понимать не только "работает ли", но и насколько этот код поддерживаем и безопасен.
https://arxiv.org/abs/2604.00392
arXiv.org
EvolveTool-Bench: Evaluating the Quality of LLM-Generated Tool...
Modern LLM agents increasingly create their own tools at runtime -- from Python functions to API clients -- yet existing benchmarks evaluate them almost exclusively by downstream task completion....
❤🔥9🔥7
I just spent my whole evening fixing BTS' "Into the Sun" from ARIRANG because the vocoder on V and Jungkook's vocals was driving me crazy.
Basically what I did: downloaded the song, separated vocals from instrumentals with AI (Demucs), then used RVC (Retrieval-based Voice Conversion). It's an AI tool that converts one voice into another while keeping the melody and timing. so I found trained voice models for V, Jungkook, Jimin and Jin, ran the isolated vocals through each model which basically re-synthesizes the singing in their natural voice without the vocoder effect. Had to go frame by frame through a color coded lyrics video just to figure out who sings when so i could apply the right model to the right parts. Then blended the AI vocals with the originals and mixed everything back with the instrumentals.
The result is not bad, but still has a bit of robotic voice 🤖
Basically what I did: downloaded the song, separated vocals from instrumentals with AI (Demucs), then used RVC (Retrieval-based Voice Conversion). It's an AI tool that converts one voice into another while keeping the melody and timing. so I found trained voice models for V, Jungkook, Jimin and Jin, ran the isolated vocals through each model which basically re-synthesizes the singing in their natural voice without the vocoder effect. Had to go frame by frame through a color coded lyrics video just to figure out who sings when so i could apply the right model to the right parts. Then blended the AI vocals with the originals and mixed everything back with the instrumentals.
The result is not bad, but still has a bit of robotic voice 🤖
❤🔥9❤1😍1
