Telegram Web Link
چند روز قبل Elon Musk یک توییت زد که، Grok-3 بهترین AI ایی خواد بود که دیدید.

همینطوری که ملت در حالی خوشگذرانی با Gemini 2.0 Flash Thinking بودند (اتفاقاً خیلی از شرکت‌ها هم رفتند سراغش بخصوص اونایی که در زمینه RAG کار می‌کنند)

نسخه Early Release مدل Grok-3 منتشر شد، و رتبه اول رو تا اینجا کار به خودش اختصاص داده
توی اکثر بنچمارک‌های معروف مثل lmarena حتی اختلاف با مدل دوم حدود 20 امتیاز هست.

نظر کاربرا راجب این مدل هم بسیار مثبت هست.


پی‌نوشت‌: توی تمام زمینه‌های lmarena رتبه اول رو داره این مدل (یادم رفت بگم)
Claude Sonnet 3.7
رو داشتیم با یکی از همکارا تست می‌کردیم؛ اگر نگم برنامه‌نویس‌ها

حداقلش دیگه کدرها کارشون ۱۰۰٪ سخت خواهد بود برای شغل پیدا کردن.
فقط کافیه ۴ ماه صبر کنیم تا open source ایده رو پیاده‌سازی کنه و دیگه کسی coder استخدام نخواهد کرد.

اگر دسترسی دارید حتماً قابلیت برنامه‌نویسی‌اش رو تست کنید و لذت ببرید.

این پست و پست بعدیش رو هم بخونید؛ من حداقل ۲ سال هست که به نیروهای جونیور دارم هشدار می‌دم:

https://www.tg-me.com/pyHints/726
دستاوردهای یادگیری عمیق(InTec)
Claude Sonnet 3.7 رو داشتیم با یکی از همکارا تست می‌کردیم؛ اگر نگم برنامه‌نویس‌ها حداقلش دیگه کدرها کارشون ۱۰۰٪ سخت خواهد بود برای شغل پیدا کردن. فقط کافیه ۴ ماه صبر کنیم تا open source ایده رو پیاده‌سازی کنه و دیگه کسی coder استخدام نخواهد کرد. اگر دسترسی…
چون زیاد سوال شد، زدید که دیگه سراغ این شغل نیایم یعنی ؟

جواب :
خیر منظور من این نبود، منظور اینه که باید درست یاد بگیرید.
کدر شدن : یعنی سینتکس زبانی رو بلد بودن
دولوپر شدن : یعنی جزییات اجرای کد و ... رو هم بدونید اینکه اون زیر داره چه اتفاقاتی میوفته

بر خلاف قدیم که آدما از هر رشته و با هر پس زمینه و توی هر سنی اگر یک مقدار وقت و انرژی می‌ذاشتند وارد دنیای برنامه‌نویسی می‌شدند و با ۲ سال کار کردن و حفظ کردن (فهمیدن فرق داره) یک سری مطالب و استاندارد ها می‌تونستند خودشون رو حتی مدیور جا بزنند.

الان اوضاع فرق کرده، الان یک بچه ۱۲-۱۳ ساله می‌تونه بدون سواد برنامه‌نویسی شروع کنه کار کردن:
بصورت فیلم‌‌وار چند تا آموزش پایتون رو ببینه.
بعد هم شروع کنه به LLM ها درخواست دادن برای کد نویسی.

اکانت Andrej Karpathy (خداوندگار مهندسی و هوش مصنوعی) رو هم اگر دنبال کنید چندروز قبل و بعد از پست من به این موضوع اشاره کردند.

خوشتون بیاد یا نه، دیگه باید مفاهیم رو یاد بگیرید؛ این موج توی ایران دیرتر شروع خواهد شد ولی قطعاً شروع می‌شه.
بسیاری از شرکت‌ها درحال کوچیک شدن هستند، داخل استارتاپ‌های ایرانی که این موج شروع شده.
Forwarded from Python Hints
این موضوع خیلی‌هارو سوزوند و یک سری هم خیلی منطقی گفتند که باور ندارند همیچین اتفاقی شدنی باشه:

یک نفر توی توییتر به اسم levelsio یک توییتی زده و گفته که آقا من تو عمرم بازی نویسی انجام ندادم ولی یک شبیه‌ساز پرواز توی ۳ ساعت درست کردم و ۱۰۰٪ کد رو Grok3 برام زده (شخصا اضافه کنم: بله Grok توی این موارد از Sonnet 3.7 هم بهتره) ۸۰٪ رو همون بار اول درست زده ۲۰٪ رو مجبور شدم چندبار باهاش چک کنم؛ حالا هر Javascript, React, Vue, ... دولوپری که دوس داره یک سر به لینک این بزنه و بگه توی ۳ ساعت بدون کمک هیچکدوم از LLM/AI ها چندساعت طول می‌کشه این بازی رو بنویسه ؟

تعداد هواپیماهای قرمزی که می‌بینید؛ باقی کاربرهای داخل بازی هستند (فکر کنم چند میلیون باشه) این توییت X رو کامل بهم ریخته.

https://fly.pieter.com


بعد فرض کنید یک سنیور بازی نویسی + AI خودش یک ارتش چند نفره بازی نویسی خواهد بود ؟
فکر کنم باید زمانبندی قبلیم برای حذف کدرها (کسانی که مفاهیم رو درک نکردند) رو نصف کنم.

پ.ن: بخش درآمدزایی رو هم طرف اضافه کرده ۲۹ دلار برای پرواز با F16 و پشتیبانی از پروژه.
همزمان با Sonnet 3.7 پروژه qwen هم از مدل
QwQ Max Preview
رونمایی کرده که‌ خب توی خبرها گم شده بود، من امروز دیدم و رفتم سراغش چون Sonnet 3.7 رو با پروژه چک کردم، برای این هم همینکار رو کردم؛ ۶ تا فیچر باید به پروژه‌ای که دارم اضافه می‌شد که خب فکر می‌کردیم هرکدوم ۱ روز زمان ببره حداقل (بیس کدها خوب چیده شده) ولی امروز از وقت استفاده کردم و اومدم با همین پروژه تست کردم؛ حدوداً ۴ ساعت گذشته و من ۲ فیچر رو به کمک این مدل با تمام تست‌هاش پیاده کردم.
و باید بگم واقعاً عملکرد خیلی خفنی داره:

این پروژه کاملاً رایگان هست و rate limit هم نداره؛ بعد از اتمام preview قرار هست بصورت open source / open weight هم منتشر بشه.

https://chat.qwenlm.ai/
دستاوردهای یادگیری عمیق(InTec)
این موضوع خیلی‌هارو سوزوند و یک سری هم خیلی منطقی گفتند که باور ندارند همیچین اتفاقی شدنی باشه: یک نفر توی توییتر به اسم levelsio یک توییتی زده و گفته که آقا من تو عمرم بازی نویسی انجام ندادم ولی یک شبیه‌ساز پرواز توی ۳ ساعت درست کردم و ۱۰۰٪ کد رو Grok3 برام…
این تصویر مربوط هست به بنچمارک Sonnet 3.7

SWE-bench verified


این بنچمارک مجموعه‌ای از درخواست پروژه‌هایی هست که روی سایت‌های مختلف freelance توی سال‌های قبل گذاشته شده (برخلاف خیلی بنچمارک‌های دیگه Synthetic نیست یعنی)

مدل sonnet تونست 62.3% درخواست‌های که نیازمند software engineer بوده رو تسک‌هاش رو کامل انجام بده و با کمی بهبود پرامپت این عدد به 70.3% رسیده.

حالا فرض کنید این ابزار دست شما باشه + خودتون هم سواد مهندسی رو داشته باشید.
بنظرتون این عدد به چند میرسه ؟
Please open Telegram to view this post
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
این ویدئو رو دیدید ؟
قطعاً، دیدید.
با این داستان پخش شده که ای وای دوتا AI تصمیم گرفتند یک زبان جدید و بهینه برای خودشون استفاده کنند.

اولین باری که دیدم خندیدم و گفتم، چه فکر مریضی (اونی که درست کرده)

بعد دیدم کلی آدم خیلی جدی دارند ازش تعریف می‌کنند، بخصوص مثلاً متخصص‌های هوش مصنوعی.
خیلی ازین آدما، سنیور هستند مثلاً ولی اگر این سوال مصاحبه بود من درجا طرف رو حذف می‌کردم چون قطعاً چیزی از AI نفهمیده.


اخطار:
اگر پستی در مورد این ویدیو گذاشتید سریعاً پاک کنید، آبروتون نره.

حالا استدلال این داستان چیه ؟
پست بعدی رو بخونید.
دستاوردهای یادگیری عمیق(InTec)
این ویدئو رو دیدید ؟ قطعاً، دیدید. با این داستان پخش شده که ای وای دوتا AI تصمیم گرفتند یک زبان جدید و بهینه برای خودشون استفاده کنند. اولین باری که دیدم خندیدم و گفتم، چه فکر مریضی (اونی که درست کرده) بعد دیدم کلی آدم خیلی جدی دارند ازش تعریف می‌کنند،…
فقط کافیه ۱ ساعت راجب LLM ها خونده باشید تا با منطق ثابت کنید این ویدئو کاملاً تقلب هست ولی خب خیلی‌ها نفهمیدن.
با اینکه ML Researcher / Engineer هستند مثلاً.
من خیلی ساده میگم، که اینا هم بفهمند :

۱- همه‌ی ما می‌دونیم LLM چیزی نیست جز یک مدل احتمالاتی که یاد میگیره بر اساس آنچه در اینترنت از متن‌ها دیده به ترکیب کنار هم قرار گرفتن کلمات عددی بین 0-1 بده، و بر اساس این اعداد کلمه بعدی رو پیش‌بینی کنه.

یعنی اگر یک مدل مطالب زیادی در مور‌د "کامپیوتر صنعتی" دیده باشه، وقتی شما کلمه "کامپیوتر" رو بهش بدید احتمال زیادی (عددی نزدیک به ۱) می‌ده که کلمه بعدی "صنعتی" باشه.

خب حالا با این وضعیت، چنین مدلی می‌تونه beep رو ایجاد کنه و بفهمه ؟

۲- این مدل‌ها برای درک زبان در طول زمان آموزش، شروع به ساخت یک فضای برداری می‌کنند که هر کلمه رو به یک بردار عددی تبدیل می‌کنه اصطلاحاً بهش می‌گیم Embedding و این یعنی فرض کنید یک دیکشنری به شما داده بشه و بگم همه کلمات دنیا توی این دیکشنری هست (مدل‌ها خلاقیت ندارند، پس این فرض رو داشته باشید) چطور شما می‌تونید از کلمات داخل دیکشنری محدود به beep برسید ؟!

۳- فرض کنید یک مدل اتفاقاً beep رو هم آموزش دیده، یعنی شما علاوه بر اون دیکشنری کلمات دنیا یک دیکشنری خاص هم بهتون داده شده برای تبدیل آوا و صدای beep به متن (مثل کد مورس)
شما می‌تونید کد مورس بزنید ولی وقتی دیکشنری رو کس دیگری نداره چطور می‌تونه با شما ارتباط برقرار کنه ؟

پس حتماً باید هر ۲ مدل روی صدای beep علاوه بر متن‌های اینترنت آموزش دیده باشند.
پس اینکه خودشون به این زبان رسیده باشه، دروغ محض هست و از فیلم‌های دهه ۸۰-۹۰ میلادی هالیوود میاد.

ولی حتی مورد آموزش دیدن روی beep هم در کار نیست و این رو فقط باید برنامه‌نویس باشید تا بفهمید (نیازی به سواد هوش مصنوعی هم ندارد حتی فهمیدنش)

ابتدای ویدئو هر ۲ مدل، به انگلیسی صحبت می‌کنند که طبیعی هست و هیچ ایرادی ندارد؛ اما بعد مدل دوم پیشنهاد استفاده از زبان مشترک و بهینه رو میده و ادعا شده این زبان ساخت خودشون هست.

۱- پس آدمی که فیلم گرفته نمی‌توانسته بفهمه صحبت بین اینها چی هست.
همون‌طور که شما اگر فرانسه ٫ آلمانی تمرین نکرده باشی نخواهی فهمید گفتگو بین دو نفر چه معنایی داره

۲- کدهای فرانت ٫ اپلیکیشن هر ۲ مدل تا قبل از سوییچ شدن زبان هیچ متنی رو چاپ نمی‌کردند، چرا یک دفعه سورس کد آپدیت شد و شروع به چاپ متن‌ها توی زبان جدید کرد ؟!

۳- اگر beep بهینه‌تر هست، که از نظر محاسبات یک مدل همچین چیزی رو می‌گه، چرا مدل باید زحمت تولید متن به انگلیسی رو هم همزمان بکشه ؟

۴- چرا مدل تبدیل متن به گفتار یکباره، علاوه بر خروجی باید ورودیش رو هم توی خروجی ارسال کنه و چرا خروجی‌ مدل تبدیل به گفتار و متن شد به یکباره ؟

آقا٫خانم مثلاً متخصص، یکم نحوه عملکرد مدل‌هایی که زدی توش تخصص داری رو بخون حداقل.
من این پست رو تو صفحه کسی دیدم که توی پست‌های مختلف؛ خودش رو متخصص LLM ها و البته جزو سازنده های برترین LLM های فارسی معرفی کرده بود، از بد روزگار کلی اسکل تر از خودشم ازش بابت پست خوبش تشکر کرده بودن.

واقعاً چی می‌کشیم از دست این جماعت
Forwarded from Python Hints
ابزار تقلب توی مصاحبه :

Interview Coder AI tool

این ابزار کاملاً open source هم هست، حالا چرا اینجا گذاشتم ؟
نه برای اینکه تقلب کنید (چون درجا گیر میوفتید اگر طرف کار بلد باشه)
برای این هست که فوق‌العاده میشه ازش برای آمادگی مصاحبه فنی استفاده کرد؛ اینکه چی بگید رو هم براتون می‌ذاره.

بخصوص بدرد مرحله اول و دوم مصاحبه که کد زدن و الگوریتم و ... داره می‌خوره
#Quick

چون هزینه دوره‌های prompt engineering رو برام فرستادید و گفتید ارزش رفتن داره :

پاسخ کوتاه : خیر به هیچ وجه (مخاطب‌های کانال)

پاسخ بلند : بیش از ۹۰٪ شما قطعاً برنامه‌نویس هستید با markdown هم آشنایی دارید (readme پروژه رو github رو می‌نویسید) بجای وقت گذاشتن روی حفظ کردن prompt engineering, ... نگاهی به دیتاست‌هایی که مدل هوش مصنوعی روش آموزش دیده بندازید و بر اساس پترن اونها بهش پرامپت بدید.

بهترین نتایج رو خواهید گرفت.

راه ساده‌تر، این راه همیشه جواب نیست ولی خب؛ برای مدل‌هایی که از یک مدل بزرگتر آموزش دیدند (distillation, synthétique data, ....) می‌تونید از مدل بزرگتر بخواهید که یک پرامپت استاندارد برای متن درخواست شما بنویسه؛ بعد متن رو بهش میدید و پرامپت رو می‌گیرید.

به خوبی روش قبلی نیست ولی نتایجش بسیار عالیه؛ prompt engineering ممکنه ساعت‌ها طول بکشه تا به پرامپت خوب برسه؛ ما تو دقیقه پرامپت بهتر رو می‌زنیم توی تیم خودم.
حداقل تو بیش از ۹۵٪ مواقع.


اگر تست کردید این تکنیک جواب داد و تکنیک رو دوست داشتید.
متن رو با منبع به اشتراک بذارید؛ شاید بیشتر از این تجربیات مخصوص تیم خودم رو به اشتراک گذاشتم.
#موقت

اگر موضوع #تبلیغات باشه، بنر + پیشنهاد + مدل تبلیغات و مبلغ رو به آیدی من بفرستید
@abbasi_ai

درحال بررسی موضوع هستیم.

پ.ن: شخصاً ممکنه امکان پاسخگویی در لحظه رو نداشته باشم.
برای همین اعلام کردم، تمام موضوع رو خودتون بگید چیزی به عنوان ذکر مبلغ و ... از طرف من وجود نداره.
پیشنهادات رو بررسی می‌کنیم.
دستاوردهای یادگیری عمیق(InTec)
#موقت اگر موضوع #تبلیغات باشه، بنر + پیشنهاد + مدل تبلیغات و مبلغ رو به آیدی من بفرستید @abbasi_ai درحال بررسی موضوع هستیم. پ.ن: شخصاً ممکنه امکان پاسخگویی در لحظه رو نداشته باشم. برای همین اعلام کردم، تمام موضوع رو خودتون بگید چیزی به عنوان ذکر مبلغ…
۷ تا سیستم برای ۷ نفر.

همه می‌دونید، چیزی که من ازش متنفرم تبلیغات هست. ۷-۸ سال کانال pytens و ۲ سال pyhints هیچوقت تبلیغات به خودش ندیده؛ نه اینکه بد باشه، فقط شخصاً حوصله تبلیغات ندارم.

ولی می‌دونم اگر اصل موضوع رو میذاشتم، خیلی‌ها برای کمک کردن اعلام حضور می‌کردند ولی هرکسی منو می‌شناسه می‌دونه ازینکار خوشم نمیاد.

۲ سال پیش هم، همچین شرایطی پیش اومد و اون موقع با چندتا از دوستان کار ساعتی و پروژه آنلاین انجام دادیم تا پول اون کار جور بشه.

موضوع ازین قرار بود که یکی از دوستان، برای یک بنر کمپین شرکت به یک مشکل اساسی خورد و هیچکس رو برای ادیت نداشت؛ ولی آخر شب یک شخصی رو پیدا کرد که بهش گفت می‌تونه این کار رو انجام بده ولی سیستم نداره و این دوستمون باید خودش بره پیشش؛ کار به خوبی انجام شد و تمام ...

بعد از مدتی متوجه شدیم اون شخص این دوره‌ها رو آموزش دیده ولی سیستم و ... نداره و بخاطر شرایط خانواده نمی‌تونه هم خرید کنه و حتماً هم باید کار کنه؛ برای همین کارگری حمل بار شده.

این دوستمون توی گروه گذاشت و یکی از بچه‌ها سیستم قدیمی خودش رو بهش داد و یکی دیگه از دوستان زحمت آپگرید اون رو کشید.

چندوقت پیش اون پسر، برای یک نفر دیگه اینکار رو کرد؛ خرید لپتاپ استوک و آپگرید اون.
حالا این رفیق ما افتاده دنبال آدمایی که سواد دارند اما تجهیزات ندارند.
۷ نفر رو پیدا کرد و پیام داد که ۳ نفر اینها حتی شغل هم دارند (تازه شروع کردند).
داستان اینجوری هست، بچه‌هایی که انتخاب می‌کنه، مصاحبه میرن یا نمونه کار می‌دند شغل پیدا می‌کنند و بعد این دوستمون براشون سیستم جور می‌کنه با ۲ تا شرط :
۱- اگر اخراج بشن یا استعفا بدند، سیستم تحویل نفر بعدی بشه
۲- اگر شرایط مالی خودشون خوب شد، همینکار رو برای یک نفر دیگه انجام بدند.


تا الان برای ۵ نفر اینکار رو کرده، و این ماه ۷ نفر رو پیدا کرده ۳ نفر از اول ماه سرکار هستند (با سیستم‌های کافی‌نت و دانشگاه و ...) و ۴ نفر هم از ۱ اردیبهشت.
فقط ۲ تا ازین بچه‌ها برنامه‌نویس هستند؛ من امکان انجام کار ساعتی و donate بیشتر نداشتم برای همین خواستم از تبلیغات کانال‌ها استفاده کنم (حداقل پول خرید SSD رو که در میاورد؛ با توجه به پیشنهاداتی که شد بیشتر هم می‌شد البته)


الان که این داستان رو میگم، ۳۰ نفر از بچه‌ها توی کارهای مختلف قبول کمک کردند و ۷ تا سیستم استوک براشون قراره خرید و آپگرید بشه.
دوتا از دوستان هم که آشنایی سخت‌افزار دارند، قرار شد زحمت آپگرید‌ها رو بکشند و البته بچه‌های تخصصی هر رشته هم بررسی کنند که لپ‌تاپ‌ها واقعاً قابل استفاده باشه.

توی این تعطیلات هم بچه‌ها قبول کردند این ۷ نفر رو آموزش بدند که مطمئن بشوند، دوره آزمایشی رو با موفقیت پشت سر خواهند گذاشت.


دلیل پست مربوط به تبلیغات این بود، که خب دیگه نیازی به قبول تبلیغات نیست.
دستاوردهای یادگیری عمیق(InTec)
این موضوع خیلی‌هارو سوزوند و یک سری هم خیلی منطقی گفتند که باور ندارند همیچین اتفاقی شدنی باشه: یک نفر توی توییتر به اسم levelsio یک توییتی زده و گفته که آقا من تو عمرم بازی نویسی انجام ندادم ولی یک شبیه‌ساز پرواز توی ۳ ساعت درست کردم و ۱۰۰٪ کد رو Grok3 برام…
این پست رو یادتون هست، دولوپر این بازی به درآمد رسیده و توی توییت‌های مختلف داره مبلغش رو اعلام می‌کنه

۱۰ تا بازی ساخته شد، که همه موارد به درآمد بالای 10000$ رسیدند.

کار به جایی رسیده که خود ایلان ماسک هم پست راجبش زده و این یعنی درآمد بیشتر برای این افراد.
یک صحبتی توی یکی از گروها دیدم راجب خرید RTX5090 برای کارهای هوش مصنوعی؛ نظر شخصی خودم این هست که ارزش خرید نداره بخصوص مدلی که باقی رقیب‌ها وارد شدند:

۱. Mac studio M3 Ultra
میزان unified memory این دستگاه تا ماکزیمم 512 گیگ هست یعنی مدل 621 میلیارد پارامتری R1 رو می‌تونید بصورت Q4 روی این دستگاه اجرا کنید.
۲- NVIDIA DIGITS
این دستگاه حافظه 128 گیگابایتی خواهد داشت؛ و طبق ادعای خود nvidia بدرد inference میخوره شدید وتا ۲۰۰ میلیارد پارامتر رو پشتیبانی می‌کنه.

۳- Framwork Desktop
هم تا ۱۲۸ گیگ حافظه خواهد داشت که ۹۶ گیگ اون رو میشه به GPU اختصاص داد (مثل چیپ‌های اپل عمل می‌کنه)

پس بنظرم ‍۱-۲ نسل آینده nvidia حتما تمرکز به سمت افزایش حافظه هم خواهد رفت؛ همونطور که خیلی ها فکر می‌کردند 5090 به ۴۰ گیگ برسه و یا قیمت بهتری داشته باشه که شاید بشه گفت nvidia با معرفی nvidia DIGITS یکم کار رو جمع کرد.

شخصا منتظر نسل‌های بعدی GPU خواهم موند؛ بصرفه ترین انتخاب رو هم فعلا 3090 می‌دونم.
این دو مورد با یکی از دوستان صبح توی گروه صحبت شد :
mercury code medium و QwQ 32b code

شخصا ازشون استفاده نکردم؛ Mercury رو قبلتر راجب ایده‌اش صحبت‌هایی شده بود ولی با وجود Grok3 و Deepseek R1 واقعا کم پیش میاد از مدل دیگه‌ای بخوام استفاده کنم.

دستاوردهای این مدل قطعا جذاب هست ولی درحال حاضر مدل‌های بهتری برای استفاده دارم. اگر خواستید هر دو مدل رو می‌تونید لوکال تست کنید

اضافه کنم:

شخصا دستاورد Mercury برام اهمیت بیشتری داره؛ ولی منتظرم یکی از شرکت‌ها به رایگان دپلوی کنه
اپل برای پشتیبانی سرویس‌های AI خودش یک قراردادی رو با OpenAi داشت.
که خب حتماً شنیدید مشکلاتش زیاد بود و رضایت نداشت و ...

توی پشت صحنه داشته سرویس‌ دهنده‌های دیگر رو هم تست می‌کرده و اینطور که شایعه شده، اپل Gemini رو جایگزین ChatGpt کرده.
#Quick

احتمال بسیار زیاد توی ۲ ماه آینده شاهد انتشار Deepseek R2 خواهیم بود.

زبان‌های بیشتری بهش اضافه شده (فقط چینی و انگلیسی نیست)
نتایج بهتری روی Coding نشون داده (هنوز ترین تموم نشده)
2025/06/30 14:24:48
Back to Top
HTML Embed Code: