چند روز قبل Elon Musk یک توییت زد که، Grok-3 بهترین AI ایی خواد بود که دیدید.
همینطوری که ملت در حالی خوشگذرانی با Gemini 2.0 Flash Thinking بودند (اتفاقاً خیلی از شرکتها هم رفتند سراغش بخصوص اونایی که در زمینه RAG کار میکنند)
نسخه Early Release مدل Grok-3 منتشر شد، و رتبه اول رو تا اینجا کار به خودش اختصاص داده
توی اکثر بنچمارکهای معروف مثل lmarena حتی اختلاف با مدل دوم حدود 20 امتیاز هست.
نظر کاربرا راجب این مدل هم بسیار مثبت هست.
پینوشت: توی تمام زمینههای lmarena رتبه اول رو داره این مدل (یادم رفت بگم)
همینطوری که ملت در حالی خوشگذرانی با Gemini 2.0 Flash Thinking بودند (اتفاقاً خیلی از شرکتها هم رفتند سراغش بخصوص اونایی که در زمینه RAG کار میکنند)
نسخه Early Release مدل Grok-3 منتشر شد، و رتبه اول رو تا اینجا کار به خودش اختصاص داده
توی اکثر بنچمارکهای معروف مثل lmarena حتی اختلاف با مدل دوم حدود 20 امتیاز هست.
نظر کاربرا راجب این مدل هم بسیار مثبت هست.
پینوشت: توی تمام زمینههای lmarena رتبه اول رو داره این مدل (یادم رفت بگم)
Claude Sonnet 3.7
رو داشتیم با یکی از همکارا تست میکردیم؛ اگر نگم برنامهنویسها
حداقلش دیگه کدرها کارشون ۱۰۰٪ سخت خواهد بود برای شغل پیدا کردن.
فقط کافیه ۴ ماه صبر کنیم تا
open source
ایده رو پیادهسازی کنه و دیگه کسی coder
استخدام نخواهد کرد. اگر دسترسی دارید حتماً قابلیت برنامهنویسیاش رو تست کنید و لذت ببرید.
این پست و پست بعدیش رو هم بخونید؛ من حداقل ۲ سال هست که به نیروهای جونیور دارم هشدار میدم:
https://www.tg-me.com/pyHints/726
دستاوردهای یادگیری عمیق(InTec)
Claude Sonnet 3.7 رو داشتیم با یکی از همکارا تست میکردیم؛ اگر نگم برنامهنویسها حداقلش دیگه کدرها کارشون ۱۰۰٪ سخت خواهد بود برای شغل پیدا کردن. فقط کافیه ۴ ماه صبر کنیم تا open source ایده رو پیادهسازی کنه و دیگه کسی coder استخدام نخواهد کرد. اگر دسترسی…
چون زیاد سوال شد، زدید که دیگه سراغ این شغل نیایم یعنی ؟
جواب :
خیر منظور من این نبود، منظور اینه که باید درست یاد بگیرید.
کدر شدن : یعنی سینتکس زبانی رو بلد بودن
دولوپر شدن : یعنی جزییات اجرای کد و ... رو هم بدونید اینکه اون زیر داره چه اتفاقاتی میوفته
بر خلاف قدیم که آدما از هر رشته و با هر پس زمینه و توی هر سنی اگر یک مقدار وقت و انرژی میذاشتند وارد دنیای برنامهنویسی میشدند و با ۲ سال کار کردن و حفظ کردن (فهمیدن فرق داره) یک سری مطالب و استاندارد ها میتونستند خودشون رو حتی مدیور جا بزنند.
الان اوضاع فرق کرده، الان یک بچه ۱۲-۱۳ ساله میتونه بدون سواد برنامهنویسی شروع کنه کار کردن:
بصورت فیلموار چند تا آموزش پایتون رو ببینه.
بعد هم شروع کنه به
اکانت
خوشتون بیاد یا نه، دیگه باید مفاهیم رو یاد بگیرید؛ این موج توی ایران دیرتر شروع خواهد شد ولی قطعاً شروع میشه.
بسیاری از شرکتها درحال کوچیک شدن هستند، داخل استارتاپهای ایرانی که این موج شروع شده.
جواب :
خیر منظور من این نبود، منظور اینه که باید درست یاد بگیرید.
کدر شدن : یعنی سینتکس زبانی رو بلد بودن
دولوپر شدن : یعنی جزییات اجرای کد و ... رو هم بدونید اینکه اون زیر داره چه اتفاقاتی میوفته
بر خلاف قدیم که آدما از هر رشته و با هر پس زمینه و توی هر سنی اگر یک مقدار وقت و انرژی میذاشتند وارد دنیای برنامهنویسی میشدند و با ۲ سال کار کردن و حفظ کردن (فهمیدن فرق داره) یک سری مطالب و استاندارد ها میتونستند خودشون رو حتی مدیور جا بزنند.
الان اوضاع فرق کرده، الان یک بچه ۱۲-۱۳ ساله میتونه بدون سواد برنامهنویسی شروع کنه کار کردن:
بصورت فیلموار چند تا آموزش پایتون رو ببینه.
بعد هم شروع کنه به
LLM
ها درخواست دادن برای کد نویسی.اکانت
Andrej Karpathy
(خداوندگار مهندسی و هوش مصنوعی) رو هم اگر دنبال کنید چندروز قبل و بعد از پست من به این موضوع اشاره کردند.خوشتون بیاد یا نه، دیگه باید مفاهیم رو یاد بگیرید؛ این موج توی ایران دیرتر شروع خواهد شد ولی قطعاً شروع میشه.
بسیاری از شرکتها درحال کوچیک شدن هستند، داخل استارتاپهای ایرانی که این موج شروع شده.
Forwarded from Python Hints
این موضوع خیلیهارو سوزوند و یک سری هم خیلی منطقی گفتند که باور ندارند همیچین اتفاقی شدنی باشه:
یک نفر توی توییتر به اسم
تعداد هواپیماهای قرمزی که میبینید؛ باقی کاربرهای داخل بازی هستند (فکر کنم چند میلیون باشه) این توییت
https://fly.pieter.com
بعد فرض کنید یک سنیور بازی نویسی + AI خودش یک ارتش چند نفره بازی نویسی خواهد بود ؟
فکر کنم باید زمانبندی قبلیم برای حذف کدرها (کسانی که مفاهیم رو درک نکردند) رو نصف کنم.
پ.ن: بخش درآمدزایی رو هم طرف اضافه کرده ۲۹ دلار برای پرواز با
یک نفر توی توییتر به اسم
levelsio
یک توییتی زده و گفته که آقا من تو عمرم بازی نویسی انجام ندادم ولی یک شبیهساز پرواز توی ۳ ساعت درست کردم و ۱۰۰٪ کد رو Grok3
برام زده (شخصا اضافه کنم: بله Grok توی این موارد از Sonnet 3.7
هم بهتره) ۸۰٪ رو همون بار اول درست زده ۲۰٪ رو مجبور شدم چندبار باهاش چک کنم؛ حالا هر Javascript, React, Vue, ...
دولوپری که دوس داره یک سر به لینک این بزنه و بگه توی ۳ ساعت بدون کمک هیچکدوم از LLM/AI
ها چندساعت طول میکشه این بازی رو بنویسه ؟تعداد هواپیماهای قرمزی که میبینید؛ باقی کاربرهای داخل بازی هستند (فکر کنم چند میلیون باشه) این توییت
X
رو کامل بهم ریخته.https://fly.pieter.com
بعد فرض کنید یک سنیور بازی نویسی + AI خودش یک ارتش چند نفره بازی نویسی خواهد بود ؟
فکر کنم باید زمانبندی قبلیم برای حذف کدرها (کسانی که مفاهیم رو درک نکردند) رو نصف کنم.
پ.ن: بخش درآمدزایی رو هم طرف اضافه کرده ۲۹ دلار برای پرواز با
F16
و پشتیبانی از پروژه.همزمان با
QwQ Max Preview
رونمایی کرده که خب توی خبرها گم شده بود، من امروز دیدم و رفتم سراغش چون Sonnet 3.7 رو با پروژه چک کردم، برای این هم همینکار رو کردم؛ ۶ تا فیچر باید به پروژهای که دارم اضافه میشد که خب فکر میکردیم هرکدوم ۱ روز زمان ببره حداقل (بیس کدها خوب چیده شده) ولی امروز از وقت استفاده کردم و اومدم با همین پروژه تست کردم؛ حدوداً ۴ ساعت گذشته و من ۲ فیچر رو به کمک این مدل با تمام تستهاش پیاده کردم.
و باید بگم واقعاً عملکرد خیلی خفنی داره:
این پروژه کاملاً رایگان هست و
https://chat.qwenlm.ai/
Sonnet 3.7
پروژه qwen هم از مدلQwQ Max Preview
رونمایی کرده که خب توی خبرها گم شده بود، من امروز دیدم و رفتم سراغش چون Sonnet 3.7 رو با پروژه چک کردم، برای این هم همینکار رو کردم؛ ۶ تا فیچر باید به پروژهای که دارم اضافه میشد که خب فکر میکردیم هرکدوم ۱ روز زمان ببره حداقل (بیس کدها خوب چیده شده) ولی امروز از وقت استفاده کردم و اومدم با همین پروژه تست کردم؛ حدوداً ۴ ساعت گذشته و من ۲ فیچر رو به کمک این مدل با تمام تستهاش پیاده کردم.
و باید بگم واقعاً عملکرد خیلی خفنی داره:
این پروژه کاملاً رایگان هست و
rate limit
هم نداره؛ بعد از اتمام preview
قرار هست بصورت open source / open weight هم منتشر بشه.https://chat.qwenlm.ai/
chat.qwen.ai
Qwen Chat
Qwen Chat offers comprehensive functionality spanning chatbot, image and video understanding, image generation, document processing, web search integration, tool utilization, and artifacts.
دستاوردهای یادگیری عمیق(InTec)
Deep Dive with Andrej Karpathy
How to use LLMs with Andrej Karpathy
یازم تکرار میکنم؛ این ویدئوها برای تازهکارها بسیار بسیار مناسب هست.
یازم تکرار میکنم؛ این ویدئوها برای تازهکارها بسیار بسیار مناسب هست.
YouTube
How I use LLMs
The example-driven, practical walkthrough of Large Language Models and their growing list of related features, as a new entry to my general audience series on LLMs. In this more practical followup, I take you through the many ways I use LLMs in my own life.…
دستاوردهای یادگیری عمیق(InTec)
این موضوع خیلیهارو سوزوند و یک سری هم خیلی منطقی گفتند که باور ندارند همیچین اتفاقی شدنی باشه: یک نفر توی توییتر به اسم levelsio یک توییتی زده و گفته که آقا من تو عمرم بازی نویسی انجام ندادم ولی یک شبیهساز پرواز توی ۳ ساعت درست کردم و ۱۰۰٪ کد رو Grok3 برام…
این تصویر مربوط هست به بنچمارک
این بنچمارک مجموعهای از درخواست پروژههایی هست که روی سایتهای مختلف
مدل
حالا فرض کنید این ابزار دست شما باشه + خودتون هم سواد مهندسی رو داشته باشید.
بنظرتون این عدد به چند میرسه ؟
Sonnet 3.7
SWE-bench verified
این بنچمارک مجموعهای از درخواست پروژههایی هست که روی سایتهای مختلف
freelance
توی سالهای قبل گذاشته شده (برخلاف خیلی بنچمارکهای دیگه Synthetic
نیست یعنی)مدل
sonnet
تونست 62.3%
درخواستهای که نیازمند software engineer
بوده رو تسکهاش رو کامل انجام بده و با کمی بهبود پرامپت این عدد به 70.3%
رسیده.حالا فرض کنید این ابزار دست شما باشه + خودتون هم سواد مهندسی رو داشته باشید.
بنظرتون این عدد به چند میرسه ؟
Please open Telegram to view this post
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
این ویدئو رو دیدید ؟
قطعاً، دیدید.
با این داستان پخش شده که ای وای دوتا AI تصمیم گرفتند یک زبان جدید و بهینه برای خودشون استفاده کنند.
اولین باری که دیدم خندیدم و گفتم، چه فکر مریضی (اونی که درست کرده)
بعد دیدم کلی آدم خیلی جدی دارند ازش تعریف میکنند، بخصوص مثلاً متخصصهای هوش مصنوعی.
خیلی ازین آدما، سنیور هستند مثلاً ولی اگر این سوال مصاحبه بود من درجا طرف رو حذف میکردم چون قطعاً چیزی از
اخطار:
اگر پستی در مورد این ویدیو گذاشتید سریعاً پاک کنید، آبروتون نره.
حالا استدلال این داستان چیه ؟
پست بعدی رو بخونید.
قطعاً، دیدید.
با این داستان پخش شده که ای وای دوتا AI تصمیم گرفتند یک زبان جدید و بهینه برای خودشون استفاده کنند.
اولین باری که دیدم خندیدم و گفتم، چه فکر مریضی (اونی که درست کرده)
بعد دیدم کلی آدم خیلی جدی دارند ازش تعریف میکنند، بخصوص مثلاً متخصصهای هوش مصنوعی.
خیلی ازین آدما، سنیور هستند مثلاً ولی اگر این سوال مصاحبه بود من درجا طرف رو حذف میکردم چون قطعاً چیزی از
AI
نفهمیده.اخطار:
اگر پستی در مورد این ویدیو گذاشتید سریعاً پاک کنید، آبروتون نره.
حالا استدلال این داستان چیه ؟
پست بعدی رو بخونید.
دستاوردهای یادگیری عمیق(InTec)
این ویدئو رو دیدید ؟ قطعاً، دیدید. با این داستان پخش شده که ای وای دوتا AI تصمیم گرفتند یک زبان جدید و بهینه برای خودشون استفاده کنند. اولین باری که دیدم خندیدم و گفتم، چه فکر مریضی (اونی که درست کرده) بعد دیدم کلی آدم خیلی جدی دارند ازش تعریف میکنند،…
فقط کافیه ۱ ساعت راجب
با اینکه
من خیلی ساده میگم، که اینا هم بفهمند :
۱- همهی ما میدونیم
یعنی اگر یک مدل مطالب زیادی در مورد "کامپیوتر صنعتی" دیده باشه، وقتی شما کلمه "کامپیوتر" رو بهش بدید احتمال زیادی (عددی نزدیک به ۱) میده که کلمه بعدی "صنعتی" باشه.
خب حالا با این وضعیت، چنین مدلی میتونه beep رو ایجاد کنه و بفهمه ؟
۲- این مدلها برای درک زبان در طول زمان آموزش، شروع به ساخت یک فضای برداری میکنند که هر کلمه رو به یک بردار عددی تبدیل میکنه اصطلاحاً بهش میگیم
۳- فرض کنید یک مدل اتفاقاً beep رو هم آموزش دیده، یعنی شما علاوه بر اون دیکشنری کلمات دنیا یک دیکشنری خاص هم بهتون داده شده برای تبدیل آوا و صدای beep به متن (مثل کد مورس)
شما میتونید کد مورس بزنید ولی وقتی دیکشنری رو کس دیگری نداره چطور میتونه با شما ارتباط برقرار کنه ؟
پس حتماً باید هر ۲ مدل روی صدای beep علاوه بر متنهای اینترنت آموزش دیده باشند.
پس اینکه خودشون به این زبان رسیده باشه، دروغ محض هست و از فیلمهای دهه ۸۰-۹۰ میلادی هالیوود میاد.
ولی حتی مورد آموزش دیدن روی beep هم در کار نیست و این رو فقط باید برنامهنویس باشید تا بفهمید (نیازی به سواد هوش مصنوعی هم ندارد حتی فهمیدنش)
ابتدای ویدئو هر ۲ مدل، به انگلیسی صحبت میکنند که طبیعی هست و هیچ ایرادی ندارد؛ اما بعد مدل دوم پیشنهاد استفاده از زبان مشترک و بهینه رو میده و ادعا شده این زبان ساخت خودشون هست.
۱- پس آدمی که فیلم گرفته نمیتوانسته بفهمه صحبت بین اینها چی هست.
همونطور که شما اگر فرانسه ٫ آلمانی تمرین نکرده باشی نخواهی فهمید گفتگو بین دو نفر چه معنایی داره
۲- کدهای فرانت ٫ اپلیکیشن هر ۲ مدل تا قبل از سوییچ شدن زبان هیچ متنی رو چاپ نمیکردند، چرا یک دفعه سورس کد آپدیت شد و شروع به چاپ متنها توی زبان جدید کرد ؟!
۳- اگر beep بهینهتر هست، که از نظر محاسبات یک مدل همچین چیزی رو میگه، چرا مدل باید زحمت تولید متن به انگلیسی رو هم همزمان بکشه ؟
۴- چرا مدل تبدیل متن به گفتار یکباره، علاوه بر خروجی باید ورودیش رو هم توی خروجی ارسال کنه و چرا خروجی مدل تبدیل به گفتار و متن شد به یکباره ؟
آقا٫خانم مثلاً متخصص، یکم نحوه عملکرد مدلهایی که زدی توش تخصص داری رو بخون حداقل.
من این پست رو تو صفحه کسی دیدم که توی پستهای مختلف؛ خودش رو متخصص
واقعاً چی میکشیم از دست این جماعت
LLM
ها خونده باشید تا با منطق ثابت کنید این ویدئو کاملاً تقلب هست ولی خب خیلیها نفهمیدن.با اینکه
ML Researcher / Engineer
هستند مثلاً.من خیلی ساده میگم، که اینا هم بفهمند :
۱- همهی ما میدونیم
LLM
چیزی نیست جز یک مدل احتمالاتی که یاد میگیره بر اساس آنچه در اینترنت از متنها دیده به ترکیب کنار هم قرار گرفتن کلمات عددی بین 0-1 بده، و بر اساس این اعداد کلمه بعدی رو پیشبینی کنه.یعنی اگر یک مدل مطالب زیادی در مورد "کامپیوتر صنعتی" دیده باشه، وقتی شما کلمه "کامپیوتر" رو بهش بدید احتمال زیادی (عددی نزدیک به ۱) میده که کلمه بعدی "صنعتی" باشه.
خب حالا با این وضعیت، چنین مدلی میتونه beep رو ایجاد کنه و بفهمه ؟
۲- این مدلها برای درک زبان در طول زمان آموزش، شروع به ساخت یک فضای برداری میکنند که هر کلمه رو به یک بردار عددی تبدیل میکنه اصطلاحاً بهش میگیم
Embedding
و این یعنی فرض کنید یک دیکشنری به شما داده بشه و بگم همه کلمات دنیا توی این دیکشنری هست (مدلها خلاقیت ندارند، پس این فرض رو داشته باشید) چطور شما میتونید از کلمات داخل دیکشنری محدود به beep برسید ؟! ۳- فرض کنید یک مدل اتفاقاً beep رو هم آموزش دیده، یعنی شما علاوه بر اون دیکشنری کلمات دنیا یک دیکشنری خاص هم بهتون داده شده برای تبدیل آوا و صدای beep به متن (مثل کد مورس)
شما میتونید کد مورس بزنید ولی وقتی دیکشنری رو کس دیگری نداره چطور میتونه با شما ارتباط برقرار کنه ؟
پس حتماً باید هر ۲ مدل روی صدای beep علاوه بر متنهای اینترنت آموزش دیده باشند.
پس اینکه خودشون به این زبان رسیده باشه، دروغ محض هست و از فیلمهای دهه ۸۰-۹۰ میلادی هالیوود میاد.
ولی حتی مورد آموزش دیدن روی beep هم در کار نیست و این رو فقط باید برنامهنویس باشید تا بفهمید (نیازی به سواد هوش مصنوعی هم ندارد حتی فهمیدنش)
ابتدای ویدئو هر ۲ مدل، به انگلیسی صحبت میکنند که طبیعی هست و هیچ ایرادی ندارد؛ اما بعد مدل دوم پیشنهاد استفاده از زبان مشترک و بهینه رو میده و ادعا شده این زبان ساخت خودشون هست.
۱- پس آدمی که فیلم گرفته نمیتوانسته بفهمه صحبت بین اینها چی هست.
همونطور که شما اگر فرانسه ٫ آلمانی تمرین نکرده باشی نخواهی فهمید گفتگو بین دو نفر چه معنایی داره
۲- کدهای فرانت ٫ اپلیکیشن هر ۲ مدل تا قبل از سوییچ شدن زبان هیچ متنی رو چاپ نمیکردند، چرا یک دفعه سورس کد آپدیت شد و شروع به چاپ متنها توی زبان جدید کرد ؟!
۳- اگر beep بهینهتر هست، که از نظر محاسبات یک مدل همچین چیزی رو میگه، چرا مدل باید زحمت تولید متن به انگلیسی رو هم همزمان بکشه ؟
۴- چرا مدل تبدیل متن به گفتار یکباره، علاوه بر خروجی باید ورودیش رو هم توی خروجی ارسال کنه و چرا خروجی مدل تبدیل به گفتار و متن شد به یکباره ؟
آقا٫خانم مثلاً متخصص، یکم نحوه عملکرد مدلهایی که زدی توش تخصص داری رو بخون حداقل.
من این پست رو تو صفحه کسی دیدم که توی پستهای مختلف؛ خودش رو متخصص
LLM
ها و البته جزو سازنده های برترین LLM
های فارسی معرفی کرده بود، از بد روزگار کلی اسکل تر از خودشم ازش بابت پست خوبش تشکر کرده بودن.واقعاً چی میکشیم از دست این جماعت
دستاوردهای یادگیری عمیق(InTec)
فقط کافیه ۱ ساعت راجب LLM ها خونده باشید تا با منطق ثابت کنید این ویدئو کاملاً تقلب هست ولی خب خیلیها نفهمیدن. با اینکه ML Researcher / Engineer هستند مثلاً. من خیلی ساده میگم، که اینا هم بفهمند : ۱- همهی ما میدونیم LLM چیزی نیست جز یک مدل احتمالاتی که…
چون این رو خیلیها فرستادید.
لذت میبرم میبینم اعضای کانال همه حرفهای و با دقت هستند، دمتون گرم آدم امیدوار میشه.
Github
لذت میبرم میبینم اعضای کانال همه حرفهای و با دقت هستند، دمتون گرم آدم امیدوار میشه.
Github
GitHub
GitHub - ggerganov/ggwave: Tiny data-over-sound library
Tiny data-over-sound library. Contribute to ggerganov/ggwave development by creating an account on GitHub.
Forwarded from Python Hints
ابزار تقلب توی مصاحبه :
Interview Coder AI tool
این ابزار کاملاً open source هم هست، حالا چرا اینجا گذاشتم ؟
نه برای اینکه تقلب کنید (چون درجا گیر میوفتید اگر طرف کار بلد باشه)
برای این هست که فوقالعاده میشه ازش برای آمادگی مصاحبه فنی استفاده کرد؛ اینکه چی بگید رو هم براتون میذاره.
بخصوص بدرد مرحله اول و دوم مصاحبه که کد زدن و الگوریتم و ... داره میخوره
Interview Coder AI tool
این ابزار کاملاً open source هم هست، حالا چرا اینجا گذاشتم ؟
نه برای اینکه تقلب کنید (چون درجا گیر میوفتید اگر طرف کار بلد باشه)
برای این هست که فوقالعاده میشه ازش برای آمادگی مصاحبه فنی استفاده کرد؛ اینکه چی بگید رو هم براتون میذاره.
بخصوص بدرد مرحله اول و دوم مصاحبه که کد زدن و الگوریتم و ... داره میخوره
GitHub
GitHub - ibttf/interview-coder: An invisible desktop application to help you pass your technical interviews.
An invisible desktop application to help you pass your technical interviews. - ibttf/interview-coder
#Quick
چون هزینه دورههای prompt engineering رو برام فرستادید و گفتید ارزش رفتن داره :
پاسخ کوتاه : خیر به هیچ وجه (مخاطبهای کانال)
پاسخ بلند : بیش از ۹۰٪ شما قطعاً برنامهنویس هستید با
بهترین نتایج رو خواهید گرفت.
راه سادهتر، این راه همیشه جواب نیست ولی خب؛ برای مدلهایی که از یک مدل بزرگتر آموزش دیدند (distillation, synthétique data, ....) میتونید از مدل بزرگتر بخواهید که یک پرامپت استاندارد برای متن درخواست شما بنویسه؛ بعد متن رو بهش میدید و پرامپت رو میگیرید.
به خوبی روش قبلی نیست ولی نتایجش بسیار عالیه؛ prompt engineering ممکنه ساعتها طول بکشه تا به پرامپت خوب برسه؛ ما تو دقیقه پرامپت بهتر رو میزنیم توی تیم خودم.
حداقل تو بیش از ۹۵٪ مواقع.
اگر تست کردید این تکنیک جواب داد و تکنیک رو دوست داشتید.
متن رو با منبع به اشتراک بذارید؛ شاید بیشتر از این تجربیات مخصوص تیم خودم رو به اشتراک گذاشتم.
چون هزینه دورههای prompt engineering رو برام فرستادید و گفتید ارزش رفتن داره :
پاسخ کوتاه : خیر به هیچ وجه (مخاطبهای کانال)
پاسخ بلند : بیش از ۹۰٪ شما قطعاً برنامهنویس هستید با
markdown
هم آشنایی دارید (readme پروژه رو github رو مینویسید) بجای وقت گذاشتن روی حفظ کردن prompt engineering, ... نگاهی به دیتاستهایی که مدل هوش مصنوعی روش آموزش دیده بندازید و بر اساس پترن اونها بهش پرامپت بدید.بهترین نتایج رو خواهید گرفت.
راه سادهتر، این راه همیشه جواب نیست ولی خب؛ برای مدلهایی که از یک مدل بزرگتر آموزش دیدند (distillation, synthétique data, ....) میتونید از مدل بزرگتر بخواهید که یک پرامپت استاندارد برای متن درخواست شما بنویسه؛ بعد متن رو بهش میدید و پرامپت رو میگیرید.
به خوبی روش قبلی نیست ولی نتایجش بسیار عالیه؛ prompt engineering ممکنه ساعتها طول بکشه تا به پرامپت خوب برسه؛ ما تو دقیقه پرامپت بهتر رو میزنیم توی تیم خودم.
حداقل تو بیش از ۹۵٪ مواقع.
اگر تست کردید این تکنیک جواب داد و تکنیک رو دوست داشتید.
متن رو با منبع به اشتراک بذارید؛ شاید بیشتر از این تجربیات مخصوص تیم خودم رو به اشتراک گذاشتم.
#موقت
اگر موضوع #تبلیغات باشه، بنر + پیشنهاد + مدل تبلیغات و مبلغ رو به آیدی من بفرستید
@abbasi_ai
درحال بررسی موضوع هستیم.
پ.ن: شخصاً ممکنه امکان پاسخگویی در لحظه رو نداشته باشم.
برای همین اعلام کردم، تمام موضوع رو خودتون بگید چیزی به عنوان ذکر مبلغ و ... از طرف من وجود نداره.
پیشنهادات رو بررسی میکنیم.
اگر موضوع #تبلیغات باشه، بنر + پیشنهاد + مدل تبلیغات و مبلغ رو به آیدی من بفرستید
@abbasi_ai
درحال بررسی موضوع هستیم.
پ.ن: شخصاً ممکنه امکان پاسخگویی در لحظه رو نداشته باشم.
برای همین اعلام کردم، تمام موضوع رو خودتون بگید چیزی به عنوان ذکر مبلغ و ... از طرف من وجود نداره.
پیشنهادات رو بررسی میکنیم.
دستاوردهای یادگیری عمیق(InTec)
#موقت اگر موضوع #تبلیغات باشه، بنر + پیشنهاد + مدل تبلیغات و مبلغ رو به آیدی من بفرستید @abbasi_ai درحال بررسی موضوع هستیم. پ.ن: شخصاً ممکنه امکان پاسخگویی در لحظه رو نداشته باشم. برای همین اعلام کردم، تمام موضوع رو خودتون بگید چیزی به عنوان ذکر مبلغ…
۷ تا سیستم برای ۷ نفر.
همه میدونید، چیزی که من ازش متنفرم تبلیغات هست. ۷-۸ سال کانال pytens و ۲ سال pyhints هیچوقت تبلیغات به خودش ندیده؛ نه اینکه بد باشه، فقط شخصاً حوصله تبلیغات ندارم.
ولی میدونم اگر اصل موضوع رو میذاشتم، خیلیها برای کمک کردن اعلام حضور میکردند ولی هرکسی منو میشناسه میدونه ازینکار خوشم نمیاد.
۲ سال پیش هم، همچین شرایطی پیش اومد و اون موقع با چندتا از دوستان کار ساعتی و پروژه آنلاین انجام دادیم تا پول اون کار جور بشه.
موضوع ازین قرار بود که یکی از دوستان، برای یک بنر کمپین شرکت به یک مشکل اساسی خورد و هیچکس رو برای ادیت نداشت؛ ولی آخر شب یک شخصی رو پیدا کرد که بهش گفت میتونه این کار رو انجام بده ولی سیستم نداره و این دوستمون باید خودش بره پیشش؛ کار به خوبی انجام شد و تمام ...
بعد از مدتی متوجه شدیم اون شخص این دورهها رو آموزش دیده ولی سیستم و ... نداره و بخاطر شرایط خانواده نمیتونه هم خرید کنه و حتماً هم باید کار کنه؛ برای همین کارگری حمل بار شده.
این دوستمون توی گروه گذاشت و یکی از بچهها سیستم قدیمی خودش رو بهش داد و یکی دیگه از دوستان زحمت آپگرید اون رو کشید.
چندوقت پیش اون پسر، برای یک نفر دیگه اینکار رو کرد؛ خرید لپتاپ استوک و آپگرید اون.
حالا این رفیق ما افتاده دنبال آدمایی که سواد دارند اما تجهیزات ندارند.
۷ نفر رو پیدا کرد و پیام داد که ۳ نفر اینها حتی شغل هم دارند (تازه شروع کردند).
داستان اینجوری هست، بچههایی که انتخاب میکنه، مصاحبه میرن یا نمونه کار میدند شغل پیدا میکنند و بعد این دوستمون براشون سیستم جور میکنه با ۲ تا شرط :
۱- اگر اخراج بشن یا استعفا بدند، سیستم تحویل نفر بعدی بشه
۲- اگر شرایط مالی خودشون خوب شد، همینکار رو برای یک نفر دیگه انجام بدند.
تا الان برای ۵ نفر اینکار رو کرده، و این ماه ۷ نفر رو پیدا کرده ۳ نفر از اول ماه سرکار هستند (با سیستمهای کافینت و دانشگاه و ...) و ۴ نفر هم از ۱ اردیبهشت.
فقط ۲ تا ازین بچهها برنامهنویس هستند؛ من امکان انجام کار ساعتی و donate بیشتر نداشتم برای همین خواستم از تبلیغات کانالها استفاده کنم (حداقل پول خرید SSD رو که در میاورد؛ با توجه به پیشنهاداتی که شد بیشتر هم میشد البته)
الان که این داستان رو میگم، ۳۰ نفر از بچهها توی کارهای مختلف قبول کمک کردند و ۷ تا سیستم استوک براشون قراره خرید و آپگرید بشه.
دوتا از دوستان هم که آشنایی سختافزار دارند، قرار شد زحمت آپگریدها رو بکشند و البته بچههای تخصصی هر رشته هم بررسی کنند که لپتاپها واقعاً قابل استفاده باشه.
توی این تعطیلات هم بچهها قبول کردند این ۷ نفر رو آموزش بدند که مطمئن بشوند، دوره آزمایشی رو با موفقیت پشت سر خواهند گذاشت.
دلیل پست مربوط به تبلیغات این بود، که خب دیگه نیازی به قبول تبلیغات نیست.
همه میدونید، چیزی که من ازش متنفرم تبلیغات هست. ۷-۸ سال کانال pytens و ۲ سال pyhints هیچوقت تبلیغات به خودش ندیده؛ نه اینکه بد باشه، فقط شخصاً حوصله تبلیغات ندارم.
ولی میدونم اگر اصل موضوع رو میذاشتم، خیلیها برای کمک کردن اعلام حضور میکردند ولی هرکسی منو میشناسه میدونه ازینکار خوشم نمیاد.
۲ سال پیش هم، همچین شرایطی پیش اومد و اون موقع با چندتا از دوستان کار ساعتی و پروژه آنلاین انجام دادیم تا پول اون کار جور بشه.
موضوع ازین قرار بود که یکی از دوستان، برای یک بنر کمپین شرکت به یک مشکل اساسی خورد و هیچکس رو برای ادیت نداشت؛ ولی آخر شب یک شخصی رو پیدا کرد که بهش گفت میتونه این کار رو انجام بده ولی سیستم نداره و این دوستمون باید خودش بره پیشش؛ کار به خوبی انجام شد و تمام ...
بعد از مدتی متوجه شدیم اون شخص این دورهها رو آموزش دیده ولی سیستم و ... نداره و بخاطر شرایط خانواده نمیتونه هم خرید کنه و حتماً هم باید کار کنه؛ برای همین کارگری حمل بار شده.
این دوستمون توی گروه گذاشت و یکی از بچهها سیستم قدیمی خودش رو بهش داد و یکی دیگه از دوستان زحمت آپگرید اون رو کشید.
چندوقت پیش اون پسر، برای یک نفر دیگه اینکار رو کرد؛ خرید لپتاپ استوک و آپگرید اون.
حالا این رفیق ما افتاده دنبال آدمایی که سواد دارند اما تجهیزات ندارند.
۷ نفر رو پیدا کرد و پیام داد که ۳ نفر اینها حتی شغل هم دارند (تازه شروع کردند).
داستان اینجوری هست، بچههایی که انتخاب میکنه، مصاحبه میرن یا نمونه کار میدند شغل پیدا میکنند و بعد این دوستمون براشون سیستم جور میکنه با ۲ تا شرط :
۱- اگر اخراج بشن یا استعفا بدند، سیستم تحویل نفر بعدی بشه
۲- اگر شرایط مالی خودشون خوب شد، همینکار رو برای یک نفر دیگه انجام بدند.
تا الان برای ۵ نفر اینکار رو کرده، و این ماه ۷ نفر رو پیدا کرده ۳ نفر از اول ماه سرکار هستند (با سیستمهای کافینت و دانشگاه و ...) و ۴ نفر هم از ۱ اردیبهشت.
فقط ۲ تا ازین بچهها برنامهنویس هستند؛ من امکان انجام کار ساعتی و donate بیشتر نداشتم برای همین خواستم از تبلیغات کانالها استفاده کنم (حداقل پول خرید SSD رو که در میاورد؛ با توجه به پیشنهاداتی که شد بیشتر هم میشد البته)
الان که این داستان رو میگم، ۳۰ نفر از بچهها توی کارهای مختلف قبول کمک کردند و ۷ تا سیستم استوک براشون قراره خرید و آپگرید بشه.
دوتا از دوستان هم که آشنایی سختافزار دارند، قرار شد زحمت آپگریدها رو بکشند و البته بچههای تخصصی هر رشته هم بررسی کنند که لپتاپها واقعاً قابل استفاده باشه.
توی این تعطیلات هم بچهها قبول کردند این ۷ نفر رو آموزش بدند که مطمئن بشوند، دوره آزمایشی رو با موفقیت پشت سر خواهند گذاشت.
دلیل پست مربوط به تبلیغات این بود، که خب دیگه نیازی به قبول تبلیغات نیست.
دستاوردهای یادگیری عمیق(InTec)
این موضوع خیلیهارو سوزوند و یک سری هم خیلی منطقی گفتند که باور ندارند همیچین اتفاقی شدنی باشه: یک نفر توی توییتر به اسم levelsio یک توییتی زده و گفته که آقا من تو عمرم بازی نویسی انجام ندادم ولی یک شبیهساز پرواز توی ۳ ساعت درست کردم و ۱۰۰٪ کد رو Grok3 برام…
این پست رو یادتون هست، دولوپر این بازی به درآمد رسیده و توی توییتهای مختلف داره مبلغش رو اعلام میکنه
۱۰ تا بازی ساخته شد، که همه موارد به درآمد بالای 10000$ رسیدند.
کار به جایی رسیده که خود ایلان ماسک هم پست راجبش زده و این یعنی درآمد بیشتر برای این افراد.
۱۰ تا بازی ساخته شد، که همه موارد به درآمد بالای 10000$ رسیدند.
کار به جایی رسیده که خود ایلان ماسک هم پست راجبش زده و این یعنی درآمد بیشتر برای این افراد.
یک صحبتی توی یکی از گروها دیدم راجب خرید
۱.
میزان
۲-
این دستگاه حافظه 128 گیگابایتی خواهد داشت؛ و طبق ادعای خود
۳-
هم تا ۱۲۸ گیگ حافظه خواهد داشت که ۹۶ گیگ اون رو میشه به
پس بنظرم ۱-۲ نسل آینده
شخصا منتظر نسلهای بعدی
RTX5090
برای کارهای هوش مصنوعی؛ نظر شخصی خودم این هست که ارزش خرید نداره بخصوص مدلی که باقی رقیبها وارد شدند:۱.
Mac studio M3 Ultra
میزان
unified memory
این دستگاه تا ماکزیمم 512 گیگ هست یعنی مدل 621 میلیارد پارامتری R1
رو میتونید بصورت Q4
روی این دستگاه اجرا کنید.۲-
NVIDIA DIGITS
این دستگاه حافظه 128 گیگابایتی خواهد داشت؛ و طبق ادعای خود
nvidia
بدرد inference
میخوره شدید وتا ۲۰۰ میلیارد پارامتر رو پشتیبانی میکنه.۳-
Framwork Desktop
هم تا ۱۲۸ گیگ حافظه خواهد داشت که ۹۶ گیگ اون رو میشه به
GPU
اختصاص داد (مثل چیپهای اپل عمل میکنه)پس بنظرم ۱-۲ نسل آینده
nvidia
حتما تمرکز به سمت افزایش حافظه هم خواهد رفت؛ همونطور که خیلی ها فکر میکردند 5090
به ۴۰ گیگ برسه و یا قیمت بهتری داشته باشه که شاید بشه گفت nvidia
با معرفی nvidia DIGITS
یکم کار رو جمع کرد.شخصا منتظر نسلهای بعدی
GPU
خواهم موند؛ بصرفه ترین انتخاب رو هم فعلا 3090
میدونم.این دو مورد با یکی از دوستان صبح توی گروه صحبت شد :
شخصا ازشون استفاده نکردم؛ Mercury رو قبلتر راجب ایدهاش صحبتهایی شده بود ولی با وجود
دستاوردهای این مدل قطعا جذاب هست ولی درحال حاضر مدلهای بهتری برای استفاده دارم. اگر خواستید هر دو مدل رو میتونید لوکال تست کنید
اضافه کنم:
شخصا دستاورد
mercury code medium
و QwQ 32b code
شخصا ازشون استفاده نکردم؛ Mercury رو قبلتر راجب ایدهاش صحبتهایی شده بود ولی با وجود
Grok3
و Deepseek R1
واقعا کم پیش میاد از مدل دیگهای بخوام استفاده کنم.دستاوردهای این مدل قطعا جذاب هست ولی درحال حاضر مدلهای بهتری برای استفاده دارم. اگر خواستید هر دو مدل رو میتونید لوکال تست کنید
اضافه کنم:
شخصا دستاورد
Mercury
برام اهمیت بیشتری داره؛ ولی منتظرم یکی از شرکتها به رایگان دپلوی کنهاپل برای پشتیبانی سرویسهای
که خب حتماً شنیدید مشکلاتش زیاد بود و رضایت نداشت و ...
توی پشت صحنه داشته سرویس دهندههای دیگر رو هم تست میکرده و اینطور که شایعه شده، اپل
AI
خودش یک قراردادی رو با OpenAi
داشت.که خب حتماً شنیدید مشکلاتش زیاد بود و رضایت نداشت و ...
توی پشت صحنه داشته سرویس دهندههای دیگر رو هم تست میکرده و اینطور که شایعه شده، اپل
Gemini
رو جایگزین ChatGpt
کرده.#Quick
احتمال بسیار زیاد توی ۲ ماه آینده شاهد انتشار
زبانهای بیشتری بهش اضافه شده (فقط چینی و انگلیسی نیست)
نتایج بهتری روی
احتمال بسیار زیاد توی ۲ ماه آینده شاهد انتشار
Deepseek R2
خواهیم بود.زبانهای بیشتری بهش اضافه شده (فقط چینی و انگلیسی نیست)
نتایج بهتری روی
Coding
نشون داده (هنوز ترین تموم نشده)