Telegram Web Link
مدل QwQ اومده ۳۲ میلیارد پارامتر داره؛ خیلی هم شباهت داره به deepseek r1 و قطعا خیلی‌هاتون تا امروز ازش استفاده کردید
اما
من معرفیش نکردم چون ۲ تا سوال اولی که ازش پرسیدم یکیش ۱۰ دقیقه طول کشید تا فکر کنه و دومی ۱۵-۲۰ دقیقه و این اصلا قابل قبول نیست (مفید نیست).

خیلی‌های دیگه هم به همین نتیجه رسیدند؛ و حتی شاید باورتون نشه یک Query خیلی ساده هم پیدا شده که اول سوالتون بذارید (برای کد زدن) خروجی مدل
Qwen2.5-coder 

به اندازه QwQ بهبود پیدا می‌کنه تو بسیاری از سناریوهای مربوط به کد زدن و پرامپت اینه :

Analyze the system and then write the code in python


این رو به اول پرامپت‌ها اضافه کنید و مجدد از Qwen2.5-coder استفاده کنید و از نتایج بسیار بهتر لذت ببرید.


پ.ن : الان تست کردم؛ مورد بالا رو به QwQ هم بدید خروجیش بهتر می‌شه و زمان تفکر رو هم پایین میاره برای مدل.
(حالا بگذریم ازین که تفکر نیست و تست سناریوهای مختلف هست)
👍134
دکتر حبیب‌زاده از دوستان خیلی خوب بنده هست که قبلا هم کانال‌ یوتیوب و لایو‌های دیگرشون رو معرفی کردم مخصوصا وقتی دوره‌های عملی دانشگاهای کانادا رو درس می‌دادند.

یک سری ویدئو دارند توی یوتیوب قرار می‌دهند درمورد LLM ها که مقدماتی هم هست (بخش سوم)

Youtube Link

دیدن آموزش‌های ایشون همیشه برام لذت بخش بوده؛ بسیار روان و ساده توضیح می‌دهند (مناسب برای شروع و درک عمیق مطالب) طوری که نمی‌شه مطلبی رو ایشون توضیح بدند و کسی متوجه نشه.


همیشه هم مطالب رو رایگان در اختیار دیگران می‌گذارند.
توصیه می‌کنم اگر به این موضوعات علاقه دارید حتما ویدئوهای یوتیوب ایشون رو ببینید.
32👍13
دستاوردهای یادگیری عمیق(InTec)
#Roadmap deep learning (zero to production) یک دوره دیگه هم به این مجموعه اضافه شد. مخصوص اونهایی که میخوان وارد صنعت بشوند و اینبار از MIT تجربه من نشون داده ۸۰٪ این مفاهیم و کانسپت‌ها و البته پیاده‌سازی‌هارو ۹۹٪ درصد افرادی که توی این فیلد کار می‌کنند…
من اینجا همه‌ی آن چیز که برای deep learning لازمه رو یک رودمپ کردم؛ از بهترین دوره‌های دنیا که اتفاقاً همه هم رایگان هستند.

یکی از اعضای کانال، اشاره داشتند که راجب
Image Processing
اما چیزی نگفتم و کاملاً هم حق دارند.

اما قبلش :
توی ۱۰ سالی که Image کار کردم هیچ موقع یک کتاب یا یک دوره مخصوص پردازش تصویر که شامل همه چیز باشه ندیدم و و احتمال ۹۹٪ هم نخواهم دید.

Image Processing
فقط چندتا تکنیک نرمال نیست که با یک دوره در بیاد، نیاز به خلاقیت داره برای همین هم من منبع خوبی توش پیدا نکردم.
( همین بحث برای پردازش متن و سیگنال هم هست )

اما توی این همه سال همیشه یک دوره رو به نیروهای جونیور خودم معرفی می‌کردم (اینم رایگان) که حداقل ببینند هر تکنیک چه تاثیری روی تصویر خواهد داشت.

Youtube Channel

حتماً دوره‌های این کانال رو ببینید.

در نهایت آیا می‌دونید ۹۰٪ پست‌ها بدون ذکر منبع توی توییتر و لینکدین بصورت لغت به لغت و به‌نام صاحب اکانت پخش می‌شه ؟

نکته‌ای ندارم فقط خواستم ببینم می‌دونید یا خیر؟
۹۰٪ وقتا توی لینکدین دارم تجربیات خودم رو زیر یک اکانت دیگه لایک می‌کنم.
👍5023
جوابی به بیشترین سوال، اینو باید توی @pyhints می‌زدم ولی حالا که اینجا هستم بذارید بنویسم و اونجا فروارد کنم.

وقتی وارد یک کانال یوتیوب می‌شید (ویدئو مفید با محتوای مناسب)
لایک - کامنت - سابسکرایب رو فراموش نکنید.

دانلود کردن ویدیو و بستن ویدئو توی دقیقه ۵ (حتی اگر لایک کنید) باعث میشه یوتیوب فکر کنه اون ویدیو جذاب یا مفید نبوده و کمتر ریکامند بده اون رو.
طبیعی هست که بخواید دانلود کنید ویدئو‌هارو هزینه و سرعت اینترنت و ...
ولی حداقل یکبار با کیفیت پایین هم که شده ویدئو رو ببینید.

حالا چرا این رو می‌گم :
۱- انگیزه دادن
۲- حمایت کردن

توی این مدتی که لایوهای fluent python کتابی راجب مباحث advance تر در پایتون رو آپلود می‌کردم راجب قوانین یوتیوب بسیار یاد گرفتم.

از بسیاری از دوستان Senior هم خواستم که مباحث دیگری مثل
Linux, Ansible, Docker, K8s, Nginx, Backend, Rust, Security, ...

رو باهم کار کنیم (مباحثی که خودم راجبشون به اندازه کار production سواد دارم) اما تقریباً خروجی همه صحبت‌ها یک چیز بود.

جامعه ایران نگاه نمی‌کنه، دانلود می‌زنه که زودتر صفحه رو ببنده


برای همین بچه‌هایی که تدریس شغل آخرشون هست رو نمی‌شه مجاب کرد به آموزش دادن و خدا می‌دونه که بهترین آموزش‌ها دست این افراد هست (بخاطر تجربه بالایی که در زمینه پروداکشن دارند)

خلاصه که سعی کنید از بچه‌های یوتیوبر حمایت کنید (ترافیک رو خرج اینستا، یوتیوبر‌های دلقک نکنید درست می‌شه‌ها) که منم بتونم اینجا کانال‌ها و آموزش‌های فارسی بیشتری رو معرفی کنم.

بچه‌های سنیور، نیازی به درآمد یوتیوب فارسی ندارند چون جامعه هدف فارسی انقدر بزرگ نیست
ولی حمایت شما بهشون انگیزه میده برای ادامه دادن.



شخصاً بسیار درگیر مشکلات هستم، توی اولین فرصت لایو‌های Fluent Python رو ادامه خواهم داد (شاید ۳ بار در هفته)
71👍28
اینا قوی نیستند ما ضعیف هستیم.

سمت راست رو نقی :
۱- ۱۷ روز اعتصاب غذا، نه لاغر شد نه ضعف داشت نه هیچ
۲- تازه چندسال پیش وضعیت کلیه‌اش وخیم بود و داشت از دست می‌داد

سمت چپ توماج :
۱- پاهاش رو شکستن
۲- چشمش داشت کور می‌شد
۳- بقول خودش انقدر زدنش که همه اعضای بدنش به مشکل خورد.
(فقط زرنگی کرد، دستاشو گرفت جلو سر و صورت)

هیچی دیگه جفتشون هم فردا صبحش پا شدند رفتن دور دور.


خلاصه ماها ضعیفیم، اینا قوی نیستند.

این داستان، #توله_مجاهد و دوستانش (افسانه دروغ‌های زیبا)
👍17919
تو زندگیم ۲ تا چیز رو ندیدم :
۱- جنگ جهانی
۲- سقوط دیکتاتور

خدارو شکر دومی رو شاهدش هستم و اولی رو نمی‌بینم 🌹🌹
Please open Telegram to view this post
VIEW IN TELEGRAM
90👍26
بنظرم
LCM
بهتر از LLM جواب خواهد داد برای تعداد زیادی از تسک‌ها

راستی
LCM: Large Concept Model
👍374
Forwarded from Python Hints
هلوکاست ایرانی

یک زمانی شهردار تهران رو بخاطر ترافیک تهران اعدام کردند.

آخوند جز ویرانی، برای ایران دستاورد نداشت.
👍1276
Forwarded from RandRng
مدل خودشون:


بی‌غیرت، اون مسئولیه که داره اینو القا می‌کنه که
حدود ۸ میلیون خمینی فدای ۱۰۰ تا فرانکلین

هر ۱۰۰ دلار حدوداً ۸ میلیون تومان
👍563
مدل کم حجم ولی خروجی خیره کننده :

Text 2 Speech

۸۲ میلیون پارامتر، واقعاً توی رنج پارامتر‌های این روزا خیلی عجیب هست.

یادمه زمانی که Inception v3 رکورد ImageNet رو زد همه از تعداد پارامترهاش شکه شدیم بنظرتون چقدر بود ؟

۲۳ میلیون (ترین) ولی اون زمان بیش از حد زیاد بود.
👍306
کل یوتیوب پر شده از این مقاله :
https://arxiv.org/pdf/2501.00663

و تقریبا تمام دوستان دارند در مورد
Transformers v2.0
صحبت می‌کنند.
میشه بازم گوگل خالق و باعث انقلاب دیگری باشه یا این هم یک ترند تبلیغاتی دیگر هست ؟
25👍7
deepseek r1
منتشر شد؛ مقاله از نحوه ترین مدل - وزن‌ها و ... همه چیز
حتی مجوز commercial use رو هم داده

https://github.com/deepseek-ai/DeepSeek-R1
👍348
oh oh 


عجب خبری؛ یک محقق امنیتی تکنیکی رو پیدا کرده که باهاش از chatgpt برای DDOS کردن هر سایتی استفاده میشه کرد.
و چون از سرورهای chatgpt هم درخواست‌ها ارسال میشه مقابله باهاش راحت نیست؛ قطعا تیم close ai جلوی این رو میگیره ولی به این فکر کنید که همه شرکتهایی که این خدمات رو میدند به احتمال زیاد این باگ رو دارند.

ندید میگم؛ ۹۹٪ شرکتهای ایرانی که مدل رو خودشون دپلوی می‌کنند این باگ رو دارند. با توجه به چیزهایی که دیدم.

ReadMore
👍1716
دستاوردهای یادگیری عمیق(InTec)
Youtube سرمایه گذاری 500 میلیارد دلاری (حداقل) روی زیرساخت‌های هوش مصنوعی؛ این فقط برای سرور و ... هست طبق متنی که Close/Open AI منتشر کرده.
روز اول ترامپ؛
بیشتر از حداقل ۱۶ سال گذشته رئیس جمهورهای ایران برای کشورش سرمایه‌گذاری و ... به همراه آورد.
یعنی مبالغ و کارهایی که توی روز اول انجام شد؛ حتی ۵٪ اش توی ۱۶ سال گذشته توی ایران انجام نشده.
👍515
بدترین سرویس پشتبانی که به عمرم دیدم :

ایرانسل هست با اختلاف، ۳ ماهه داره مشکل اینترنت من رو حل می‌کنه
دائم هم می‌گه، تا ۴۸ ساعت آینده کارشناسان ما مشکل شمارو حل خواهند کرد

سری آخر کلا سیمکارت قطع شد (به خدا جدی می‌گم)

پشتیبانی تالیا از ایرانسل قویتره 😂


پ.ن : اینجا گذاشتم برسه دستشون، چون توی کانال بودند بچه‌ها از ایرانسل
👍721
2025/07/14 13:03:16
Back to Top
HTML Embed Code: