Telegram Web Link
Forwarded from RandRng
توضیحات پست توی گروه مربوط به کانال Rust
مدل QwQ اومده ۳۲ میلیارد پارامتر داره؛ خیلی هم شباهت داره به deepseek r1 و قطعا خیلی‌هاتون تا امروز ازش استفاده کردید
اما
من معرفیش نکردم چون ۲ تا سوال اولی که ازش پرسیدم یکیش ۱۰ دقیقه طول کشید تا فکر کنه و دومی ۱۵-۲۰ دقیقه و این اصلا قابل قبول نیست (مفید نیست).

خیلی‌های دیگه هم به همین نتیجه رسیدند؛ و حتی شاید باورتون نشه یک Query خیلی ساده هم پیدا شده که اول سوالتون بذارید (برای کد زدن) خروجی مدل
Qwen2.5-coder 

به اندازه QwQ بهبود پیدا می‌کنه تو بسیاری از سناریوهای مربوط به کد زدن و پرامپت اینه :

Analyze the system and then write the code in python


این رو به اول پرامپت‌ها اضافه کنید و مجدد از Qwen2.5-coder استفاده کنید و از نتایج بسیار بهتر لذت ببرید.


پ.ن : الان تست کردم؛ مورد بالا رو به QwQ هم بدید خروجیش بهتر می‌شه و زمان تفکر رو هم پایین میاره برای مدل.
(حالا بگذریم ازین که تفکر نیست و تست سناریوهای مختلف هست)
دکتر حبیب‌زاده از دوستان خیلی خوب بنده هست که قبلا هم کانال‌ یوتیوب و لایو‌های دیگرشون رو معرفی کردم مخصوصا وقتی دوره‌های عملی دانشگاهای کانادا رو درس می‌دادند.

یک سری ویدئو دارند توی یوتیوب قرار می‌دهند درمورد LLM ها که مقدماتی هم هست (بخش سوم)

Youtube Link

دیدن آموزش‌های ایشون همیشه برام لذت بخش بوده؛ بسیار روان و ساده توضیح می‌دهند (مناسب برای شروع و درک عمیق مطالب) طوری که نمی‌شه مطلبی رو ایشون توضیح بدند و کسی متوجه نشه.


همیشه هم مطالب رو رایگان در اختیار دیگران می‌گذارند.
توصیه می‌کنم اگر به این موضوعات علاقه دارید حتما ویدئوهای یوتیوب ایشون رو ببینید.
دستاوردهای یادگیری عمیق(InTec)
من اینجا همه‌ی آن چیز که برای deep learning لازمه رو یک رودمپ کردم؛ از بهترین دوره‌های دنیا که اتفاقاً همه هم رایگان هستند.

یکی از اعضای کانال، اشاره داشتند که راجب
Image Processing
اما چیزی نگفتم و کاملاً هم حق دارند.

اما قبلش :
توی ۱۰ سالی که Image کار کردم هیچ موقع یک کتاب یا یک دوره مخصوص پردازش تصویر که شامل همه چیز باشه ندیدم و و احتمال ۹۹٪ هم نخواهم دید.

Image Processing
فقط چندتا تکنیک نرمال نیست که با یک دوره در بیاد، نیاز به خلاقیت داره برای همین هم من منبع خوبی توش پیدا نکردم.
( همین بحث برای پردازش متن و سیگنال هم هست )

اما توی این همه سال همیشه یک دوره رو به نیروهای جونیور خودم معرفی می‌کردم (اینم رایگان) که حداقل ببینند هر تکنیک چه تاثیری روی تصویر خواهد داشت.

Youtube Channel

حتماً دوره‌های این کانال رو ببینید.

در نهایت آیا می‌دونید ۹۰٪ پست‌ها بدون ذکر منبع توی توییتر و لینکدین بصورت لغت به لغت و به‌نام صاحب اکانت پخش می‌شه ؟

نکته‌ای ندارم فقط خواستم ببینم می‌دونید یا خیر؟
۹۰٪ وقتا توی لینکدین دارم تجربیات خودم رو زیر یک اکانت دیگه لایک می‌کنم.
Please open Telegram to view this post
VIEW IN TELEGRAM
اینا قوی نیستند ما ضعیف هستیم.

سمت راست رو نقی :
۱- ۱۷ روز اعتصاب غذا، نه لاغر شد نه ضعف داشت نه هیچ
۲- تازه چندسال پیش وضعیت کلیه‌اش وخیم بود و داشت از دست می‌داد

سمت چپ توماج :
۱- پاهاش رو شکستن
۲- چشمش داشت کور می‌شد
۳- بقول خودش انقدر زدنش که همه اعضای بدنش به مشکل خورد.
(فقط زرنگی کرد، دستاشو گرفت جلو سر و صورت)

هیچی دیگه جفتشون هم فردا صبحش پا شدند رفتن دور دور.


خلاصه ماها ضعیفیم، اینا قوی نیستند.

این داستان، #توله_مجاهد و دوستانش (افسانه دروغ‌های زیبا)
تو زندگیم ۲ تا چیز رو ندیدم :
۱- جنگ جهانی
۲- سقوط دیکتاتور

خدارو شکر دومی رو شاهدش هستم و اولی رو نمی‌بینم 🌹🌹
Please open Telegram to view this post
VIEW IN TELEGRAM
بنظرم
LCM
بهتر از LLM جواب خواهد داد برای تعداد زیادی از تسک‌ها

راستی
LCM: Large Concept Model
Forwarded from Python Hints
هلوکاست ایرانی

یک زمانی شهردار تهران رو بخاطر ترافیک تهران اعدام کردند.

آخوند جز ویرانی، برای ایران دستاورد نداشت.
Forwarded from RandRng
مدل خودشون:


بی‌غیرت، اون مسئولیه که داره اینو القا می‌کنه که
حدود ۸ میلیون خمینی فدای ۱۰۰ تا فرانکلین

هر ۱۰۰ دلار حدوداً ۸ میلیون تومان
مدل کم حجم ولی خروجی خیره کننده :

Text 2 Speech

۸۲ میلیون پارامتر، واقعاً توی رنج پارامتر‌های این روزا خیلی عجیب هست.

یادمه زمانی که Inception v3 رکورد ImageNet رو زد همه از تعداد پارامترهاش شکه شدیم بنظرتون چقدر بود ؟

۲۳ میلیون (ترین) ولی اون زمان بیش از حد زیاد بود.
کل یوتیوب پر شده از این مقاله :
https://arxiv.org/pdf/2501.00663

و تقریبا تمام دوستان دارند در مورد
Transformers v2.0
صحبت می‌کنند.
میشه بازم گوگل خالق و باعث انقلاب دیگری باشه یا این هم یک ترند تبلیغاتی دیگر هست ؟
deepseek r1
منتشر شد؛ مقاله از نحوه ترین مدل - وزن‌ها و ... همه چیز
حتی مجوز commercial use رو هم داده

https://github.com/deepseek-ai/DeepSeek-R1
oh oh 


عجب خبری؛ یک محقق امنیتی تکنیکی رو پیدا کرده که باهاش از chatgpt برای DDOS کردن هر سایتی استفاده میشه کرد.
و چون از سرورهای chatgpt هم درخواست‌ها ارسال میشه مقابله باهاش راحت نیست؛ قطعا تیم close ai جلوی این رو میگیره ولی به این فکر کنید که همه شرکتهایی که این خدمات رو میدند به احتمال زیاد این باگ رو دارند.

ندید میگم؛ ۹۹٪ شرکتهای ایرانی که مدل رو خودشون دپلوی می‌کنند این باگ رو دارند. با توجه به چیزهایی که دیدم.

ReadMore
2025/07/03 18:03:12
Back to Top
HTML Embed Code: