Telegram Web Link
#Quick

راجب مقاله Infini-attention صحبتی نکردم
همونطور که برخی از دوستان هم اشاره کردند (بله من هم تکنیک رو دیدم)

اما صادقانه یک مقدار به این روش مشکوک هستم؛
منتظرم ۱-۲ مدل LLM باهاش منتشر بشه و بتونیم کیفیت و سرعت و سایز مدل رو مورد بررسی قرار بدیم و بعد راجبش صحبت کنیم.

دوستان خیلی دقت کنید؛ دنیای امروز LLM ها شامل مجموعه‌ای از حواس پرتی و ابزارهایی هست که سر و ته نداره اگر به این مسیر کشیده بشید که دنبال همه این موارد برید قطعا تمومی نخواهد داشت و فقط burn out می‌شید.

سعی کنید concept یاد بگیرید فارق از ابزار.
👍237
دستاوردهای یادگیری عمیق(InTec)
آپدیت برای بخش ۷ : Deep learning چون خیلی از دوستان پیام دادند و دنبال دوره ویدئویی هستند برای شروع : Standford university: Prof. Manning, deep learning for nlp NYU (new york university): Yan Lucan & Alfered canziani. Deep learning course این ۲ تا…
من قبلا این دوتا دوره رو معرفی کردم
خیلی از دوستانی هم که این دوتا رو خوندند و البته با پیاده سازی و دیتاست و ... روشون تمرین کردند الان توی پروژه‌ها و شرکت‌های بزرگی درحال کار هستند

همین دوره‌ها هر ساله آپدیت میشه و مطالب جدید هم بهش اضافه میشه.

اما چون خیلی درمورد LLM, Agent, Transformer , ... سوال شده که دوره و کتاب معرفی کنم

این لینک رو هم اضافه می‌کنیم که نهایتا میشه :

1) Standford university: Prof. Manning, deep learning for nlp

2) NYU (new york university): Yan Lucan & Alfered canziani. Deep learning course

3) Stanford University: Transformers United


Link

البته قبلا معرفی کرده بودم اما الان بنظرم باید به این لیست اضافه می‌شد دیگه.

الکی نرید پول دوره و .. بدید ما والا با همینا و چندتا کتاب یادگرفتیم باقی کسایی هم که می‌شناسیم هیمنطوری کار یاد گرفتند و توی شرکت‌های خوبی هم دارند کار ‌می‌کنند.
25👍8
دستاوردهای یادگیری عمیق(InTec) pinned «من قبلا این دوتا دوره رو معرفی کردم خیلی از دوستانی هم که این دوتا رو خوندند و البته با پیاده سازی و دیتاست و ... روشون تمرین کردند الان توی پروژه‌ها و شرکت‌های بزرگی درحال کار هستند همین دوره‌ها هر ساله آپدیت میشه و مطالب جدید هم بهش اضافه میشه. اما چون…»
#موقت

دوستان برای معرفی کتاب؛ اگر خواستید کانال
@pyhints
رو boost کنید تا کتاب‌های هوش مصنوعی که مناسب هستند رو هم اونجا استوری کنم ازین به بعد.

و اگر خواستید کتاب‌هایی که تا حالا معرفی شده رو ببینید؛ فقط کافیه روی
Channel Info
رو روی اون کانال باز کنید و توی بخش Posts تمامی کتاب‌ها رو ببینید (تا بحال پایتون بوده اما ازین به بعد هوش مصنوعی هم اضافه می‌کنم)
👍224
دستاوردهای یادگیری عمیق(InTec)
🫥 Phi-3 توسط ماکروسافت 🟥 معرفی شد؛ مدلی بسیار سبکتر با هدف اجرا روی گوشی اما دقتی بسیار نزدیک به Llama3 - ChatGpt 3.5 - Mixtral 8x7b. لینک مقاله: hugging face paper ✔️ نکات مهم که وجود داره : همه صحبت‌ها راجب نسخه mini هست فعلا که شامل این موارد میشه Phi…
https://huggingface.co/microsoft


یک نسخه با context length 128K هم داده که خب ابتدا اون رو تست خواهم کرد.

خوبی این مدل سبک و سریع بودنش هست.

۱- زبان پشتیبانی فقط انگلیسی هست؛ با کمی اذیت کردن زبان‌های دیگه رو هم جواب میده

۲- دیتاهاش از OpenAI اومده؛ Jailbreak ها رو روش تست کردم و خودش رو مدل تولید شده توسط OpenAI=CloseAI می‌دونه

۳- تیم ماکروسافت ادعا کرده توی بعضی از بنچمارک‌ها از Llama3 - Mixtral عملکرد بهتر یا نزدیکی داره (همچین چیزی رو نمی‌بینم حداقل نه توی کد)

۳-۱: تست بیشتر گرفتم؛ استدلال کردن رو خیلی خوب انجام میده و می‌فهمه به شرطی ازش سخت سوال نکنید (یک مقدار کوئری رو شاید لازم باشه براش ساده کنید) اما همچنان شدیدا با کد مشکل داره

۴- توانایی پاسخگویی به کدهای کمی پیچیده یا بحث‌های پیچیده رو نداره و کاملا گیج میشه (اما درک خوبی از مسائلی که خیلی سخت نباشند داره؛ سطح متوسط)

سرعت بسیار بالایی داره و برای code completion و کدهای ساده بسیار عملکرد خوبی داره
داکیومنت Django 5.0 , FastAPI رو بهش متصل می‌کنم ببینم عملکردش بهتر میشه یا نه؛ چون توی مقاله به این موضوع اشاره کردند.
👍142
نمیدونم چقدر با Agent ها توی دنیای Llm کار کردید یا آشنایی دارید؛ اما اگر سمت پروداکشن باهاش کار کرده باشید ضعف های زیادی داره Devin رو یادتون هست ؟
روزی که ویدئو اومد توی گروه گپ و گفت گفتم که دروغ هست (بخاطر تجربیاتی که توی کارهای شرکت بابتش داشتم) بعدم که متوجه شدیم واقعی هست.


اما امروز میخوام شمارو به یک تحقیق (مقاله؛ کد؛ دیتا و …) معرفی کنم که اجازه بنچمارک زدن روی Agent ها فارغ از سیستم عامل رو میده

OSWorld Github

وقتی سیستمی برای ارزیابی عملکرد Agent ها باشه؛ اتفاقات قشنگ بعد از اون شروع میشود.
ازین به بعد منتظر خبرای خوبی میشه بود.

حتما گیت و مقاله رو بخونید.
👍175
CloseAI (OpenAI)
خبر از دردسترس قرار گرفتن مدل gpt2-chatbot داده؛ من مسئول نامگذاری نبودم.

خارج از بحث عملکرد و ...
چندنفر چندین عکس از قدیم گذاشتند که توی اون‌ها CloseAI اعلام کرده مدل‌های سبکتر این نسخه 1.3B - 8B , ... نسخه‌های opensource, openweight خواهند داشت.

هرچند شدیدا شک دارم ولی خب.
👍131
دستاوردهای یادگیری عمیق(InTec)
من قبلا این دوتا دوره رو معرفی کردم خیلی از دوستانی هم که این دوتا رو خوندند و البته با پیاده سازی و دیتاست و ... روشون تمرین کردند الان توی پروژه‌ها و شرکت‌های بزرگی درحال کار هستند همین دوره‌ها هر ساله آپدیت میشه و مطالب جدید هم بهش اضافه میشه. اما چون…
بالاخره دوره Deep Generative Models های استنفورد هم آپدیت شد.
واقعا نباید بهونه آورد بهترین منابع یادگیری دنیا در دسترس نسل جدید هست :

Stanford CS236: Deep Generative Models (2023)

پس با اضافه شدن این دوره محموع دوره‌ها شد :

1) Standford university: Prof. Manning, deep learning for nlp

2) NYU (new york university): Yan Lucan & Alfered canziani. Deep learning course

3) Standord university: Deep Generative Models

4) Stanford University: Transformers United
👍2616
دستاوردهای یادگیری عمیق(InTec)
بالاخره دوره Deep Generative Models های استنفورد هم آپدیت شد. واقعا نباید بهونه آورد بهترین منابع یادگیری دنیا در دسترس نسل جدید هست : Stanford CS236: Deep Generative Models (2023) پس با اضافه شدن این دوره محموع دوره‌ها شد : 1) Standford university: Prof.…
تو مسیری که رفتید اون دوره رو چک کنید
به کانال یوتیوب خودمون هم سر بزنید :
http://youtube.com/@pyhints

ساده شروع کردیم و هدف اینه که بعد از دوره‌های اول از بچه‌هایی که توی صنعت کار می‌کنند (دوستان خودم) دعوت کنم دوره ضبط کنیم؛ کاملا ساده و بدون چیزی و رایگان قرار بگیره.

تنها مزیتی که نسبت به باقی دوره‌ها خواهد داشت.
برای هر دوره قبل از آپلود حداقل ۲ متخصص تایید مناسب بودن دوره برای بیزینس رو خواهند داد.

بازم میگم همه چیز هم توی کانال‌های تلگرام و هم یوتیوب (که ۱۰ روزه راه افتاده) کاملا رایگان خواهد بود و خواهد ماند.
64👍4
دنیای هوش مصنوعی واقعا عجیب شده؛ چندروز صبر کردم تا اطمینان حاصل کنم بعد این پست رو بذارم.
من اکانت شبکه‌های اجتماعی دیگه رو ندارم اما برای تست
meta.ai
البته بطور خاص image generation مجبور شدم اکانت facebook بسازم.

گفتم با یک ایمیل فیک میرم هروقت هم کارم تموم شد دیلیت می‌کنم.
همه چیز خوب پیشرفت تا اینکه بهم گفت یک تصویر تمام رخ بده (قدی بکارش نمیاد 😁)

منم چون اکانت فیک بود؛ روی سیستم یک مدل آوردم بالا و عکس تولید کردم بعد از چندتا پرامپت یک خروجی خیلی خوب گرفتم؛ یک مقدار یقه‌ی لباسش مشکل داشت که چون دوربین ۴۵ درجه بود و پس زمینه طبیعت blur شده بود چیزی معلوم نبود.
۲۴ ساعت طول کشید تایید شد.

کلا کاری که می‌خواستم رو فراموش کردم و گفتم بذار ببینم تا کجا میشه سیستم‌ها و یا افراد رو گول زد.
بله توی مرحله بعدی سعی کردم یک مدرک مثل پاسپورت یا ... براش درست کنم.
چندتا مدرک اصلی توی اینترنت پیدا کردم (تصویر خوب ولی بخش‌های دیتاهاشون رو سیاه کرده بودند هرکدوم یک بخشی رو)
و مقایسه کردم با مدارک ۳ سال اخیر اون کشور؛ و دیدم تصویرها آپدیت هستند.

از یک سیستم هوش مصنوعی دیگه (پرامپت میگیره و بخش‌هایی از تصویر رو درست می‌کنه؛ بیشتر برای ساخت پوستر هست و به خوبی می‌تونه اسم و اطلاعات بنویسه) خواستم تصویر مدرک رو برام درست کنه.
اول بکگراند عکس چهره و ... رو حذف کردم و بر اساس چهره قبلی عکس تمام رخ و رسمی درست کردم.
بعد با فونت دیفالت اسم و سن و اطلاعات دیگه‌ای که داده بودم رو درست کردم؛ با اینکه فونت دقیقا فونت رسمی مدارک نبود اما تایید شد.

همین تایید شد من رو نگران می‌کنه؛ من مجرم نیستم و فقط خواستم یک سیستم ارزیابی رو تست کنم و برای اینکار هزینه و ... هم نکردم
فرض کنید یک مجرم با هزینه و ترین کردن مدلی برای اینکار چه کارهایی که نمی‌تونه بکنه.

واقعا نیاز داریم که هرچه زودتر قانون گذاری درست برای هوش مصنوعی انجام بشه.
راستی من اون اکانت رو هم حذف کردم.
👍698
تصویر اون اکانت (چون برای یکی از دوستان فرستاده بودم هنوز روی سیستم بود)

https://www.tg-me.com/pytens/1447
👍131
یکی از دوستان اشاره کرده که تبلیغاتی از دوره‌های ایرانی کانال‌های دیگه پایین پست‌های کانال میاد.

همین اول بگم؛
هیچکدوم از دوره‌های فارسی پولی مورد تأیید ما نیست


و تقریباً هیچکدوم هم مناسب بیزینس نیست، دوره‌ای نیست که شمارو وارد بازار کار کنه.




اما تبلیغات تلگرام، دست ما نیست.
تلاش کردم خاموش کنم این موارد رو ولی تلگرام میگه باید 50 لول Boost داشته باشیم تا اجازه غیرفعال کردن بده بهمون

پس صرف اینکه تبلیغات تلگرام رو پایین هرکدوم از کانال های ما دید، فکر نکنید که ما تایید کردیم اون دوره رو

دوره‌های تایید شده :

https://www.tg-me.com/pytens/1444

این پست برای مدتی، بعنوان پست آخر دائماً ارسال خواهد شد. (تا کانال‌ها هدف تبلیغات نباشند)

پ.ن :
کانال یوتیوب با حمایت شما، به آموزش‌های رایگان و البته مناسب بیزینس در زمینه‌های مختلف ادامه خواهد داد قطعا.

http://youtube.com/@pyhints
👍3012
دستاوردهای یادگیری عمیق(InTec) pinned «بالاخره دوره Deep Generative Models های استنفورد هم آپدیت شد. واقعا نباید بهونه آورد بهترین منابع یادگیری دنیا در دسترس نسل جدید هست : Stanford CS236: Deep Generative Models (2023) پس با اضافه شدن این دوره محموع دوره‌ها شد : 1) Standford university: Prof.…»
مقاله جدید مایکروسافت منتشر شده این مقاله درمورد
The Mind's Eye
هست که چندی پیش yaan lecun توی یک مصاحبه که همراه با دیگر بزرگانی در این حوزه بود اعلام کرد که بعید می‌دونه LLM با natural language به تنهایی بتونند بهش برسند.

اما توی مقاله جدید ماکروسافت ادعا کرده که یک تیکنیک به اسم
Visual-of-Thought (VoT) prompting
رو ارائه میده و این اتفاق رو شدنی می‌کنه.

با اینکه کد یا سمپلی ارائه نداده انقدر این دستاورد مهم هست که جاهای متفاوتی ازش استفاده شده (غیر رسمی)

خلاصه که اگر دارید در این زمینه تحصیل و کار می‌کنید حتما باید این مقاله رو بخونید.

VoT Prompting

اهمیت این تکنیک توی ساخت agent ها هست.
اما برای اینکه متوجه تفاوت و عملکرد بشید به این گیت‌هاب می‌تونید سر بزنید؛ یکی از پیاده‌سازی‌های غیر رسمی که بعد از استفاده از این تکنیک داره معروف میشه.

Github
17👍5
تو دنیایی که RHEL 💻 میره سراغ Close-Source
و Nvidia 🟢 درایور میره سمت Open-Source (سری RTX2000 به بعد)
دیگه هیچی منو قافلگیرم نمی‌کنه.

واقعا عجیب شده؛ ولی توی دعوای Nvidia و Linus Torvalds معلوم شد کی برنده شد دیگه 😂

همون که گفت :
F..K you Nvidia ... 🐧🐧
Please open Telegram to view this post
VIEW IN TELEGRAM
👍313
حالا که همه دارند از
CloseAi GPT-4o

صحبت می‌کنند من چندتا از مدل‌های مهم که زیر این حجم مارکتینگ ممکنه از دست داده باشید رو نام ببرم که به تازگی release شده

Yi-1.5
بخصوص روی تسک‌های مربوط به کد زدن؛ بسیار عملکرد خوبی داره طبق بنچمارک‌ها عملکرد بهتری نسبت به llama3 داره که شخصا توی تست هم این موضوع رو دیدم.

Falcon2.0

هم مدل 11B اش رو منتشر کرد که خروجی خوبی داره و مثل متا درحالی که مدل اصلی رو داره توسعه می‌ده قرار هست مدل‌های کوچکتر رو release کنند.

IBM
هم مدل خودش رو منتشر کرده که تعداد پارامتر‌هاش زیاد بود و نتونستم تست کنم.
👍244
نکته بعدی
حتما نگاهی به
Kolmogorov-Arnold Networks
هم داشته باشیم.

پتانسیل خوبی داره (اگر لازم شد راجبش خواهم نوشت)
👍235
قابلیت سوال و جواب در مورد ویدئو توی
Gemini 1.5 pro
نسخه جدید واقعا فوق‌العاده هست؛ فرض کنید قابلیت 2m Token کانتکس رو به این اضافه کنید چه کارهایی که نمی‌شه کرد.


اضافه کنم دقتش بسیار بسیار بالاس
👍264
آپدیت جدید هندزفری‌های شرکت
Nothing
رو می‌بینید که مجهز شده به
ChatGpt
👍224
اگر Google I/O امسال رو دیدید احتمالا به این نتیجه رسیدید که وقتتون رو هدر دادید شخصا همچین چیزی رو پیش‌بینی میکردم برای امسال؛ اما مراسم Microsoft یک چیز دیگه‌ای بود (۹ ساعت برای بخش اول)
شخصا چون سرکار بودم نتونستم کامل ببینم اما تمامی بخش‌های مهم رو دیدم و خوندم.

پیشنهاد می‌کنم حتما نگاهی بهش داشته باشید؛ ایده‌های بسیار جذابی به ذهن میزنه.

قطعا همه هم می‌دونید طرفدار ماکروسافت نبودم (تا چندسال قبل و ورودش به دنیای open source)

اما اینکه خبری از اپل نیست یک مقدار مشکوک هست.

و البته لینوکس هم که درگیر بررسی قوانین مدل‌های هوش مصنوعی رایگان و open source هست + استفاده از Rust در کرنل و ....

اگر نمی‌دونستید باید بگم که بله توزیع‌های بسیاری توی لینوکس دارند به این سمت حرکت می‌کنند که LLM رو داخل خودشون داشته باشند.
👍4511
2025/07/10 15:22:54
Back to Top
HTML Embed Code: