دستاوردهای یادگیری عمیق(InTec) 1462

دستاوردهای یادگیری عمیق(InTec)

#Quick

راجب مقاله Infini-attention صحبتی نکردم
همونطور که برخی از دوستان هم اشاره کردند (بله من هم تکنیک رو دیدم)

اما صادقانه یک مقدار به این روش مشکوک هستم؛
منتظرم ۱-۲ مدل LLM باهاش منتشر بشه و بتونیم کیفیت و سرعت و سایز مدل رو مورد بررسی قرار بدیم و بعد راجبش صحبت کنیم.

دوستان خیلی دقت کنید؛ دنیای امروز LLM ها شامل مجموعه‌ای از حواس پرتی و ابزارهایی هست که سر و ته نداره اگر به این مسیر کشیده بشید که دنبال همه این موارد برید قطعا تمومی نخواهد داشت و فقط burn out می‌شید.

سعی کنید concept یاد بگیرید فارق از ابزار.

👍23❤7

3.68K viewsedited 19:57

دستاوردهای یادگیری عمیق(InTec)

آپدیت برای بخش ۷ : Deep learning چون خیلی از دوستان پیام دادند و دنبال دوره ویدئویی هستند برای شروع : Standford university: Prof. Manning, deep learning for nlp NYU (new york university): Yan Lucan & Alfered canziani. Deep learning course این ۲ تا…

من قبلا این دوتا دوره رو معرفی کردم
خیلی از دوستانی هم که این دوتا رو خوندند و البته با پیاده سازی و دیتاست و ... روشون تمرین کردند الان توی پروژه‌ها و شرکت‌های بزرگی درحال کار هستند

همین دوره‌ها هر ساله آپدیت میشه و مطالب جدید هم بهش اضافه میشه.

اما چون خیلی درمورد LLM, Agent, Transformer , ... سوال شده که دوره و کتاب معرفی کنم

این لینک رو هم اضافه می‌کنیم که نهایتا میشه :

1) Standford university: Prof. Manning, deep learning for nlp

2) NYU (new york university): Yan Lucan & Alfered canziani. Deep learning course

3) Stanford University: Transformers United

Link

البته قبلا معرفی کرده بودم اما الان بنظرم باید به این لیست اضافه می‌شد دیگه.

الکی نرید پول دوره و .. بدید ما والا با همینا و چندتا کتاب یادگرفتیم باقی کسایی هم که می‌شناسیم هیمنطوری کار یاد گرفتند و توی شرکت‌های خوبی هم دارند کار ‌می‌کنند.

YouTube

Stanford CS25 - Transformers United

Stanford CS25: Transformers United Since their introduction in 2017, transformers have revolutionized Natural Language Processing (NLP). Now, transformers ar...

❤25👍8

5.13K viewsedited 21:10

دستاوردهای یادگیری عمیق(InTec)

دستاوردهای یادگیری عمیق(InTec) pinned «من قبلا این دوتا دوره رو معرفی کردم خیلی از دوستانی هم که این دوتا رو خوندند و البته با پیاده سازی و دیتاست و ... روشون تمرین کردند الان توی پروژه‌ها و شرکت‌های بزرگی درحال کار هستند همین دوره‌ها هر ساله آپدیت میشه و مطالب جدید هم بهش اضافه میشه. اما چون…»

21:11

دستاوردهای یادگیری عمیق(InTec)

#موقت

دوستان برای معرفی کتاب؛ اگر خواستید کانال
@pyhints
رو boost کنید تا کتاب‌های هوش مصنوعی که مناسب هستند رو هم اونجا استوری کنم ازین به بعد.

و اگر خواستید کتاب‌هایی که تا حالا معرفی شده رو ببینید؛ فقط کافیه روی
Channel Info
رو روی اون کانال باز کنید و توی بخش Posts تمامی کتاب‌ها رو ببینید (تا بحال پایتون بوده اما ازین به بعد هوش مصنوعی هم اضافه می‌کنم)

👍22❤4

3.8K views21:20

دستاوردهای یادگیری عمیق(InTec)

🫥 Phi-3 توسط ماکروسافت 🟥 معرفی شد؛ مدلی بسیار سبکتر با هدف اجرا روی گوشی اما دقتی بسیار نزدیک به Llama3 - ChatGpt 3.5 - Mixtral 8x7b. لینک مقاله: hugging face paper ✔️ نکات مهم که وجود داره : همه صحبت‌ها راجب نسخه mini هست فعلا که شامل این موارد میشه Phi…

https://huggingface.co/microsoft

یک نسخه با context length 128K هم داده که خب ابتدا اون رو تست خواهم کرد.

خوبی این مدل سبک و سریع بودنش هست.

۱- زبان پشتیبانی فقط انگلیسی هست؛ با کمی اذیت کردن زبان‌های دیگه رو هم جواب میده

۲- دیتاهاش از OpenAI اومده؛ Jailbreak ها رو روش تست کردم و خودش رو مدل تولید شده توسط OpenAI=CloseAI می‌دونه

۳- تیم ماکروسافت ادعا کرده توی بعضی از بنچمارک‌ها از Llama3 - Mixtral عملکرد بهتر یا نزدیکی داره (همچین چیزی رو نمی‌بینم حداقل نه توی کد)

۳-۱: تست بیشتر گرفتم؛ استدلال کردن رو خیلی خوب انجام میده و می‌فهمه به شرطی ازش سخت سوال نکنید (یک مقدار کوئری رو شاید لازم باشه براش ساده کنید) اما همچنان شدیدا با کد مشکل داره

۴- توانایی پاسخگویی به کدهای کمی پیچیده یا بحث‌های پیچیده رو نداره و کاملا گیج میشه (اما درک خوبی از مسائلی که خیلی سخت نباشند داره؛ سطح متوسط)

سرعت بسیار بالایی داره و برای code completion و کدهای ساده بسیار عملکرد خوبی داره
داکیومنت Django 5.0 , FastAPI رو بهش متصل می‌کنم ببینم عملکردش بهتر میشه یا نه؛ چون توی مقاله به این موضوع اشاره کردند.

huggingface.co

microsoft (Microsoft)

Org profile for Microsoft on Hugging Face, the AI community building the future.

👍14❤2

5.25K viewsedited 22:13

دستاوردهای یادگیری عمیق(InTec)

نمیدونم چقدر با Agent ها توی دنیای Llm کار کردید یا آشنایی دارید؛ اما اگر سمت پروداکشن باهاش کار کرده باشید ضعف های زیادی داره Devin رو یادتون هست ؟
روزی که ویدئو اومد توی گروه گپ و گفت گفتم که دروغ هست (بخاطر تجربیاتی که توی کارهای شرکت بابتش داشتم) بعدم که متوجه شدیم واقعی هست.

اما امروز میخوام شمارو به یک تحقیق (مقاله؛ کد؛ دیتا و …) معرفی کنم که اجازه بنچمارک زدن روی Agent ها فارغ از سیستم عامل رو میده

OSWorld Github

وقتی سیستمی برای ارزیابی عملکرد Agent ها باشه؛ اتفاقات قشنگ بعد از اون شروع میشود.
ازین به بعد منتظر خبرای خوبی میشه بود.

حتما گیت و مقاله رو بخونید.

GitHub

GitHub - xlang-ai/OSWorld: [NeurIPS 2024] OSWorld: Benchmarking Multimodal Agents for Open-Ended Tasks in Real Computer Environments

[NeurIPS 2024] OSWorld: Benchmarking Multimodal Agents for Open-Ended Tasks in Real Computer Environments - xlang-ai/OSWorld

👍17❤5

6.05K viewsedited 18:37

دستاوردهای یادگیری عمیق(InTec)

CloseAI (OpenAI)
خبر از دردسترس قرار گرفتن مدل gpt2-chatbot داده؛ من مسئول نامگذاری نبودم.

خارج از بحث عملکرد و ...
چندنفر چندین عکس از قدیم گذاشتند که توی اون‌ها CloseAI اعلام کرده مدل‌های سبکتر این نسخه 1.3B - 8B , ... نسخه‌های opensource, openweight خواهند داشت.

هرچند شدیدا شک دارم ولی خب.

👍13❤1

5.98K viewsedited 11:33

دستاوردهای یادگیری عمیق(InTec)

من قبلا این دوتا دوره رو معرفی کردم خیلی از دوستانی هم که این دوتا رو خوندند و البته با پیاده سازی و دیتاست و ... روشون تمرین کردند الان توی پروژه‌ها و شرکت‌های بزرگی درحال کار هستند همین دوره‌ها هر ساله آپدیت میشه و مطالب جدید هم بهش اضافه میشه. اما چون…

بالاخره دوره Deep Generative Models های استنفورد هم آپدیت شد.
واقعا نباید بهونه آورد بهترین منابع یادگیری دنیا در دسترس نسل جدید هست :

Stanford CS236: Deep Generative Models (2023)

پس با اضافه شدن این دوره محموع دوره‌ها شد :

1) Standford university: Prof. Manning, deep learning for nlp

2) NYU (new york university): Yan Lucan & Alfered canziani. Deep learning course

3) Standord university: Deep Generative Models

4) Stanford University: Transformers United

👍26❤16

7.96K viewsedited 20:35

دستاوردهای یادگیری عمیق(InTec)

بالاخره دوره Deep Generative Models های استنفورد هم آپدیت شد. واقعا نباید بهونه آورد بهترین منابع یادگیری دنیا در دسترس نسل جدید هست : Stanford CS236: Deep Generative Models (2023) پس با اضافه شدن این دوره محموع دوره‌ها شد : 1) Standford university: Prof.…

تو مسیری که رفتید اون دوره رو چک کنید
به کانال یوتیوب خودمون هم سر بزنید :
http://youtube.com/@pyhints

ساده شروع کردیم و هدف اینه که بعد از دوره‌های اول از بچه‌هایی که توی صنعت کار می‌کنند (دوستان خودم) دعوت کنم دوره ضبط کنیم؛ کاملا ساده و بدون چیزی و رایگان قرار بگیره.

تنها مزیتی که نسبت به باقی دوره‌ها خواهد داشت.
برای هر دوره قبل از آپلود حداقل ۲ متخصص تایید مناسب بودن دوره برای بیزینس رو خواهند داد.

بازم میگم همه چیز هم توی کانال‌های تلگرام و هم یوتیوب (که ۱۰ روزه راه افتاده) کاملا رایگان خواهد بود و خواهد ماند.

❤64👍4

5.15K views20:43

دستاوردهای یادگیری عمیق(InTec)

دنیای هوش مصنوعی واقعا عجیب شده؛ چندروز صبر کردم تا اطمینان حاصل کنم بعد این پست رو بذارم.
من اکانت شبکه‌های اجتماعی دیگه رو ندارم اما برای تست
meta.ai
البته بطور خاص image generation مجبور شدم اکانت facebook بسازم.

گفتم با یک ایمیل فیک میرم هروقت هم کارم تموم شد دیلیت می‌کنم.
همه چیز خوب پیشرفت تا اینکه بهم گفت یک تصویر تمام رخ بده (قدی بکارش نمیاد 😁)

منم چون اکانت فیک بود؛ روی سیستم یک مدل آوردم بالا و عکس تولید کردم بعد از چندتا پرامپت یک خروجی خیلی خوب گرفتم؛ یک مقدار یقه‌ی لباسش مشکل داشت که چون دوربین ۴۵ درجه بود و پس زمینه طبیعت blur شده بود چیزی معلوم نبود.
۲۴ ساعت طول کشید تایید شد.

کلا کاری که می‌خواستم رو فراموش کردم و گفتم بذار ببینم تا کجا میشه سیستم‌ها و یا افراد رو گول زد.
بله توی مرحله بعدی سعی کردم یک مدرک مثل پاسپورت یا ... براش درست کنم.
چندتا مدرک اصلی توی اینترنت پیدا کردم (تصویر خوب ولی بخش‌های دیتاهاشون رو سیاه کرده بودند هرکدوم یک بخشی رو)
و مقایسه کردم با مدارک ۳ سال اخیر اون کشور؛ و دیدم تصویرها آپدیت هستند.

از یک سیستم هوش مصنوعی دیگه (پرامپت میگیره و بخش‌هایی از تصویر رو درست می‌کنه؛ بیشتر برای ساخت پوستر هست و به خوبی می‌تونه اسم و اطلاعات بنویسه) خواستم تصویر مدرک رو برام درست کنه.
اول بکگراند عکس چهره و ... رو حذف کردم و بر اساس چهره قبلی عکس تمام رخ و رسمی درست کردم.
بعد با فونت دیفالت اسم و سن و اطلاعات دیگه‌ای که داده بودم رو درست کردم؛ با اینکه فونت دقیقا فونت رسمی مدارک نبود اما تایید شد.

همین تایید شد من رو نگران می‌کنه؛ من مجرم نیستم و فقط خواستم یک سیستم ارزیابی رو تست کنم و برای اینکار هزینه و ... هم نکردم
فرض کنید یک مجرم با هزینه و ترین کردن مدلی برای اینکار چه کارهایی که نمی‌تونه بکنه.

واقعا نیاز داریم که هرچه زودتر قانون گذاری درست برای هوش مصنوعی انجام بشه.
راستی من اون اکانت رو هم حذف کردم.

👍69❤8

4.46K views09:21

دستاوردهای یادگیری عمیق(InTec)

تصویر اون اکانت (چون برای یکی از دوستان فرستاده بودم هنوز روی سیستم بود)

https://www.tg-me.com/pytens/1447

👍13❤1

3.38K viewsedited 09:26

دستاوردهای یادگیری عمیق(InTec)

یکی از دوستان اشاره کرده که تبلیغاتی از دوره‌های ایرانی کانال‌های دیگه پایین پست‌های کانال میاد.

همین اول بگم؛

هیچکدوم از دوره‌های فارسی پولی مورد تأیید ما نیست

و تقریباً هیچکدوم هم مناسب بیزینس نیست، دوره‌ای نیست که شمارو وارد بازار کار کنه.

اما تبلیغات تلگرام، دست ما نیست.
تلاش کردم خاموش کنم این موارد رو ولی تلگرام میگه باید 50 لول Boost داشته باشیم تا اجازه غیرفعال کردن بده بهمون

پس صرف اینکه تبلیغات تلگرام رو پایین هرکدوم از کانال های ما دید، فکر نکنید که ما تایید کردیم اون دوره رو

دوره‌های تایید شده :

https://www.tg-me.com/pytens/1444

این پست برای مدتی، بعنوان پست آخر دائماً ارسال خواهد شد. (تا کانال‌ها هدف تبلیغات نباشند)

پ.ن :
کانال یوتیوب با حمایت شما، به آموزش‌های رایگان و البته مناسب بیزینس در زمینه‌های مختلف ادامه خواهد داد قطعا.

http://youtube.com/@pyhints

دستاوردهای یادگیری عمیق(InTec)

👍30❤12

12.2K viewsedited 11:15

دستاوردهای یادگیری عمیق(InTec)

دستاوردهای یادگیری عمیق(InTec) pinned «بالاخره دوره Deep Generative Models های استنفورد هم آپدیت شد. واقعا نباید بهونه آورد بهترین منابع یادگیری دنیا در دسترس نسل جدید هست : Stanford CS236: Deep Generative Models (2023) پس با اضافه شدن این دوره محموع دوره‌ها شد : 1) Standford university: Prof.…»

11:17

دستاوردهای یادگیری عمیق(InTec)

مقاله جدید مایکروسافت منتشر شده این مقاله درمورد
The Mind's Eye
هست که چندی پیش yaan lecun توی یک مصاحبه که همراه با دیگر بزرگانی در این حوزه بود اعلام کرد که بعید می‌دونه LLM با natural language به تنهایی بتونند بهش برسند.

اما توی مقاله جدید ماکروسافت ادعا کرده که یک تیکنیک به اسم
Visual-of-Thought (VoT) prompting
رو ارائه میده و این اتفاق رو شدنی می‌کنه.

با اینکه کد یا سمپلی ارائه نداده انقدر این دستاورد مهم هست که جاهای متفاوتی ازش استفاده شده (غیر رسمی)

خلاصه که اگر دارید در این زمینه تحصیل و کار می‌کنید حتما باید این مقاله رو بخونید.

VoT Prompting

اهمیت این تکنیک توی ساخت agent ها هست.
اما برای اینکه متوجه تفاوت و عملکرد بشید به این گیت‌هاب می‌تونید سر بزنید؛ یکی از پیاده‌سازی‌های غیر رسمی که بعد از استفاده از این تکنیک داره معروف میشه.

Github

arXiv.org

Mind's Eye of LLMs: Visualization-of-Thought Elicits Spatial...

Large language models (LLMs) have exhibited impressive performance in language comprehension and various reasoning tasks. However, their abilities in spatial reasoning, a crucial aspect of human...

❤17👍5

5.92K viewsedited 18:30

دستاوردهای یادگیری عمیق(InTec)

تو دنیایی که RHEL 💻 میره سراغ Close-Source
و Nvidia 🟢 درایور میره سمت Open-Source (سری RTX2000 به بعد)
دیگه هیچی منو قافلگیرم نمی‌کنه.

واقعا عجیب شده؛ ولی توی دعوای Nvidia و Linus Torvalds معلوم شد کی برنده شد دیگه 😂

همون که گفت :
F..K you Nvidia ... 🐧

🐧

Please open Telegram to view this post

VIEW IN TELEGRAM

👍31❤3

4.89K views13:41

دستاوردهای یادگیری عمیق(InTec)

حالا که همه دارند از


CloseAi GPT-4o

صحبت می‌کنند من چندتا از مدل‌های مهم که زیر این حجم مارکتینگ ممکنه از دست داده باشید رو نام ببرم که به تازگی release شده

Yi-1.5
بخصوص روی تسک‌های مربوط به کد زدن؛ بسیار عملکرد خوبی داره طبق بنچمارک‌ها عملکرد بهتری نسبت به llama3 داره که شخصا توی تست هم این موضوع رو دیدم.

Falcon2.0

هم مدل 11B اش رو منتشر کرد که خروجی خوبی داره و مثل متا درحالی که مدل اصلی رو داره توسعه می‌ده قرار هست مدل‌های کوچکتر رو release کنند.

IBM
هم مدل خودش رو منتشر کرده که تعداد پارامتر‌هاش زیاد بود و نتونستم تست کنم.

👍24❤4

5.61K views16:22

دستاوردهای یادگیری عمیق(InTec)

نکته بعدی
حتما نگاهی به
Kolmogorov-Arnold Networks
هم داشته باشیم.

پتانسیل خوبی داره (اگر لازم شد راجبش خواهم نوشت)

👍23❤5

5.82K views16:25

دستاوردهای یادگیری عمیق(InTec)

قابلیت سوال و جواب در مورد ویدئو توی
Gemini 1.5 pro
نسخه جدید واقعا فوق‌العاده هست؛ فرض کنید قابلیت 2m Token کانتکس رو به این اضافه کنید چه کارهایی که نمی‌شه کرد.

اضافه کنم دقتش بسیار بسیار بالاس

👍26❤4

6.79K views13:56

دستاوردهای یادگیری عمیق(InTec)

آپدیت جدید هندزفری‌های شرکت
Nothing
رو می‌بینید که مجهز شده به
ChatGpt

👍22❤4

5.53K views11:24

دستاوردهای یادگیری عمیق(InTec)

اگر Google I/O امسال رو دیدید احتمالا به این نتیجه رسیدید که وقتتون رو هدر دادید شخصا همچین چیزی رو پیش‌بینی میکردم برای امسال؛ اما مراسم Microsoft یک چیز دیگه‌ای بود (۹ ساعت برای بخش اول)
شخصا چون سرکار بودم نتونستم کامل ببینم اما تمامی بخش‌های مهم رو دیدم و خوندم.

پیشنهاد می‌کنم حتما نگاهی بهش داشته باشید؛ ایده‌های بسیار جذابی به ذهن میزنه.

قطعا همه هم می‌دونید طرفدار ماکروسافت نبودم (تا چندسال قبل و ورودش به دنیای open source)

اما اینکه خبری از اپل نیست یک مقدار مشکوک هست.

و البته لینوکس هم که درگیر بررسی قوانین مدل‌های هوش مصنوعی رایگان و open source هست + استفاده از Rust در کرنل و ....

اگر نمی‌دونستید باید بگم که بله توزیع‌های بسیاری توی لینوکس دارند به این سمت حرکت می‌کنند که LLM رو داخل خودشون داشته باشند.

👍45❤11

5.93K viewsedited 21:47

2025/07/10 15:22:54
Back to Top

HTML Embed Code:

<iframe width="100%" src="https://www.bootg.com/buyppe/web?embed=1" title="Telegram Web" frameborder="0" allow="accelerometer; autoplay; clipboard-write; encrypted-media; gyroscope; picture-in-picture" allowfullscreen></iframe>