دستاوردهای یادگیری عمیق(InTec) 1742

دستاوردهای یادگیری عمیق(InTec)

برهیچکس پوشیده نیست که من عاشق نوشتن
Test case

برای پروژه‌هام هستم، چیزی که نتونی تستش کنی چطوری می‌تونی بفهمی بهتر شده یا بدتر یا اصلا تغییری داشته یا نه ؟
با کمک

DeepEval

می‌تونیم همین طرز تفکر رو ببریم روی پروژه‌های LLM ببینیم چی می‌شه

GitHub

GitHub - confident-ai/deepeval: The LLM Evaluation Framework

The LLM Evaluation Framework. Contribute to confident-ai/deepeval development by creating an account on GitHub.

👍25❤7

5.31K views10:15

دستاوردهای یادگیری عمیق(InTec)

انجمن هوش مصنوعی شریف :: SAIC

🌐 انجمن علمی هوش مصنوعی دانشگاه صنعتی شریف برگزار می‌کند: ⏪ آغاز ثبت‌نام هکاتون LLM Agents ☑️ اولین دوره‌ی هکاتون عامل‌های هوشمند مدل‌های زبانی بزرگ دانشگاه صنعتی شریف به همت انجمن علمی هوش مصنوعی و با همکاری انجمن IEEE و آزمایشگاه RIML. 👥 با آموزش اساتید…

ظرفیت مجدداً باز شده؛ دیروز اطلاع دادید که امکان ثبت‌نام نیست (مشکل پر شدن ظرفیت بوده)

می‌تونید مجدداً امتحان کنید

هر سوالی داشتید :
@AI_Sharif_Support

اینم کد تخفیف ۲۰٪ برای کانال و مشکل دیروز :
llm_20

👍12❤3

4.6K viewsedited 09:00

دستاوردهای یادگیری عمیق(InTec)

بهترین‌های تیم Llama3.1, ... اکثراً قبل از Llama4 از شرکت استعفا دادند و با Mistral قرارداد بستند.

یک افتضاح بزرگ با انتشار Llama4 بوجود اومد؛ اصلا کسی هست ازین مدل استفاده کنه ؟

علاوه بر اون؛ تصمیمات Meta و عدم دسترسی حتی افراد حقیقی به مدلهای شرکت و .... هم باعث این موضوع بوده.

تیم Mistral رو اگر نمی‌شناسید، پیشنهاد می‌دم حداقل از مدل‌هاش برای OCR و خوندن داکیومنت و استخراج متن استفاده کنید، بعداً ازم تشکر خواهید کرد 😉

👍42❤6

4.44K views05:07

دستاوردهای یادگیری عمیق(InTec)

ی پایپ لاین n8n گرفتم، ۲ ماهه داره گزارشات تحلیلی به شرکت میده (همه پلن‌ها رو شرکته بر این اساس چیده)

رفتم یک بررسی کنم، چون از کدهای خودم مطمئن بودم.
دیدم ۲ ماه هست داره کوئری و .... اشتباه میزنه و اصلا وضعیت شرکت این نیست.

هیچی دیگه؛ احتمالاً ی ضرر مالی یا زمانی اون پشت دارند.

تسک من که تموم شد، ولی اینکه خروجی AI رو تست و بررسی نکنید.
خیلی باگ هستا، خیلی

👍41❤10

4.66K views07:59

دستاوردهای یادگیری عمیق(InTec)

این پست رو مراجعه کنید به لینک؛ دقیق بخونید و بعد یک جا ذخیره کنید. چرا ؟ چون یک دوره ۷-۸ ساعتِ سیستم پرامپت نویسی توی این لینک هست و تازه کاملاً هم جواب می‌ده:

Claude 4 System Prompt

و شاید کمتر از ۲۰ دقیقه خوندنش ازتون وقت بگیره.

Simon Willison’s Weblog

Highlights from the Claude 4 system prompt

Anthropic publish most of the system prompts for their chat models as part of their release notes. They recently shared the new prompts for both Claude Opus 4 and Claude …

👍22❤9

4.66K views11:30

دستاوردهای یادگیری عمیق(InTec)

شدیداً منتظر یک نسخه، open weight برای Gemma 3n هستم؛ این مدل ریزه میزه خوراکش چت کردن هست و tool calling

مثلاً اگر leader board اش رو ببینید با اختلاف خیلی کم از مدل‌های درجه یک همین چندوقت قبل وایساده.

پ.ن : یکی از دوستان اشاره کردند وزن‌های این مدل روی huggingface قرار گرفته
شخصاً هنوز بررسی نکردم

👍22❤10

4.29K viewsedited 11:42

دستاوردهای یادگیری عمیق(InTec)

انجمن هوش مصنوعی شریف :: SAIC

از آشنایی با تک‌تک‌تون واقعاً خوشحال شدم.
صحبت با شما یک تجربه فوق‌العاده بود؛ صادقانه، اصلاً فکرشو نمی‌کردم این‌همه آدم بااستعداد، خلاق و خفن رو ببینم! بخصوص توی بچه‌های لیسانس.

امیدوارم این انرژی، انگیزه و ذهن‌های طلایی‌تون همیشه بدرخشه و دنیا واقعاً ازتون بهره‌مند بشه.

(هیچوقت نذارید، هیچ چیز و هیچ کس ناامیدتون کنه)

اگه توی این مدت از من کم و کاستی، بد اخلاقی یا .... دیدید، بذارید پای خستگی و کم‌خوابی، یا توی شرایطی فشار عصبی و نه هیچ چیز دیگه.

با بعضی‌هاتون ارتباطم ادامه پیدا خواهد کرد و امیدوارم به همکاری‌های خوب و طولانی برسیم 🌱🌹♥️

خفن ادامه بدید

❤86👍7

3.85K views18:54

دستاوردهای یادگیری عمیق(InTec)

مدل جدید Xiaomi برای vision متأسفانه این مدل توی بنچمارک‌های منتشر شده با pixtral مقایسه نشده

چیزی که بنظرم مهمترین گزینه هست؛ شرکت mistral واقعاً توی تسک‌های vision رغیب نداره درحال حاضر.

❤24

4.09K views05:37

دستاوردهای یادگیری عمیق(InTec)

https://ollama.com/library/deepseek-r1:8b-0528-qwen3-q8_0

Ollama

deepseek-r1:8b-0528-qwen3-q8_0

DeepSeek-R1 is a family of open reasoning models with performance approaching that of leading models, such as O3 and Gemini 2.5 Pro.

👍17

3.52K views19:59

دستاوردهای یادگیری عمیق(InTec)

بیشترین سوالی که بعد از هکاتون توی لینکدین و تلگرام ازم شد؛ می‌شه اینکه :

اگر قرار بود، تمام اشتباهاتی که راجب تیم‌ها دیدی رو تهش بهشون بگی، چیا بود ؟

من یک ذره تغییرش میدم و درک خودم رو هم توش می‌ذارم :

۱- اگر تو حوزه کاری خودت ایده بدی احتمال اینکه ایده بهتری باشه و کمتر تکراری زیاده

۲- اگر مورد ۱ نباشه؛ احتمال بالای ۹۰٪ حداقل ۱ نفر دیگه ایده تورو داره، پس زودتر پیاده‌سازی رو شروع کن و توی مسیر به بهتر کردنش فکر کن

۳- ایده خوب، ایده‌ای هست که قابل پیاده‌سازی باشه

۴- برای ایده؛ بعد از تحقیق کمی وقت بذار اگر قابل پیاده‌سازی نبود یا ...
فقط یادداشتش کن؛ خودت رو به ایده وابسته نکن، غرق میشی باهاش.

مثلاً ایده تبدیل مس به طلا عالیه؛ بسیار آدم هم قبلاً تلاششون رو کردند.
ولی قابل انجام ؟ خیلی‌ها عمرشون رو پاش دادند.

۵- بعضی‌ها، ایده فوق‌العاده داشتند (میلیارد دلاری) ولی انقدر شروع کردند چکش کاری (مثلاً بهبود ایده) که مارکتش کلا عوض شد و شد یک ایده چندصد دلاری.

۶- بعضی‌ها با شنیدن اولین نه، جا زدند.
شاید اون کسی که داره بهت راهنمایی میده؛ توضیحات تورو درست درک نکرده.

۷- بعضی‌ها به اولین مشکل که خوردند دست کشیدند.

۸- خیلی‌ها از سوال پرسیدن و مشورت کشیدن ترسیدند و وقتشون رو صرف چیزی کردند که بدردشون نمی‌خورد

و .....

بدترینش اونایی بودن که با اولین جر و بحث توی تیم انصراف دادند، پیک‌نیک هم بری جر و بحث داره.

❤40👍21

3.54K viewsedited 04:49

دستاوردهای یادگیری عمیق(InTec)

2:12

Media is too big

VIEW IN TELEGRAM

اگر خواستید LLM رو لوکال روی گوشی داشته باشید :

Github Doc

الان باید به این فقط tool اضافه کرد؛ موسیقی هم داشت اجرا می‌شد.

❤11👍6

3.38K views06:35

دستاوردهای یادگیری عمیق(InTec)

نظر شخصی من راجب الگوریتم Forward-Forward البته با دید بیزینس و کاری (نه آکادمیک) در ریپلای به پیامی توی گروه گفتم شاید بد نباشه شما هم بخونید. ---------------------------------------- این الگوریتم فعلاً فقط و فقط می‌تونه نظر آکادمی رو جلب کنه و فعلا دقیقاً…

اینو دیدم؛ یاد صحبتم توی هکاتون شریف با یکی از منتورها به اسم آرش افتادم (آرش جان سلام 😂)

بحثی داشتیم راجب Diffusion model ها برای دیتاهای متنی و فرار از Transformer ها؛ خداروشکر شرکت کننده‌ها باهوش بودند ما فرصت کردیم knowledge share داشته باشیم.

شخصاً همون ابتدا، نظرم این بود که بیزینس سراغ این موضوع نخواهد رفت درحال حاضر و اگر هم بخواد تغییری ایجاد بشه احتمالاً اول توسعه SDK برای تبدیل مدل‌های ترین شده روی Nvidia به سخت‌افزار‌های تخصصی مثل Groq خواهد بود.
آرش عزیز هم؛ با بنده هم نظر بود و البته ایشون بسیاری از مقالات این حوزه رو به خوبی خونده بود و آشنا بود.

یک تایم خیلی خیلی مفید و دوستانه‌ای رو کنار ایشون و چندتا دیگه از منتورها داشتیم و بحث جذابی که چرا راهکارهای ارائه شده یا قابل پیاده‌سازی نیست یا اینکه مسئله رو سخت‌تر می‌کنه.

خلاصه که؛ منم ترند‌ها رو دنبال می‌کنم اما تمرکزم باید روی بیزینس باشه، هرچند ترجیح میدم جلسات هفتگی و ماهانه برای این موضوعات داشته باشم.

👍28❤8

2.99K viewsedited 20:28

دستاوردهای یادگیری عمیق(InTec)

#کارگاه عملی هوش مصنوعی در نورورادیولوژی با استفاده از پایتون؛ اولین کارگاه عمومی بنده (ثبت‌نام آزاد) که تجربه متفاوت و جالبی بود در نخستین همایش ملی هوش مصنوعی در تصویربرداری پزشکی تشکر بسیار ویژه از دوستان و برگذار کننده‌گان در آزمایشگاه ملی مغز بخاطر…

اینم بمونه به یادگار
از اولین دوره برگزاری LLM Agents Hackathon دانشگاه شریف.

چه رفقای خوبی پیدا کردم.

#SHARIF_LLM_AGENTS 2025

توی این عکس؛ فقط افراد و تیم‌هایی هستند که تا ۱۰ شب روز دوم وایسادند.

❤48👍6

3.09K views22:17

دستاوردهای یادگیری عمیق(InTec)

اوضاع مدل‌های local اینطوری هست.
Gemma3, Qwen3
برای همه تسک‌ها استفاده می‌شه.

روی Qwen3 نتایج خوبی برای RAG میگیرم؛ روی Gemma3 برای Tool خیلی نتابج خوبی دارم.

سراغ devstral برای بررسی کد یا ساخت کدهای اولیه میرم (بخصوص اینکه روی ابزارهای مربوط به تسک‌های برنامه‌نویسی خروجی خوبی داره)

deepseek-r1

نسخه جدید هست و روی سیستم شرکت نداشتم برای همین روی سیستم شخصی دانلود کردم تا ببینم نتایج چطوری هست.

نکته مهم شخصا بعضی وقتا ۲ مدل رو همزمان بالا میارم

docker ollama

هرکدوم روی یک GPU و از مدل ساده‌تر میخوام سریع کد اولیه رو بزنه و مدل پیچیده‌تر اون رو بررسی کنه و رفع اشکال انجام بده؛ یا استراکچر و استایل پروژه رو رعایت کنه.

ولی خلاصه وضعیت لوکال این هست؛ چون سوال شده بود.

❤31👍10

3.16K viewsedited 11:26

دستاوردهای یادگیری عمیق(InTec)

اوضاع مدل‌های local اینطوری هست. Gemma3, Qwen3 برای همه تسک‌ها استفاده می‌شه. روی Qwen3 نتایج خوبی برای RAG میگیرم؛ روی Gemma3 برای Tool خیلی نتابج خوبی دارم. سراغ devstral برای بررسی کد یا ساخت کدهای اولیه میرم (بخصوص اینکه روی ابزارهای مربوط به تسک‌های…

Qwen3

خیلی نرم و ریز مدل embedding خودش رو هم منتشر کرد

HuggingFace

نتایج جالبی هم روی بنچمارک‌ها گرفته و پیشرفت‌های خوبی رو نشون داده.

پ.ن: توی لیدربورد multi lingual رتبه اول هست (البته مدل 8b)
قراره کلی آموزش و خبر بشنویم ازش

❤17👍10

3.07K viewsedited 13:00

دستاوردهای یادگیری عمیق(InTec)

Mistral Code

هم معرفی شد؛ بعد از devstral, codestral embedding تیم mistral هم وارد این موضوع شده.

بخش مهم این متن اینجاس :

At its core, Mistral Code is powered by four models that are state of the art in coding:

Codestral: for fill-in-the-middle / code autocomplete

Codestral Embed: for code search and retrieval

Devstral: for agentic coding

And Mistral Medium for chat assistance

یعنی خودتون هم می‌تونید راه بندازید.

mistral.ai

Introducing Mistral Code | Mistral AI

❤12👍11

3.72K viewsedited 15:14

دستاوردهای یادگیری عمیق(InTec)

Gemini 2.5 Pro

بازهم قویتر از قبل روی مباحث مربوط به code نویسی.

با اعلام دیپ‌مایند، مدل Gemini2.5 Pro آپدیت جدیدی رو دریافت کرده که یکی از ویژگی‌های مهم اون بهبود عملکردش روی تسک‌های مربوط به کد نویسی هست.

❤40

3.24K views16:13

دستاوردهای یادگیری عمیق(InTec)

Deepseek R1

هم توی یک آپدیت خفن و دوس داشتنی؛ حالا برای کدهای بیشتری علاوه‌بر ارائه کد، دیاگرام و جریان اتفاقات رو رسم می‌کنه.

این هفته به مراتب عجیب و غریب هست.
(تصویر مربوط به یک پروژه Django هست ولی قبل از این روی Rust هم تست کردم و دقیق بود)

👍23❤9

3.59K views17:50

دستاوردهای یادگیری عمیق(InTec)

آپدیت جدید
Gemini2.5 Pro

این ابزار رو برای من غیر قابل استفاده کرده؛ فقط کافیه کمی تاریخچه چت بزرگ بشه (نه اینکه به محدودیت برسه؛ شاید نهایتاً به ۱۶ هزار توکن برسه)

اتفاقی که میوفته اینه که؛ چت‌های آخر رو بطور کامل فراموش می‌کنه و چت‌های قدیمی رو نگه می‌داره (یکی یادش رفته ایندکس منفی بذاره؟)

با چندتا از دوستان هم چک کردم برای اونها هم همین بود (تسک موردنظر برنامه‌نویسی هست.)

یکی لطفاً کامیت‌های آخر رو revert کنه!!!!

فعلاً:
بهترین راهکار اینه که یک سیستم پرامپت آماده کنید؛ و بعد هربار که تغییرات لازم داشتید یک چت جدید ایجاد کنید.
یا اینکه برید روی ابزارهای دیگه.

👍25❤2

3.14K viewsedited 15:44

دستاوردهای یادگیری عمیق(InTec)

آپدیت جدید Gemini2.5 Pro این ابزار رو برای من غیر قابل استفاده کرده؛ فقط کافیه کمی تاریخچه چت بزرگ بشه (نه اینکه به محدودیت برسه؛ شاید نهایتاً به ۱۶ هزار توکن برسه) اتفاقی که میوفته اینه که؛ چت‌های آخر رو بطور کامل فراموش می‌کنه و چت‌های قدیمی رو نگه…

دقیقاً همین چندروز قبل؛ صحبتی داشتیم با چندتا از بچه‌های سنیور.

بحث AI جدی شد؛ به این نتیجه رسیدیم چندتا نیروی هندی بگیریم (مثل کارهای آمازون، تسلا و ...) بگیم هوش مصنوعی کد هست بدون خطا.

اتفاقاً یک تلاش کوچکی هم روی ساخت ویدئو کردیم؛ ولی تسک زیاد بود و veo3 پولی خلاصه بیخیال شدیم.

اما حالا از صبح خبر builderai رو دارم می‌بینم فقط و میزان سرمایه‌گذاری و درآمدش.

بازم می‌گم؛ AI فقط جایگزین coder‌ها می‌شه و باعث تغییر تعریف نیروی Junior خواهد شد (جونیور مدل فعلی حذف می‌شه)
برای دووم آوردن فقط کافیه :
Software Engineer
بشید؛ همین و بس.

How to survive the rise of AI
by Me

❤50👍2

4.84K viewsedited 16:34

2025/07/11 21:59:15
Back to Top

HTML Embed Code:

<iframe width="100%" src="https://www.bootg.com/buyppe/web?embed=1" title="Telegram Web" frameborder="0" allow="accelerometer; autoplay; clipboard-write; encrypted-media; gyroscope; picture-in-picture" allowfullscreen></iframe>