Telegram Web Link
یه ایده‌ی خلاقانه به نام GraphRAG برای تقویت توانایی‌ LLMها

یکی از چالش‌های کلیدی در مدل‌های زبانی بزرگ (LLM) استفاده از آن‌ها برای حل مسائل فراتر از داده‌های آموزش است. به‌منظور برآورده شدن این هدف، تیم تحقیقاتی مایکروسافت GraphRAG را معرفی کرده که به‌عنوان یک تکنیک پیشرفته
برای بهبود عملکرد Retrieval-Augmented Generation (RAG) استفاده می‌شود.

ویژگی‌های کلیدی GraphRAG:

ایجاد گراف دانش توسط LLM: این روش به‌صورت خودکار گرافی از موجودیت‌ها و روابط موجود در داده‌های خصوصی تولید می‌کند.

خوشه‌بندی معنایی: با ایجاد ساختارهای معنایی سلسله‌مراتبی، داده‌ها به خوشه‌هایی معنادار تقسیم‌بندی می‌شوند که امکان پیش‌خلاصه‌سازی اطلاعات را فراهم می‌کند.

افزایش دقت بازیابی: با استفاده از گراف تولید شده، GraphRAG محتوای مرتبط‌تری را برای ورود به پنجره زمینه LLM فراهم می‌آورد و پاسخ‌های دقیق‌تری تولید می‌کند.

پشتیبانی از پرسش‌های پیچیده: این تکنیک توانایی پردازش سوالاتی که نیاز به تجمیع
اطلاعات پراکنده یا تحلیل تم‌های کلان دارند را افزایش می‌دهد.

📊 عملکرد: در یک آزمایش با داده‌های خبری پیچیده، GraphRAG توانسته مفاهیم
کلیدی مانند فعالیت‌های سیاسی و نظامی مرتبط با "Novorossiya" را با دقت بالا شناسایی کند. این نتایج، بهبود چشمگیری را نسبت به روش‌های RAG پایه (که عملکرد آن‌ها صرفا با استفاده از فاصله وکتور سوال و جواب است) نشان داد که معمولاً در اتصال اطلاعات پراکنده ناکام بودند.

🔗 مزایای GraphRAG:

منبع‌نگاری دقیق: هر پاسخ به داده‌های اصلی مرتبط است و امکان تأیید صحت اطلاعات را فراهم می‌کند.

تحلیل کل‌نگر داده‌ها: خوشه‌بندی معنایی امکان شناسایی تم‌های اصلی و پاسخ‌دهی به سوالات کلی‌تر را بهبود می‌بخشد.

تطبیق با داده‌های خصوصی: این روش برای داده‌هایی که مدل‌های LLM به آن‌ها آموزش ندیده‌اند، مانند اسناد تجاری یا داده‌های اختصاصی سازمانی، ایده‌آل است.

مطالعه‌ی مقاله کامل

بخوانید: RAG چیست؟

بخوانید: LLM چیست؟


@Ai_Events
با سلام و احترام. به اطلاع میرساند، یک موقعیت دیگر برای جذب محقق پسادکتری در موضوعات زیر در دانشگاه تهران وجود دارد.

افراد دارای مدرک دکتری در بهینه سازی نظری یا عددی، علاقه مند به پژوهش در
زمینه هوش مصنوعی، یادگیری ماشین و تحلیل داده از منظر بهینه سازی، که بیش
از ۵ سال از تاریخ فارغ‌التحصیلی آنها نگذشته باشد و حداقل ۲ مقاله مرتبط
در مجلات معتبر دارند، می‌توانند تقاضای خود را به آدرس ایمیل
[email protected]
ارسال نمایند.

مهلت ارسال درخواست:
۲۵ آذر ۱۴۰۳

با تشکر- مجید سلیمانی دامنه، دانشگاه تهران

@Ai_Events
مجموعه سمینار‌های ژورنال کلاب MIND Lab

آقای سید رضا توکلی

چهارشنبه، 14 آذر ماه، ساعت 13

جلسه به صورت ترکیبی (حضوری و مجازی) برگزار می‌گردد.

دانشگاه صنعتی امیرکبیر، دانشکده ریاضی و علوم کامپیوتر، طبقه سوم، اتاق 312

لینک گوگل میت:
https://meet.google.com/xfu-vsxs-uzj


@MIND_Laboratory

@Ai_Events
💠 Compositional Learning Journal Club

Join us this week for an in-depth discussion on Compositional Learning in the context of cutting-edge text-to-image generative models. We will explore recent breakthroughs and challenges, focusing on how these models handle compositional tasks and where improvements can be made.

This Week's Presentation:

🔹 Title: GenArtist: Multimodal LLM as an Agent for Unified Image Generation and Editing

🔸 Presenter: Dr Rohban

🌀 Abstract:
This innovative framework addresses the limitations of current image generation models in handling intricate text prompts and ensuring reliability through verification and self-correction mechanisms. Coordinated by a multimodal large language model (MLLM) agent, GenArtist integrates a diverse library of tools, enabling seamless task decomposition, step-by-step execution, and systematic self-correction. With its tree-structured planning and advanced use of position-related inputs, GenArtist achieves state-of-the-art performance, outperforming models like SDXL and DALL-E 3. This session will delve into the system’s architecture and its groundbreaking potential for advancing image generation and editing tasks.


📄 Papers: GenArtist: Multimodal LLM as an Agent for Unified Image Generation and Editing


Session Details:
- 📅 Date: Wednesday
- 🕒 Time: 3:30 - 4:30 PM
- 🌐 Location: Online at vc.sharif.edu/ch/rohban

@Ai_Events
تصویر بالا، درخت تکامل مدل‌های زبانی بزرگ (LLM) رو از سال ۲۰۱۸ تا ۲۰۲۴ نشون میده.

نمودار سه شاخه اصلی داره:
- شاخه قرمز شامل مدل‌های Encoder-only مثل BERT هست.
- شاخه سبز شامل مدل‌های Encoder-Decoder مثل T5 هست.
- شاخه آبی شامل مدل‌های Decoder-only مثل GPT هست.

توی هر شاخه، برگ‌ها مسیر پیشرفت مدل‌ها رو نشون میدن. مثلا، در شاخه آبی، شروع‌کننده تقریبا GPT-2 بوده و جدیدترین‌ هم Llama 3.2 هست.
Media is too big
VIEW IN TELEGRAM
گفت‌وگو با نوح!

یووال نوح هراری، نویسنده و تاریخ‌دان، تو یه مصاحبه درباره کتاب جدیدش "نکسوس: تاریخچه مختصر شبکه‌های اطلاعاتی از عصر سنگ تا هوش مصنوعی" صحبت می‌کنه که واقعا جذابه!

هراری می‌گه: "همون‌طور که خوردن غذای بیشتر همیشه به معنی سلامتی نیست، اطلاعات بیشتر هم به معنی خرد و آگاهی نیست! باید مثل رژیم غذایی، برای ذهنمون هم رژیم اطلاعاتی داشته باشیم."

هراری سوال مهمی رو مطرح می‌کنه "چطور ممکنه ما پیشرفته‌ترین فناوری‌های تاریخ رو داشته باشیم، ولی دیگه نتونیم با هم گفت‌وگو کنیم؟" و اشاره می‌کنه که تکنولوژی به جای بهبود گفتگوها، داره اونو نابود می‌کنه.

تو بخشی از این گفت‌و‌گو، هراری میگه اگه تمام سرمایه‌گذاری‌ها روی هوش مصنوعی باشه و رشد ذهن انسان رو فراموش کنیم، این یک خبر بد برای بشریته. اما اگر هم‌زمان روی هر دو تمرکز کنیم، آینده‌ای روشن در انتظار ماست.

پیش‌تر کتاب‌های "انسان خردمند"، "انسان خداگونه"، و "بیست و یک درس برای قرن بیست و یک" رو از این نویسنده خونده‌م، و اگر تو زمینه هوش فعال هستید، حداقل کتاب انسان خداگونه رو بخونید. این گفت‌وگو هم پر از ایده‌های ناب و جذابه، حتما ببینیدش!

@Ai_Events
به مناسبت هفته پژوهش، دو سخنرانی تخصصی در دانشکده مهندسی کامپیوتر دانشگاه امیرکبیر با همکاری انجمن علمی این دانشکده برگزار می‌شود!

یادگیری ماشین با کامپیوترهای کوانتومی
توسط دکتر نگار عشری آستانی، استادیار دانشکده فیزیک و مهندسی انرژی دانشگاه صنعتی امیرکبیر
زمان: یکشنبه ۲۵ آذر، ساعت ۱۲:۳۰ الی ۱۳:۳۰

عدالت در یادگیری ماشین در مقیاس بزرگ: از مدل‌های سنتی تا مدل‌های زبانی بزرگ (LLMs) ⚖️🤖
توسط دکتر سینا بهارلویی، دانشمند ارشد در eBay و فارغ‌التحصیل دانشگاه USC
زمان: شنبه ۲۴ آذر، ساعت ۱۲:۳۰ الی ۱۳:۳۰



مکان: آمفی تئاتر دانشکده مهندسی کامپیوتر دانشگاه امیرکبیر

@Ai_Events
وبینار پردازش صدا و یادگیری ماشین


سرکار خانم نیلوفر جزایری
به میزبانی جناب آقای دکتر بهزاد نجفی

چهارشنبه ۲۱ آذرماه ساعت ۱۷:۳۰ الی ۱۸:۳۰

لینک شرکت در وبینار:
https://meet.google.com/rec-wyir-aqd


@Ai_Events
This media is not supported in your browser
VIEW IN TELEGRAM
یلداتون به شادی و خوشی 🌺🌹💮

به امید اینکه با کنش‌گری‌های به موقع‌مون، یلدای آینده، منتظر یه آینده بهتر برای وطن باشیم.


@Ai_Events
انجمن علمی دانشکده ریاضی و علوم کامپیوتر دانشگاه صنعتی امیرکبیر برگزار می‌‌نماید:

بهینه‌سازی سبد سهام بااستفاده
از تئوری گراف و شبکه های عصبی


ارائه‌دهنده:
آقای محمدمهدی حاجی عباسی

تاریخ: دوشنبه ۳ دی ماه ۱۴۰۳
زمان: ساعت ۱۷:۰۰ الی ۱۸:۳۰

لینک گوگل میت:
https://meet.google.com/tbj-uumu-iyx
@MCS_SSC


@Ai_Events
می‌دونید سه مفهوم زیر چی هستند و چطور از هم تفکیک میشن؟
1. تشخیص نوآوری (Novelty Detection)
2. داده‌های خارج از توزیع (OOD)
3. تشخیص ناهنجاری (Anomaly Dete
ction)

هرکدام از این مفاهیم، با وجود شباهت‌های ظاهری، کاربردهای متفاوتی دارند و به‌ویژه در شرایط مختلف مدل‌های یادگیری ماشین، عملکردهای متفاوتی از خود نشان می‌دهند. در ادامه به توضیح هرکدام پرداخته و تفاوت‌های آن‌ها را بررسی می‌کنیم:

1. شناسایی نوآوری (Novelty Detection)
شناسایی نوآوری به فرآیند شناسایی نمونه‌هایی اشاره دارد که در داده‌های آموزشی حضور نداشته‌اند، اما ممکن است به یک یا چند کلاس جدید مرتبط باشند. این امر به‌طور خاص در مدل‌هایی که بر روی داده‌های محدود آموزش دیده‌اند، کاربرد دارد. هدف این است که مدل قادر باشد نمونه‌های جدیدی که ممکن است به کلاس‌های ناشناخته تعلق داشته باشند را شناسایی کند.
مثال: فرض کنید مدل شما برای تشخیص تصاویر سگ و گربه آموزش دیده است. اگر تصویر یک خرگوش به مدل داده شود، مدل باید این تصویر را به‌عنوان یک نمونه جدید شناسایی کرده و از آن‌جایی که در داده‌های آموزشی نبوده است، به‌عنوان کلاس جدید شناسایی کند.
ویژگی: این فرآیند بر شناسایی نمونه‌هایی متمرکز است که ممکن است با کلاس‌های جدید مرتبط باشند ولی به هیچ‌وجه در مجموعه داده‌های آموزش دیده‌شده وجود نداشته‌اند.

2. داده‌های خارج از توزیع (OOD - Out-of-Distribution Data)
داده‌های خارج از توزیع به نمونه‌هایی اطلاق می‌شود که به‌طور کلی از توزیع داده‌هایی که مدل روی آن آموزش دیده، متفاوت هستند. در این حالت، مدل با داده‌هایی روبه‌رو می‌شود که ویژگی‌های آن‌ها به‌طور قابل توجهی از داده‌های موجود در مجموعه آموزشی متفاوت است.
مثال: فرض کنید مدل شما بر اساس داده‌های حیوانات خانگی مانند سگ و گربه آموزش دیده است. اگر تصویر یک ماشین به مدل داده شود، این تصویر به‌عنوان داده‌ای خارج از توزیع شناسایی می‌شود چون مدل هیچ‌گاه بر داده‌هایی با چنین ویژگی‌هایی آموزش ندیده است.
ویژگی: در اینجا مدل به دنبال تشخیص نمونه‌هایی است که از نظر توزیع آماری با داده‌های آموزش‌دیده متفاوت باشند، حتی اگر نمونه‌های جدید به دسته‌های جدید تعلق نداشته باشند.

3. شناسایی ناهنجاری (Anomaly Detection)
شناسایی ناهنجاری به فرآیند تشخیص نمونه‌هایی اطلاق می‌شود که تفاوت قابل توجهی با سایر داده‌های موجود دارند. این نوع تشخیص به‌طور معمول برای شناسایی رفتارهای غیرطبیعی یا غیرمنتظره در داده‌ها مورد استفاده قرار می‌گیرد.
مثال: در یک سیستم مانیتورینگ، اگر مصرف پردازنده به‌طور ناگهانی و غیرمنتظره‌ای افزایش یابد، این وضعیت به‌عنوان یک ناهنجاری شناسایی می‌شود زیرا تفاوت زیادی با الگوهای عادی مصرف پردازنده دارد.
ویژگی: ناهنجاری‌ها نمونه‌هایی هستند که ویژگی‌هایشان به‌طور قابل توجهی از دیگر نمونه‌ها دور است و این امر می‌تواند به‌عنوان علائم خرابی سیستم، تقلب یا مشکلات عملکردی مشاهده شود.

تفاوت‌ها و مقایسه:

در ساده‌ترین شکل، تفاوت‌های این سه مفهوم به‌طور خلاصه به این صورت است:

- شناسایی نوآوری: تمرکز بر کشف کلاس‌های جدید که در داده‌های آموزش موجود نبوده‌اند.
- داده‌های خارج از توزیع (OOD): شناسایی نمونه‌هایی که از توزیع داده‌های آموزش متفاوت هستند، حتی اگر این نمونه‌ها به کلاس‌های جدید تعلق نداشته باشند.
- شناسایی ناهنجاری: شناسایی نمونه‌های غیرعادی که از نظر ویژگی‌ها به‌طور قابل توجهی از دیگر نمونه‌ها متفاوت‌اند.

کاربردها:

- شناسایی نوآوری (Novelty Detection): این مفهوم به‌طور ویژه در کاربردهایی مانند کشف کلاس‌های جدید در داده‌های پیچیده و در حال تغییر، یا زمانی که داده‌های جدید وارد می‌شوند، کاربرد دارد.
- داده‌های خارج از توزیع (OOD): این مفاهیم معمولاً در زمینه‌های امنیت مدل یا استفاده از مدل‌های عمومی که ممکن است با داده‌های خارج از حوزه خود مواجه شوند، کاربرد دارد.
- شناسایی ناهنجاری (Anomaly Detection): این مورد به‌ویژه در شناسایی تقلب، خرابی سیستم‌ها یا تشخیص رفتار غیرعادی در سیستم‌های پیچیده مانند شبکه‌های کامپیوتری و سیستم‌های نظارتی کاربرد دارد.

به عنوان جمع‌بندی، این سه مفهوم با وجود شباهت‌های اولیه، در اساس و کاربرد تفاوت‌های مهمی دارند. شناسایی نوآوری بیشتر بر شناسایی کلاس‌های جدید متمرکز است، در حالی که OOD به شناسایی داده‌هایی می‌پردازد که کاملاً خارج از توزیع داده‌های آموزش‌دیده هستند، و شناسایی ناهنجاری به دنبال نمونه‌هایی است که از الگوهای عادی دور هستند.
مصی کوهنورد، مدیر منابع انسانی دیجی‌کالا، اعلام کرد: مهاجرت با ۴۶ درصد و یافتن موقعیت شغلی بهتر با ۱۵ درصد، مهم‌ترین دلایل خروج نیروهای دیجی‌کالا در سال ۱۴۰۳ بوده‌اند. این آمار نشان می‌دهد که نرخ مهاجرت نسبت به سال گذشته ۹ درصد افزایش و خروج به دلیل یافتن شغل بهتر ۲۰ درصد کاهش یافته است

وی با اشاره به نرخ خروج ۲۰ درصدی نیروی کار متخصص در سال گذشته، گفت: برای مدیریت این چالش، تصمیم گرفتیم با انجام نظرسنجی‌ها و تحلیل داده‌ها، دلایل این مسئله را بررسی کنیم. نتایج نشان داد که ۳۷ درصد از خروج‌ها به دلیل مهاجرت، ۳۵ درصد به دلیل یافتن شغل بهتر و مابقی به دلایل متفرقه بوده است. همچنین، ۴۰ درصد از خروجی‌ها در رده سنی ۲۱ تا ۳۵ سال قرار داشتند که بخش عمده‌ای از آن‌ها به دلیل مهاجرت شرکت را ترک کردند

وی توضیح داد: نتایج نظرسنجی به ما کمک کرد تا دغدغه‌ها و نیازهای نیروهای خود را بهتر بشناسیم. مشکلاتی نظیر دستمزد پایین، حجم زیاد کار، احساس دیده نشدن و عدم شفافیت در سلسله‌مراتب از جمله مهم‌ترین چالش‌های مطرح‌شده بودند. در نتیجه، فرهنگ کاری‌مان را تغییر دادیم و توانستیم نرخ خروج نیروها را ۷ درصد کاهش دهیم
Source

@Ai_Events
Ai Events️
. دکتر غضنفری، رئیس صندوق توسعه ملی: کل دارایی صندوق توسعه ملی، ۱۵۰ میلیارد دلار بود که ۱۰۰ میلیارد دلار رو دولت‌های مختلف برداشت کردند و ۴۰ میلیارد دلار، تسهیلات به صنایع پتروشیمی، نیروگاه‌ها و ... داده شده که اون‌ها هم به دلیل قیمت‌گذاری دستوری قادر به…
This media is not supported in your browser
VIEW IN TELEGRAM
دکتر غضنفری، رئیس صندوق توسعه ملی: صندوق توسعه ملی مشارکت خود را در حوزه‌های نفت و گاز، هوش مصنوعی و انرژی‌های تجدیدپذیر افزایش داده است.

پی‌نوشت:‌ حرکت بسیار پسندیده و مثبتی هست، اما با توجه به تحریم‌ها در واردات سخت افزار و همچنین بروکراسی‌های پیچیده (و گاها سفارشی) دسترسی به چنین منابع مالی، انتظار نتیجه چندانی از این حرکت نداریم. اما به خاطر می‌سپریم که این وظیفه ما به عنوان کارشناس هست که این برنامه‌ها، بودجه‌هایی که تخصیص داده میشه و طرح‌هایی که مورد پذیرش واقع می‌شه رو زیر ذره‌بین بگیریم و با استفاده از هر رسانه‌ای، مطلوب رو خواهان باشیم.
همچنین از قبل می‌دونیم که بودجه‌ی صندوق توسعه، از منابعی که متعلق به تک‌تک ما هست تامین میشه.

@Ai_Events
کارگاه آنلاین هوش مصنوعی کاربردی


این کارگاه، برای عموم، علاقه‌مندان و متخصصان به مباحث هوش مصنوعی و خصوصا
مدیران شرکت‌ها / سازمان‌ها / ارگان‌ها و هم‌چنین برنامه‌نویسان گرامی مفید
خواهد بود.

لینک ثبت‌نام در کارگاه آنلاین:

https://evnd.co/d20rX


@Ai_Events
📣 TA Application Form

🤖 Deep Learning
🧑🏻‍🏫 Dr. Fatemeh  Seyyedsalehi
🧑‍💻 Computer science group at the department of mathematics, Sharif University

Deadline: January 26th

https://forms.gle/z7betBT2N2ACCrir8

توجه: این موقعیت مختص دانشجویان شریف نمی‌باشد و افراد دیگر خارج از دانشگاه هم می‌توانند استفاده کنند.

@Ai_Events
دومین رویداد از سلسله رویدادهای "هوش مصنوعی در آموزش عالی" با موضوع:

تولید محتوا در عصر هوش مصنوعی: با رویکرد تنظیم برنامه درسی

👤 Supriya Kulkarni, Founder of The Ethics Company, Indonesia
👤Trinidad Balart, AI on Education Developer, USA
👤 Amir Shahraini, AI Policy Researcher, Iran (Moderator)

📅 چهارشنبه، ۱۹ دی ماه ۱۴۰۳ ساعت ۱۷ الی ۱۸:۳۰

لینک ثبت‌نام در رويداد

افزودن به تقویم گوگل

لینک پخش زنده رویداد
(هنگام ورود، گزینه میهمان را انتخاب کنید.)
پشتیبانی

@spri_sharif

@Ai_Events
2025/07/01 15:57:49
Back to Top
HTML Embed Code: