Ai Events️
مجموعه سخنرانی های علمی هوش مصنوعی Adapting AI: Explainability and Distributability Tackling Challenges in Self-supervised EEG Representation Learning Universal Novelty Detection زمان برگزاری: چهارشنبه 7 آذر 1403 ساعت 11 الی 15 محل برگزاری: دانشگاه…
برنامه رویداد پایانی هشتمین دوره مسابقات هوش مصنوعی امیرکبیر
زمان: چهارشنبه 7 آذر 1403
مکان: دانشگاه صنعتی امیرکبیر
@Ai_Events
زمان: چهارشنبه 7 آذر 1403
مکان: دانشگاه صنعتی امیرکبیر
@Ai_Events
یه ایدهی خلاقانه به نام GraphRAG برای تقویت توانایی LLMها
یکی از چالشهای کلیدی در مدلهای زبانی بزرگ (LLM) استفاده از آنها برای حل مسائل فراتر از دادههای آموزش است. بهمنظور برآورده شدن این هدف، تیم تحقیقاتی مایکروسافت GraphRAG را معرفی کرده که بهعنوان یک تکنیک پیشرفته
برای بهبود عملکرد Retrieval-Augmented Generation (RAG) استفاده میشود.
ویژگیهای کلیدی GraphRAG:
ایجاد گراف دانش توسط LLM: این روش بهصورت خودکار گرافی از موجودیتها و روابط موجود در دادههای خصوصی تولید میکند.
خوشهبندی معنایی: با ایجاد ساختارهای معنایی سلسلهمراتبی، دادهها به خوشههایی معنادار تقسیمبندی میشوند که امکان پیشخلاصهسازی اطلاعات را فراهم میکند.
افزایش دقت بازیابی: با استفاده از گراف تولید شده، GraphRAG محتوای مرتبطتری را برای ورود به پنجره زمینه LLM فراهم میآورد و پاسخهای دقیقتری تولید میکند.
پشتیبانی از پرسشهای پیچیده: این تکنیک توانایی پردازش سوالاتی که نیاز به تجمیع
اطلاعات پراکنده یا تحلیل تمهای کلان دارند را افزایش میدهد.
📊 عملکرد: در یک آزمایش با دادههای خبری پیچیده، GraphRAG توانسته مفاهیم
کلیدی مانند فعالیتهای سیاسی و نظامی مرتبط با "Novorossiya" را با دقت بالا شناسایی کند. این نتایج، بهبود چشمگیری را نسبت به روشهای RAG پایه (که عملکرد آنها صرفا با استفاده از فاصله وکتور سوال و جواب است) نشان داد که معمولاً در اتصال اطلاعات پراکنده ناکام بودند.
🔗 مزایای GraphRAG:
منبعنگاری دقیق: هر پاسخ به دادههای اصلی مرتبط است و امکان تأیید صحت اطلاعات را فراهم میکند.
تحلیل کلنگر دادهها: خوشهبندی معنایی امکان شناسایی تمهای اصلی و پاسخدهی به سوالات کلیتر را بهبود میبخشد.
تطبیق با دادههای خصوصی: این روش برای دادههایی که مدلهای LLM به آنها آموزش ندیدهاند، مانند اسناد تجاری یا دادههای اختصاصی سازمانی، ایدهآل است.
مطالعهی مقاله کامل
بخوانید: RAG چیست؟
بخوانید: LLM چیست؟
@Ai_Events
یکی از چالشهای کلیدی در مدلهای زبانی بزرگ (LLM) استفاده از آنها برای حل مسائل فراتر از دادههای آموزش است. بهمنظور برآورده شدن این هدف، تیم تحقیقاتی مایکروسافت GraphRAG را معرفی کرده که بهعنوان یک تکنیک پیشرفته
برای بهبود عملکرد Retrieval-Augmented Generation (RAG) استفاده میشود.
ویژگیهای کلیدی GraphRAG:
ایجاد گراف دانش توسط LLM: این روش بهصورت خودکار گرافی از موجودیتها و روابط موجود در دادههای خصوصی تولید میکند.
خوشهبندی معنایی: با ایجاد ساختارهای معنایی سلسلهمراتبی، دادهها به خوشههایی معنادار تقسیمبندی میشوند که امکان پیشخلاصهسازی اطلاعات را فراهم میکند.
افزایش دقت بازیابی: با استفاده از گراف تولید شده، GraphRAG محتوای مرتبطتری را برای ورود به پنجره زمینه LLM فراهم میآورد و پاسخهای دقیقتری تولید میکند.
پشتیبانی از پرسشهای پیچیده: این تکنیک توانایی پردازش سوالاتی که نیاز به تجمیع
اطلاعات پراکنده یا تحلیل تمهای کلان دارند را افزایش میدهد.
📊 عملکرد: در یک آزمایش با دادههای خبری پیچیده، GraphRAG توانسته مفاهیم
کلیدی مانند فعالیتهای سیاسی و نظامی مرتبط با "Novorossiya" را با دقت بالا شناسایی کند. این نتایج، بهبود چشمگیری را نسبت به روشهای RAG پایه (که عملکرد آنها صرفا با استفاده از فاصله وکتور سوال و جواب است) نشان داد که معمولاً در اتصال اطلاعات پراکنده ناکام بودند.
🔗 مزایای GraphRAG:
منبعنگاری دقیق: هر پاسخ به دادههای اصلی مرتبط است و امکان تأیید صحت اطلاعات را فراهم میکند.
تحلیل کلنگر دادهها: خوشهبندی معنایی امکان شناسایی تمهای اصلی و پاسخدهی به سوالات کلیتر را بهبود میبخشد.
تطبیق با دادههای خصوصی: این روش برای دادههایی که مدلهای LLM به آنها آموزش ندیدهاند، مانند اسناد تجاری یا دادههای اختصاصی سازمانی، ایدهآل است.
مطالعهی مقاله کامل
بخوانید: RAG چیست؟
بخوانید: LLM چیست؟
@Ai_Events
با سلام و احترام. به اطلاع میرساند، یک موقعیت دیگر برای جذب محقق پسادکتری در موضوعات زیر در دانشگاه تهران وجود دارد.
افراد دارای مدرک دکتری در بهینه سازی نظری یا عددی، علاقه مند به پژوهش در
زمینه هوش مصنوعی، یادگیری ماشین و تحلیل داده از منظر بهینه سازی، که بیش
از ۵ سال از تاریخ فارغالتحصیلی آنها نگذشته باشد و حداقل ۲ مقاله مرتبط
در مجلات معتبر دارند، میتوانند تقاضای خود را به آدرس ایمیل
[email protected]
ارسال نمایند.
مهلت ارسال درخواست:
۲۵ آذر ۱۴۰۳
با تشکر- مجید سلیمانی دامنه، دانشگاه تهران
@Ai_Events
افراد دارای مدرک دکتری در بهینه سازی نظری یا عددی، علاقه مند به پژوهش در
زمینه هوش مصنوعی، یادگیری ماشین و تحلیل داده از منظر بهینه سازی، که بیش
از ۵ سال از تاریخ فارغالتحصیلی آنها نگذشته باشد و حداقل ۲ مقاله مرتبط
در مجلات معتبر دارند، میتوانند تقاضای خود را به آدرس ایمیل
[email protected]
ارسال نمایند.
مهلت ارسال درخواست:
۲۵ آذر ۱۴۰۳
با تشکر- مجید سلیمانی دامنه، دانشگاه تهران
@Ai_Events
مجموعه سمینارهای ژورنال کلاب MIND Lab
آقای سید رضا توکلی
چهارشنبه، 14 آذر ماه، ساعت 13
جلسه به صورت ترکیبی (حضوری و مجازی) برگزار میگردد.
دانشگاه صنعتی امیرکبیر، دانشکده ریاضی و علوم کامپیوتر، طبقه سوم، اتاق 312
لینک گوگل میت:
https://meet.google.com/xfu-vsxs-uzj
@MIND_Laboratory
@Ai_Events
آقای سید رضا توکلی
چهارشنبه، 14 آذر ماه، ساعت 13
جلسه به صورت ترکیبی (حضوری و مجازی) برگزار میگردد.
دانشگاه صنعتی امیرکبیر، دانشکده ریاضی و علوم کامپیوتر، طبقه سوم، اتاق 312
لینک گوگل میت:
https://meet.google.com/xfu-vsxs-uzj
@MIND_Laboratory
@Ai_Events
💠 Compositional Learning Journal Club
Join us this week for an in-depth discussion on Compositional Learning in the context of cutting-edge text-to-image generative models. We will explore recent breakthroughs and challenges, focusing on how these models handle compositional tasks and where improvements can be made.
✅ This Week's Presentation:
🔹 Title: GenArtist: Multimodal LLM as an Agent for Unified Image Generation and Editing
🔸 Presenter: Dr Rohban
🌀 Abstract:
This innovative framework addresses the limitations of current image generation models in handling intricate text prompts and ensuring reliability through verification and self-correction mechanisms. Coordinated by a multimodal large language model (MLLM) agent, GenArtist integrates a diverse library of tools, enabling seamless task decomposition, step-by-step execution, and systematic self-correction. With its tree-structured planning and advanced use of position-related inputs, GenArtist achieves state-of-the-art performance, outperforming models like SDXL and DALL-E 3. This session will delve into the system’s architecture and its groundbreaking potential for advancing image generation and editing tasks.
📄 Papers: GenArtist: Multimodal LLM as an Agent for Unified Image Generation and Editing
Session Details:
- 📅 Date: Wednesday
- 🕒 Time: 3:30 - 4:30 PM
- 🌐 Location: Online at vc.sharif.edu/ch/rohban
@Ai_Events
Join us this week for an in-depth discussion on Compositional Learning in the context of cutting-edge text-to-image generative models. We will explore recent breakthroughs and challenges, focusing on how these models handle compositional tasks and where improvements can be made.
✅ This Week's Presentation:
🔹 Title: GenArtist: Multimodal LLM as an Agent for Unified Image Generation and Editing
🔸 Presenter: Dr Rohban
🌀 Abstract:
This innovative framework addresses the limitations of current image generation models in handling intricate text prompts and ensuring reliability through verification and self-correction mechanisms. Coordinated by a multimodal large language model (MLLM) agent, GenArtist integrates a diverse library of tools, enabling seamless task decomposition, step-by-step execution, and systematic self-correction. With its tree-structured planning and advanced use of position-related inputs, GenArtist achieves state-of-the-art performance, outperforming models like SDXL and DALL-E 3. This session will delve into the system’s architecture and its groundbreaking potential for advancing image generation and editing tasks.
📄 Papers: GenArtist: Multimodal LLM as an Agent for Unified Image Generation and Editing
Session Details:
- 📅 Date: Wednesday
- 🕒 Time: 3:30 - 4:30 PM
- 🌐 Location: Online at vc.sharif.edu/ch/rohban
@Ai_Events
Forwarded from Silicon Brain | جامعه هوش مصنوعی
تصویر بالا، درخت تکامل مدلهای زبانی بزرگ (LLM) رو از سال ۲۰۱۸ تا ۲۰۲۴ نشون میده.
نمودار سه شاخه اصلی داره:
- شاخه قرمز شامل مدلهای
- شاخه سبز شامل مدلهای
- شاخه آبی شامل مدلهای
توی هر شاخه، برگها مسیر پیشرفت مدلها رو نشون میدن. مثلا، در شاخه آبی، شروعکننده تقریبا GPT-2 بوده و جدیدترین هم Llama 3.2 هست.
نمودار سه شاخه اصلی داره:
- شاخه قرمز شامل مدلهای
Encoder-only
مثل BERT
هست.- شاخه سبز شامل مدلهای
Encoder-Decoder
مثل T5
هست. - شاخه آبی شامل مدلهای
Decoder-onl
y مثل GPT
هست.توی هر شاخه، برگها مسیر پیشرفت مدلها رو نشون میدن. مثلا، در شاخه آبی، شروعکننده تقریبا GPT-2 بوده و جدیدترین هم Llama 3.2 هست.
Media is too big
VIEW IN TELEGRAM
گفتوگو با نوح!
یووال نوح هراری، نویسنده و تاریخدان، تو یه مصاحبه درباره کتاب جدیدش "نکسوس: تاریخچه مختصر شبکههای اطلاعاتی از عصر سنگ تا هوش مصنوعی" صحبت میکنه که واقعا جذابه!
هراری میگه: "همونطور که خوردن غذای بیشتر همیشه به معنی سلامتی نیست، اطلاعات بیشتر هم به معنی خرد و آگاهی نیست! باید مثل رژیم غذایی، برای ذهنمون هم رژیم اطلاعاتی داشته باشیم."
هراری سوال مهمی رو مطرح میکنه "چطور ممکنه ما پیشرفتهترین فناوریهای تاریخ رو داشته باشیم، ولی دیگه نتونیم با هم گفتوگو کنیم؟" و اشاره میکنه که تکنولوژی به جای بهبود گفتگوها، داره اونو نابود میکنه.
تو بخشی از این گفتوگو، هراری میگه اگه تمام سرمایهگذاریها روی هوش مصنوعی باشه و رشد ذهن انسان رو فراموش کنیم، این یک خبر بد برای بشریته. اما اگر همزمان روی هر دو تمرکز کنیم، آیندهای روشن در انتظار ماست.
پیشتر کتابهای "انسان خردمند"، "انسان خداگونه"، و "بیست و یک درس برای قرن بیست و یک" رو از این نویسنده خوندهم، و اگر تو زمینه هوش فعال هستید، حداقل کتاب انسان خداگونه رو بخونید. این گفتوگو هم پر از ایدههای ناب و جذابه، حتما ببینیدش!
@Ai_Events
یووال نوح هراری، نویسنده و تاریخدان، تو یه مصاحبه درباره کتاب جدیدش "نکسوس: تاریخچه مختصر شبکههای اطلاعاتی از عصر سنگ تا هوش مصنوعی" صحبت میکنه که واقعا جذابه!
هراری میگه: "همونطور که خوردن غذای بیشتر همیشه به معنی سلامتی نیست، اطلاعات بیشتر هم به معنی خرد و آگاهی نیست! باید مثل رژیم غذایی، برای ذهنمون هم رژیم اطلاعاتی داشته باشیم."
هراری سوال مهمی رو مطرح میکنه "چطور ممکنه ما پیشرفتهترین فناوریهای تاریخ رو داشته باشیم، ولی دیگه نتونیم با هم گفتوگو کنیم؟" و اشاره میکنه که تکنولوژی به جای بهبود گفتگوها، داره اونو نابود میکنه.
تو بخشی از این گفتوگو، هراری میگه اگه تمام سرمایهگذاریها روی هوش مصنوعی باشه و رشد ذهن انسان رو فراموش کنیم، این یک خبر بد برای بشریته. اما اگر همزمان روی هر دو تمرکز کنیم، آیندهای روشن در انتظار ماست.
پیشتر کتابهای "انسان خردمند"، "انسان خداگونه"، و "بیست و یک درس برای قرن بیست و یک" رو از این نویسنده خوندهم، و اگر تو زمینه هوش فعال هستید، حداقل کتاب انسان خداگونه رو بخونید. این گفتوگو هم پر از ایدههای ناب و جذابه، حتما ببینیدش!
@Ai_Events
به مناسبت هفته پژوهش، دو سخنرانی تخصصی در دانشکده مهندسی کامپیوتر دانشگاه امیرکبیر با همکاری انجمن علمی این دانشکده برگزار میشود!
یادگیری ماشین با کامپیوترهای کوانتومی
توسط دکتر نگار عشری آستانی، استادیار دانشکده فیزیک و مهندسی انرژی دانشگاه صنعتی امیرکبیر
زمان: یکشنبه ۲۵ آذر، ساعت ۱۲:۳۰ الی ۱۳:۳۰
عدالت در یادگیری ماشین در مقیاس بزرگ: از مدلهای سنتی تا مدلهای زبانی بزرگ (LLMs) ⚖️🤖
توسط دکتر سینا بهارلویی، دانشمند ارشد در eBay و فارغالتحصیل دانشگاه USC
زمان: شنبه ۲۴ آذر، ساعت ۱۲:۳۰ الی ۱۳:۳۰
مکان: آمفی تئاتر دانشکده مهندسی کامپیوتر دانشگاه امیرکبیر
@Ai_Events
یادگیری ماشین با کامپیوترهای کوانتومی
توسط دکتر نگار عشری آستانی، استادیار دانشکده فیزیک و مهندسی انرژی دانشگاه صنعتی امیرکبیر
زمان: یکشنبه ۲۵ آذر، ساعت ۱۲:۳۰ الی ۱۳:۳۰
عدالت در یادگیری ماشین در مقیاس بزرگ: از مدلهای سنتی تا مدلهای زبانی بزرگ (LLMs) ⚖️🤖
توسط دکتر سینا بهارلویی، دانشمند ارشد در eBay و فارغالتحصیل دانشگاه USC
زمان: شنبه ۲۴ آذر، ساعت ۱۲:۳۰ الی ۱۳:۳۰
مکان: آمفی تئاتر دانشکده مهندسی کامپیوتر دانشگاه امیرکبیر
@Ai_Events
وبینار پردازش صدا و یادگیری ماشین
سرکار خانم نیلوفر جزایری
به میزبانی جناب آقای دکتر بهزاد نجفی
چهارشنبه ۲۱ آذرماه ساعت ۱۷:۳۰ الی ۱۸:۳۰
لینک شرکت در وبینار:
https://meet.google.com/rec-wyir-aqd
@Ai_Events
سرکار خانم نیلوفر جزایری
به میزبانی جناب آقای دکتر بهزاد نجفی
چهارشنبه ۲۱ آذرماه ساعت ۱۷:۳۰ الی ۱۸:۳۰
لینک شرکت در وبینار:
https://meet.google.com/rec-wyir-aqd
@Ai_Events
Sam Altman says when ChatGPT went down, he had to work for 4 hours without it and he realized how reliant we are becoming on AI systems as a form of critical infrastructure!
@Ai_Events
@Ai_Events
YouTube
Craig Mundie with Sam Altman | Artificial Intelligence, Hope, and the Human Spirit
In his final book, the late Henry Kissinger joined forces with two leading technologists to mount “a profound exploration” (says Walter Isaacson) of the epochal challenges and opportunities presented by the revolution in artificial intelligence—a breakthrough…
This media is not supported in your browser
VIEW IN TELEGRAM
یلداتون به شادی و خوشی 🌺⚘🌹💮
به امید اینکه با کنشگریهای به موقعمون، یلدای آینده، منتظر یه آینده بهتر برای وطن باشیم.❤
@Ai_Events
به امید اینکه با کنشگریهای به موقعمون، یلدای آینده، منتظر یه آینده بهتر برای وطن باشیم.❤
@Ai_Events
انجمن علمی دانشکده ریاضی و علوم کامپیوتر دانشگاه صنعتی امیرکبیر برگزار مینماید:
بهینهسازی سبد سهام با استفاده
از تئوری گراف و شبکه های عصبی
ارائهدهنده:
آقای محمدمهدی حاجی عباسی
تاریخ: دوشنبه ۳ دی ماه ۱۴۰۳
زمان: ساعت ۱۷:۰۰ الی ۱۸:۳۰
لینک گوگل میت:
https://meet.google.com/tbj-uumu-iyx
@MCS_SSC
@Ai_Events
بهینهسازی سبد سهام با استفاده
از تئوری گراف و شبکه های عصبی
ارائهدهنده:
آقای محمدمهدی حاجی عباسی
تاریخ: دوشنبه ۳ دی ماه ۱۴۰۳
زمان: ساعت ۱۷:۰۰ الی ۱۸:۳۰
لینک گوگل میت:
https://meet.google.com/tbj-uumu-iyx
@MCS_SSC
@Ai_Events
میدونید سه مفهوم زیر چی هستند و چطور از هم تفکیک میشن؟
1. تشخیص نوآوری (Novelty Detection)
2. دادههای خارج از توزیع (OOD)
3. تشخیص ناهنجاری (Anomaly Detection)
هرکدام از این مفاهیم، با وجود شباهتهای ظاهری، کاربردهای متفاوتی دارند و بهویژه در شرایط مختلف مدلهای یادگیری ماشین، عملکردهای متفاوتی از خود نشان میدهند. در ادامه به توضیح هرکدام پرداخته و تفاوتهای آنها را بررسی میکنیم:
1. شناسایی نوآوری (Novelty Detection)
شناسایی نوآوری به فرآیند شناسایی نمونههایی اشاره دارد که در دادههای آموزشی حضور نداشتهاند، اما ممکن است به یک یا چند کلاس جدید مرتبط باشند. این امر بهطور خاص در مدلهایی که بر روی دادههای محدود آموزش دیدهاند، کاربرد دارد. هدف این است که مدل قادر باشد نمونههای جدیدی که ممکن است به کلاسهای ناشناخته تعلق داشته باشند را شناسایی کند.
مثال: فرض کنید مدل شما برای تشخیص تصاویر سگ و گربه آموزش دیده است. اگر تصویر یک خرگوش به مدل داده شود، مدل باید این تصویر را بهعنوان یک نمونه جدید شناسایی کرده و از آنجایی که در دادههای آموزشی نبوده است، بهعنوان کلاس جدید شناسایی کند.
ویژگی: این فرآیند بر شناسایی نمونههایی متمرکز است که ممکن است با کلاسهای جدید مرتبط باشند ولی به هیچوجه در مجموعه دادههای آموزش دیدهشده وجود نداشتهاند.
2. دادههای خارج از توزیع (OOD - Out-of-Distribution Data)
دادههای خارج از توزیع به نمونههایی اطلاق میشود که بهطور کلی از توزیع دادههایی که مدل روی آن آموزش دیده، متفاوت هستند. در این حالت، مدل با دادههایی روبهرو میشود که ویژگیهای آنها بهطور قابل توجهی از دادههای موجود در مجموعه آموزشی متفاوت است.
مثال: فرض کنید مدل شما بر اساس دادههای حیوانات خانگی مانند سگ و گربه آموزش دیده است. اگر تصویر یک ماشین به مدل داده شود، این تصویر بهعنوان دادهای خارج از توزیع شناسایی میشود چون مدل هیچگاه بر دادههایی با چنین ویژگیهایی آموزش ندیده است.
ویژگی: در اینجا مدل به دنبال تشخیص نمونههایی است که از نظر توزیع آماری با دادههای آموزشدیده متفاوت باشند، حتی اگر نمونههای جدید به دستههای جدید تعلق نداشته باشند.
3. شناسایی ناهنجاری (Anomaly Detection)
شناسایی ناهنجاری به فرآیند تشخیص نمونههایی اطلاق میشود که تفاوت قابل توجهی با سایر دادههای موجود دارند. این نوع تشخیص بهطور معمول برای شناسایی رفتارهای غیرطبیعی یا غیرمنتظره در دادهها مورد استفاده قرار میگیرد.
مثال: در یک سیستم مانیتورینگ، اگر مصرف پردازنده بهطور ناگهانی و غیرمنتظرهای افزایش یابد، این وضعیت بهعنوان یک ناهنجاری شناسایی میشود زیرا تفاوت زیادی با الگوهای عادی مصرف پردازنده دارد.
ویژگی: ناهنجاریها نمونههایی هستند که ویژگیهایشان بهطور قابل توجهی از دیگر نمونهها دور است و این امر میتواند بهعنوان علائم خرابی سیستم، تقلب یا مشکلات عملکردی مشاهده شود.
تفاوتها و مقایسه:
در سادهترین شکل، تفاوتهای این سه مفهوم بهطور خلاصه به این صورت است:
- شناسایی نوآوری: تمرکز بر کشف کلاسهای جدید که در دادههای آموزش موجود نبودهاند.
- دادههای خارج از توزیع (OOD): شناسایی نمونههایی که از توزیع دادههای آموزش متفاوت هستند، حتی اگر این نمونهها به کلاسهای جدید تعلق نداشته باشند.
- شناسایی ناهنجاری: شناسایی نمونههای غیرعادی که از نظر ویژگیها بهطور قابل توجهی از دیگر نمونهها متفاوتاند.
کاربردها:
- شناسایی نوآوری (Novelty Detection): این مفهوم بهطور ویژه در کاربردهایی مانند کشف کلاسهای جدید در دادههای پیچیده و در حال تغییر، یا زمانی که دادههای جدید وارد میشوند، کاربرد دارد.
- دادههای خارج از توزیع (OOD): این مفاهیم معمولاً در زمینههای امنیت مدل یا استفاده از مدلهای عمومی که ممکن است با دادههای خارج از حوزه خود مواجه شوند، کاربرد دارد.
- شناسایی ناهنجاری (Anomaly Detection): این مورد بهویژه در شناسایی تقلب، خرابی سیستمها یا تشخیص رفتار غیرعادی در سیستمهای پیچیده مانند شبکههای کامپیوتری و سیستمهای نظارتی کاربرد دارد.
به عنوان جمعبندی، این سه مفهوم با وجود شباهتهای اولیه، در اساس و کاربرد تفاوتهای مهمی دارند. شناسایی نوآوری بیشتر بر شناسایی کلاسهای جدید متمرکز است، در حالی که OOD به شناسایی دادههایی میپردازد که کاملاً خارج از توزیع دادههای آموزشدیده هستند، و شناسایی ناهنجاری به دنبال نمونههایی است که از الگوهای عادی دور هستند.
1. تشخیص نوآوری (Novelty Detection)
2. دادههای خارج از توزیع (OOD)
3. تشخیص ناهنجاری (Anomaly Detection)
هرکدام از این مفاهیم، با وجود شباهتهای ظاهری، کاربردهای متفاوتی دارند و بهویژه در شرایط مختلف مدلهای یادگیری ماشین، عملکردهای متفاوتی از خود نشان میدهند. در ادامه به توضیح هرکدام پرداخته و تفاوتهای آنها را بررسی میکنیم:
1. شناسایی نوآوری (Novelty Detection)
شناسایی نوآوری به فرآیند شناسایی نمونههایی اشاره دارد که در دادههای آموزشی حضور نداشتهاند، اما ممکن است به یک یا چند کلاس جدید مرتبط باشند. این امر بهطور خاص در مدلهایی که بر روی دادههای محدود آموزش دیدهاند، کاربرد دارد. هدف این است که مدل قادر باشد نمونههای جدیدی که ممکن است به کلاسهای ناشناخته تعلق داشته باشند را شناسایی کند.
مثال: فرض کنید مدل شما برای تشخیص تصاویر سگ و گربه آموزش دیده است. اگر تصویر یک خرگوش به مدل داده شود، مدل باید این تصویر را بهعنوان یک نمونه جدید شناسایی کرده و از آنجایی که در دادههای آموزشی نبوده است، بهعنوان کلاس جدید شناسایی کند.
ویژگی: این فرآیند بر شناسایی نمونههایی متمرکز است که ممکن است با کلاسهای جدید مرتبط باشند ولی به هیچوجه در مجموعه دادههای آموزش دیدهشده وجود نداشتهاند.
2. دادههای خارج از توزیع (OOD - Out-of-Distribution Data)
دادههای خارج از توزیع به نمونههایی اطلاق میشود که بهطور کلی از توزیع دادههایی که مدل روی آن آموزش دیده، متفاوت هستند. در این حالت، مدل با دادههایی روبهرو میشود که ویژگیهای آنها بهطور قابل توجهی از دادههای موجود در مجموعه آموزشی متفاوت است.
مثال: فرض کنید مدل شما بر اساس دادههای حیوانات خانگی مانند سگ و گربه آموزش دیده است. اگر تصویر یک ماشین به مدل داده شود، این تصویر بهعنوان دادهای خارج از توزیع شناسایی میشود چون مدل هیچگاه بر دادههایی با چنین ویژگیهایی آموزش ندیده است.
ویژگی: در اینجا مدل به دنبال تشخیص نمونههایی است که از نظر توزیع آماری با دادههای آموزشدیده متفاوت باشند، حتی اگر نمونههای جدید به دستههای جدید تعلق نداشته باشند.
3. شناسایی ناهنجاری (Anomaly Detection)
شناسایی ناهنجاری به فرآیند تشخیص نمونههایی اطلاق میشود که تفاوت قابل توجهی با سایر دادههای موجود دارند. این نوع تشخیص بهطور معمول برای شناسایی رفتارهای غیرطبیعی یا غیرمنتظره در دادهها مورد استفاده قرار میگیرد.
مثال: در یک سیستم مانیتورینگ، اگر مصرف پردازنده بهطور ناگهانی و غیرمنتظرهای افزایش یابد، این وضعیت بهعنوان یک ناهنجاری شناسایی میشود زیرا تفاوت زیادی با الگوهای عادی مصرف پردازنده دارد.
ویژگی: ناهنجاریها نمونههایی هستند که ویژگیهایشان بهطور قابل توجهی از دیگر نمونهها دور است و این امر میتواند بهعنوان علائم خرابی سیستم، تقلب یا مشکلات عملکردی مشاهده شود.
تفاوتها و مقایسه:
در سادهترین شکل، تفاوتهای این سه مفهوم بهطور خلاصه به این صورت است:
- شناسایی نوآوری: تمرکز بر کشف کلاسهای جدید که در دادههای آموزش موجود نبودهاند.
- دادههای خارج از توزیع (OOD): شناسایی نمونههایی که از توزیع دادههای آموزش متفاوت هستند، حتی اگر این نمونهها به کلاسهای جدید تعلق نداشته باشند.
- شناسایی ناهنجاری: شناسایی نمونههای غیرعادی که از نظر ویژگیها بهطور قابل توجهی از دیگر نمونهها متفاوتاند.
کاربردها:
- شناسایی نوآوری (Novelty Detection): این مفهوم بهطور ویژه در کاربردهایی مانند کشف کلاسهای جدید در دادههای پیچیده و در حال تغییر، یا زمانی که دادههای جدید وارد میشوند، کاربرد دارد.
- دادههای خارج از توزیع (OOD): این مفاهیم معمولاً در زمینههای امنیت مدل یا استفاده از مدلهای عمومی که ممکن است با دادههای خارج از حوزه خود مواجه شوند، کاربرد دارد.
- شناسایی ناهنجاری (Anomaly Detection): این مورد بهویژه در شناسایی تقلب، خرابی سیستمها یا تشخیص رفتار غیرعادی در سیستمهای پیچیده مانند شبکههای کامپیوتری و سیستمهای نظارتی کاربرد دارد.
به عنوان جمعبندی، این سه مفهوم با وجود شباهتهای اولیه، در اساس و کاربرد تفاوتهای مهمی دارند. شناسایی نوآوری بیشتر بر شناسایی کلاسهای جدید متمرکز است، در حالی که OOD به شناسایی دادههایی میپردازد که کاملاً خارج از توزیع دادههای آموزشدیده هستند، و شناسایی ناهنجاری به دنبال نمونههایی است که از الگوهای عادی دور هستند.
مصی کوهنورد، مدیر منابع انسانی دیجیکالا، اعلام کرد: مهاجرت با ۴۶ درصد و یافتن موقعیت شغلی بهتر با ۱۵ درصد، مهمترین دلایل خروج نیروهای دیجیکالا در سال ۱۴۰۳ بودهاند. این آمار نشان میدهد که نرخ مهاجرت نسبت به سال گذشته ۹ درصد افزایش و خروج به دلیل یافتن شغل بهتر ۲۰ درصد کاهش یافته است
وی با اشاره به نرخ خروج ۲۰ درصدی نیروی کار متخصص در سال گذشته، گفت: برای مدیریت این چالش، تصمیم گرفتیم با انجام نظرسنجیها و تحلیل دادهها، دلایل این مسئله را بررسی کنیم. نتایج نشان داد که ۳۷ درصد از خروجها به دلیل مهاجرت، ۳۵ درصد به دلیل یافتن شغل بهتر و مابقی به دلایل متفرقه بوده است. همچنین، ۴۰ درصد از خروجیها در رده سنی ۲۱ تا ۳۵ سال قرار داشتند که بخش عمدهای از آنها به دلیل مهاجرت شرکت را ترک کردند
وی توضیح داد: نتایج نظرسنجی به ما کمک کرد تا دغدغهها و نیازهای نیروهای خود را بهتر بشناسیم. مشکلاتی نظیر دستمزد پایین، حجم زیاد کار، احساس دیده نشدن و عدم شفافیت در سلسلهمراتب از جمله مهمترین چالشهای مطرحشده بودند. در نتیجه، فرهنگ کاریمان را تغییر دادیم و توانستیم نرخ خروج نیروها را ۷ درصد کاهش دهیم
Source
@Ai_Events
وی با اشاره به نرخ خروج ۲۰ درصدی نیروی کار متخصص در سال گذشته، گفت: برای مدیریت این چالش، تصمیم گرفتیم با انجام نظرسنجیها و تحلیل دادهها، دلایل این مسئله را بررسی کنیم. نتایج نشان داد که ۳۷ درصد از خروجها به دلیل مهاجرت، ۳۵ درصد به دلیل یافتن شغل بهتر و مابقی به دلایل متفرقه بوده است. همچنین، ۴۰ درصد از خروجیها در رده سنی ۲۱ تا ۳۵ سال قرار داشتند که بخش عمدهای از آنها به دلیل مهاجرت شرکت را ترک کردند
وی توضیح داد: نتایج نظرسنجی به ما کمک کرد تا دغدغهها و نیازهای نیروهای خود را بهتر بشناسیم. مشکلاتی نظیر دستمزد پایین، حجم زیاد کار، احساس دیده نشدن و عدم شفافیت در سلسلهمراتب از جمله مهمترین چالشهای مطرحشده بودند. در نتیجه، فرهنگ کاریمان را تغییر دادیم و توانستیم نرخ خروج نیروها را ۷ درصد کاهش دهیم
Source
@Ai_Events
Ai Events️
. دکتر غضنفری، رئیس صندوق توسعه ملی: کل دارایی صندوق توسعه ملی، ۱۵۰ میلیارد دلار بود که ۱۰۰ میلیارد دلار رو دولتهای مختلف برداشت کردند و ۴۰ میلیارد دلار، تسهیلات به صنایع پتروشیمی، نیروگاهها و ... داده شده که اونها هم به دلیل قیمتگذاری دستوری قادر به…
This media is not supported in your browser
VIEW IN TELEGRAM
دکتر غضنفری، رئیس صندوق توسعه ملی: صندوق توسعه ملی مشارکت خود را در حوزههای نفت و گاز، هوش مصنوعی و انرژیهای تجدیدپذیر افزایش داده است.
پینوشت: حرکت بسیار پسندیده و مثبتی هست، اما با توجه به تحریمها در واردات سخت افزار و همچنین بروکراسیهای پیچیده (و گاها سفارشی) دسترسی به چنین منابع مالی، انتظار نتیجه چندانی از این حرکت نداریم. اما به خاطر میسپریم که این وظیفه ما به عنوان کارشناس هست که این برنامهها، بودجههایی که تخصیص داده میشه و طرحهایی که مورد پذیرش واقع میشه رو زیر ذرهبین بگیریم و با استفاده از هر رسانهای، مطلوب رو خواهان باشیم.
همچنین از قبل میدونیم که بودجهی صندوق توسعه، از منابعی که متعلق به تکتک ما هست تامین میشه.
@Ai_Events
پینوشت: حرکت بسیار پسندیده و مثبتی هست، اما با توجه به تحریمها در واردات سخت افزار و همچنین بروکراسیهای پیچیده (و گاها سفارشی) دسترسی به چنین منابع مالی، انتظار نتیجه چندانی از این حرکت نداریم. اما به خاطر میسپریم که این وظیفه ما به عنوان کارشناس هست که این برنامهها، بودجههایی که تخصیص داده میشه و طرحهایی که مورد پذیرش واقع میشه رو زیر ذرهبین بگیریم و با استفاده از هر رسانهای، مطلوب رو خواهان باشیم.
همچنین از قبل میدونیم که بودجهی صندوق توسعه، از منابعی که متعلق به تکتک ما هست تامین میشه.
@Ai_Events
کارگاه آنلاین هوش مصنوعی کاربردی
این کارگاه، برای عموم، علاقهمندان و متخصصان به مباحث هوش مصنوعی و خصوصا
مدیران شرکتها / سازمانها / ارگانها و همچنین برنامهنویسان گرامی مفید
خواهد بود.
لینک ثبتنام در کارگاه آنلاین:
https://evnd.co/d20rX
@Ai_Events
این کارگاه، برای عموم، علاقهمندان و متخصصان به مباحث هوش مصنوعی و خصوصا
مدیران شرکتها / سازمانها / ارگانها و همچنین برنامهنویسان گرامی مفید
خواهد بود.
لینک ثبتنام در کارگاه آنلاین:
https://evnd.co/d20rX
@Ai_Events
📣 TA Application Form
🤖 Deep Learning
🧑🏻🏫 Dr. Fatemeh Seyyedsalehi
🧑💻 Computer science group at the department of mathematics, Sharif University
⏰ Deadline: January 26th
https://forms.gle/z7betBT2N2ACCrir8
توجه: این موقعیت مختص دانشجویان شریف نمیباشد و افراد دیگر خارج از دانشگاه هم میتوانند استفاده کنند.
@Ai_Events
🤖 Deep Learning
🧑🏻🏫 Dr. Fatemeh Seyyedsalehi
🧑💻 Computer science group at the department of mathematics, Sharif University
⏰ Deadline: January 26th
https://forms.gle/z7betBT2N2ACCrir8
توجه: این موقعیت مختص دانشجویان شریف نمیباشد و افراد دیگر خارج از دانشگاه هم میتوانند استفاده کنند.
@Ai_Events
دومین رویداد از سلسله رویدادهای "هوش مصنوعی در آموزش عالی" با موضوع:
تولید محتوا در عصر هوش مصنوعی: با رویکرد تنظیم برنامه درسی
👤 Supriya Kulkarni, Founder of The Ethics Company, Indonesia
👤Trinidad Balart, AI on Education Developer, USA
👤 Amir Shahraini, AI Policy Researcher, Iran (Moderator)
📅 چهارشنبه، ۱۹ دی ماه ۱۴۰۳ ساعت ۱۷ الی ۱۸:۳۰
لینک ثبتنام در رويداد
افزودن به تقویم گوگل
لینک پخش زنده رویداد
(هنگام ورود، گزینه میهمان را انتخاب کنید.)
❓ پشتیبانی
@spri_sharif
@Ai_Events
تولید محتوا در عصر هوش مصنوعی: با رویکرد تنظیم برنامه درسی
👤 Supriya Kulkarni, Founder of The Ethics Company, Indonesia
👤Trinidad Balart, AI on Education Developer, USA
👤 Amir Shahraini, AI Policy Researcher, Iran (Moderator)
📅 چهارشنبه، ۱۹ دی ماه ۱۴۰۳ ساعت ۱۷ الی ۱۸:۳۰
لینک ثبتنام در رويداد
افزودن به تقویم گوگل
لینک پخش زنده رویداد
(هنگام ورود، گزینه میهمان را انتخاب کنید.)
❓ پشتیبانی
@spri_sharif
@Ai_Events