پروژه 500 میلیارد دلاری هوش مصنوعی
پروژه استارگیت OpenAI با هدف ایجاد یک زیرساخت بزرگ هوش مصنوعی، با دسترسی انحصاری OpenAI، طراحی شده است. این طرح مستلزم بیش از 500 میلیارد دلار بودجه در طول چهار ساله که با 100 میلیارد دلار شروع میشه (یکی از بزرگترین سرمایهگذاریهای زیرساختی در تاریخ آمریکا) که حتی از پروژه منهتن و برنامه آپولو (در صورت تعدیل تورم) پیشی میگیره!!!
انتظار میره که Stargate بیش از 100000 شغل ایجاد کنه، با تمرکز روی برنامههای پزشکی مثل تحقیق در مورد داروهای سرطان، تشخیص زودهنگام بیماری و...
شرکای کلیدی این پروژه عبارتند از Softbank، Nvidia، Oracle، MGX (امارات متحده عربی)، مایکروسافت و Arm.
قرار است ساخت ده مرکز داده در تگزاس، با برنامه ریزی برای بیست مرکز داده در سراسر آمریکا، که همه به هم مرتبط هستند، آغاز شود.
فقط برای اینکه متوجه بشید این پروژه چقدر بزرگه:
پروژه منهتن (دهه 1940): 30 میلیارد دلار به پول امروز
برنامه آپولو (دهه 1960 تا 70): 257 میلیارد دلار به پول امروز
پروژه StarGate: حدود 500 میلیارد دلار در مدت تنها چهار سال
@Ai_Events
پروژه استارگیت OpenAI با هدف ایجاد یک زیرساخت بزرگ هوش مصنوعی، با دسترسی انحصاری OpenAI، طراحی شده است. این طرح مستلزم بیش از 500 میلیارد دلار بودجه در طول چهار ساله که با 100 میلیارد دلار شروع میشه (یکی از بزرگترین سرمایهگذاریهای زیرساختی در تاریخ آمریکا) که حتی از پروژه منهتن و برنامه آپولو (در صورت تعدیل تورم) پیشی میگیره!!!
انتظار میره که Stargate بیش از 100000 شغل ایجاد کنه، با تمرکز روی برنامههای پزشکی مثل تحقیق در مورد داروهای سرطان، تشخیص زودهنگام بیماری و...
شرکای کلیدی این پروژه عبارتند از Softbank، Nvidia، Oracle، MGX (امارات متحده عربی)، مایکروسافت و Arm.
قرار است ساخت ده مرکز داده در تگزاس، با برنامه ریزی برای بیست مرکز داده در سراسر آمریکا، که همه به هم مرتبط هستند، آغاز شود.
فقط برای اینکه متوجه بشید این پروژه چقدر بزرگه:
پروژه منهتن (دهه 1940): 30 میلیارد دلار به پول امروز
برنامه آپولو (دهه 1960 تا 70): 257 میلیارد دلار به پول امروز
پروژه StarGate: حدود 500 میلیارد دلار در مدت تنها چهار سال
@Ai_Events
داستان غول نوظهور چینی هوش مصنوعی Deepseek
شرکت deepseek که امروز همهمون از مدل رایگان بیمحدودیت deepseek v3 به وجود اومدیم و الان هم مدل متن باز رایگان R1 رو به عنوان رقیب برای o1 داده، چطوری شکل گرفته؟
این شرکت بدون هیچ سرمایهگذاری خطرپذیر، مدلی متنباز تولید کرد که با غولهایی مانند OpenAI و Anthropic رقابت میکند. مدلی که با یکدهم هزینه آموزش و ۲۰ تا ۵۰ برابر ارزانتر در استنتاج، به مرزهای جدیدی در هوش مصنوعی دست یافته است.
در سال ۲۰۰۷، سه مهندس به نامهای Xu Jin، Zheng Dawei و Liang Wenfeng (مدیرعامل فعلی) در دانشگاه Zhejiang با هم آشنا شدند و با هدف ساخت یک صندوق کمّی (Quant) که با هوش مصنوعی پیشرفته کار کند، دور هم جمع شدند. از آن زمان تا امروز یک استراتژی در جذب نیرو انسانی داشتند، به جای استخدام افراد باتجربه، آنها روی استعدادهای جوان و کنجکاو سرمایهگذاری کردند. مدیر مدیر عامل deepseek l میگه: «ما بیشتر نقشهای فنی را به فارغالتحصیلان جدید یا افرادی با ۱ تا ۲ سال تجربه سپردیم.».
این تیم به مدت ۸ سال بهطور خاموش روی ایدههای مختلف معاملات الگوریتمی کار کردند تا اینکه در سال ۲۰۱۵ شرکت High-Flyer را تأسیس کردند. فرهنگ استخدام و نوآوری آنها به خوبی جواب داد. تا سال ۲۰۲۱، آنها به موفقیتهای چشمگیری دست یافته بودند:
۱۴۰ میلیون دلار سرمایهگذاری و ساخت یک پلتفرم بزرگ هوش مصنوعی برای معاملات.
مالکیت ۱۰,۰۰۰ کارت گرافیک NVIDIA A100.
تبدیل شدن به یکی از ۴ صندوق کمّی برتر با ۱۵ میلیارد دلار دارایی تحت مدیریت (AUM).
اما سپس همه چیز فروپاشید. سال ۲۰۲۲ موفقیت High-Flyer به نقطه ضعف آن تبدیل شد. آنها خیلی بزرگ و سریع رشد کرده بودند و شروع به از دست دادن میلیاردها دلار کردند، طی چند فصل متوالی روی سرمایههای تحت مدیریتشون ضرر دادند و از شاخص بازار بورس چین عقب ماندند.
دولت چین در پی کندی اقتصادی، بحران مسکن و کاهش شاخص بورس، شروع به محدود کردن صنعت معاملات کمّی کرد. شاخص CSI300 (شاخص سهام برتر چین) به پایینترین حد خود رسید و معاملهگران فرکانس بالا را مقصر اصلی این فروپاشی دانستند. High-Flyer با خطر انقراض مواجه شد.
در سال ۲۰۲۳ آنها تغییر جهت دادند. DeepSeek، یک آزمایشگاه هوش مصنوعی، با استفاده از استعدادهای موجود و ۱۰,۰۰۰ کارت گرافیک خود تأسیس کردند. بدون هیچ سرمایهگذاری خطرپذیر. آنها همه چیز را روی این شرط بستند.
آنها همان فلسفه استخدام خود را حفظ کردند: استخدام «فارغالتحصیلان نخبه» جای محققان باتجربه هوش مصنوعی.
مدیر عامل deepseek میگه: «هیچ جادوگری وجود ندارد. ما بیشتر فارغالتحصیلان جدید از دانشگاههای برتر، دانشجویان دکتری در سالهای چهارم یا پنجم و برخی جوانانی که چند سال پیش فارغالتحصیل شدهاند را استخدام میکنیم.»
شرکت DeepSeek در اوایل سال ۲۰۲۴ با معرفی DeepSeek v2 را ارائه کردند.
تا سپتامبر، آنها ابتدا مقالهی R1-lite-preview را به عنوان اولین مدلی که با مدل استدلالی o1 OpenAI رقابت میکرد، منتشر کردند، . این مدل با استفاده از یک تکنیک جدید یادگیری تقویتی (RL) که از محاسبات زمان استنتاج استفاده میکرد، از همه رقبا (متنباز یا اختصاصی) پیشی گرفت.
در کریسمس، آنها DeepSeek v3 ارائه کردند که با تنها ۶ میلیون دلار هزینه آموزش، با ChatGPT-4o و Claude 3.5 Sonnet رقابت کرد.
هزینههای API که ۲۰ تا ۵۰ برابر ارزانتر از رقبا است.
این هفته، آنها اولین مدل استدلالی کاملاً متنباز را منتشر کردند که با OpenAI o1 برابری میکرد. آنها یافتههای خود را بهصورت عمومی به اشتراک گذاشتند و فاش کردند که این مدل را تنها از طریق یادگیری تقویتی (RL) و بدون نیاز به تنظیم دقیق نظارتشده یا مدلسازی پاداش آموزش دادهاند.
و هزینههای API هنوز ۲۰ تا ۵۰ برابر ارزانتر از رقبا هستند:
مدل DeepSeek R1 حدود ۰.۱۴ تا ۰.۵۵ دلار برای هر ۱ میلیون توکن ورودی، ۲.۱۹ دلار برای هر ۱ میلیون توکن خروجی.
مدل OpenAI o1 حدود ۷.۵۰ تا ۱۵ دلار برای هر ۱ میلیون توکن ورودی، ۶۰ دلار برای هر ۱ میلیون توکن خروجی.
Source
@Ai_Events
شرکت deepseek که امروز همهمون از مدل رایگان بیمحدودیت deepseek v3 به وجود اومدیم و الان هم مدل متن باز رایگان R1 رو به عنوان رقیب برای o1 داده، چطوری شکل گرفته؟
این شرکت بدون هیچ سرمایهگذاری خطرپذیر، مدلی متنباز تولید کرد که با غولهایی مانند OpenAI و Anthropic رقابت میکند. مدلی که با یکدهم هزینه آموزش و ۲۰ تا ۵۰ برابر ارزانتر در استنتاج، به مرزهای جدیدی در هوش مصنوعی دست یافته است.
در سال ۲۰۰۷، سه مهندس به نامهای Xu Jin، Zheng Dawei و Liang Wenfeng (مدیرعامل فعلی) در دانشگاه Zhejiang با هم آشنا شدند و با هدف ساخت یک صندوق کمّی (Quant) که با هوش مصنوعی پیشرفته کار کند، دور هم جمع شدند. از آن زمان تا امروز یک استراتژی در جذب نیرو انسانی داشتند، به جای استخدام افراد باتجربه، آنها روی استعدادهای جوان و کنجکاو سرمایهگذاری کردند. مدیر مدیر عامل deepseek l میگه: «ما بیشتر نقشهای فنی را به فارغالتحصیلان جدید یا افرادی با ۱ تا ۲ سال تجربه سپردیم.».
این تیم به مدت ۸ سال بهطور خاموش روی ایدههای مختلف معاملات الگوریتمی کار کردند تا اینکه در سال ۲۰۱۵ شرکت High-Flyer را تأسیس کردند. فرهنگ استخدام و نوآوری آنها به خوبی جواب داد. تا سال ۲۰۲۱، آنها به موفقیتهای چشمگیری دست یافته بودند:
۱۴۰ میلیون دلار سرمایهگذاری و ساخت یک پلتفرم بزرگ هوش مصنوعی برای معاملات.
مالکیت ۱۰,۰۰۰ کارت گرافیک NVIDIA A100.
تبدیل شدن به یکی از ۴ صندوق کمّی برتر با ۱۵ میلیارد دلار دارایی تحت مدیریت (AUM).
اما سپس همه چیز فروپاشید. سال ۲۰۲۲ موفقیت High-Flyer به نقطه ضعف آن تبدیل شد. آنها خیلی بزرگ و سریع رشد کرده بودند و شروع به از دست دادن میلیاردها دلار کردند، طی چند فصل متوالی روی سرمایههای تحت مدیریتشون ضرر دادند و از شاخص بازار بورس چین عقب ماندند.
دولت چین در پی کندی اقتصادی، بحران مسکن و کاهش شاخص بورس، شروع به محدود کردن صنعت معاملات کمّی کرد. شاخص CSI300 (شاخص سهام برتر چین) به پایینترین حد خود رسید و معاملهگران فرکانس بالا را مقصر اصلی این فروپاشی دانستند. High-Flyer با خطر انقراض مواجه شد.
در سال ۲۰۲۳ آنها تغییر جهت دادند. DeepSeek، یک آزمایشگاه هوش مصنوعی، با استفاده از استعدادهای موجود و ۱۰,۰۰۰ کارت گرافیک خود تأسیس کردند. بدون هیچ سرمایهگذاری خطرپذیر. آنها همه چیز را روی این شرط بستند.
آنها همان فلسفه استخدام خود را حفظ کردند: استخدام «فارغالتحصیلان نخبه» جای محققان باتجربه هوش مصنوعی.
مدیر عامل deepseek میگه: «هیچ جادوگری وجود ندارد. ما بیشتر فارغالتحصیلان جدید از دانشگاههای برتر، دانشجویان دکتری در سالهای چهارم یا پنجم و برخی جوانانی که چند سال پیش فارغالتحصیل شدهاند را استخدام میکنیم.»
شرکت DeepSeek در اوایل سال ۲۰۲۴ با معرفی DeepSeek v2 را ارائه کردند.
تا سپتامبر، آنها ابتدا مقالهی R1-lite-preview را به عنوان اولین مدلی که با مدل استدلالی o1 OpenAI رقابت میکرد، منتشر کردند، . این مدل با استفاده از یک تکنیک جدید یادگیری تقویتی (RL) که از محاسبات زمان استنتاج استفاده میکرد، از همه رقبا (متنباز یا اختصاصی) پیشی گرفت.
در کریسمس، آنها DeepSeek v3 ارائه کردند که با تنها ۶ میلیون دلار هزینه آموزش، با ChatGPT-4o و Claude 3.5 Sonnet رقابت کرد.
هزینههای API که ۲۰ تا ۵۰ برابر ارزانتر از رقبا است.
این هفته، آنها اولین مدل استدلالی کاملاً متنباز را منتشر کردند که با OpenAI o1 برابری میکرد. آنها یافتههای خود را بهصورت عمومی به اشتراک گذاشتند و فاش کردند که این مدل را تنها از طریق یادگیری تقویتی (RL) و بدون نیاز به تنظیم دقیق نظارتشده یا مدلسازی پاداش آموزش دادهاند.
و هزینههای API هنوز ۲۰ تا ۵۰ برابر ارزانتر از رقبا هستند:
مدل DeepSeek R1 حدود ۰.۱۴ تا ۰.۵۵ دلار برای هر ۱ میلیون توکن ورودی، ۲.۱۹ دلار برای هر ۱ میلیون توکن خروجی.
مدل OpenAI o1 حدود ۷.۵۰ تا ۱۵ دلار برای هر ۱ میلیون توکن ورودی، ۶۰ دلار برای هر ۱ میلیون توکن خروجی.
Source
@Ai_Events
⭕ شرکت OpenAI از ابزار جدید Operator رونمایی کرد: تحولی در انجام کارهای اینترنتی
شرکت OpenAI، از ابزار جدید خود به نام Operator رونمایی کرده است که میتواند بهطور خودکار وظایف مختلف آنلاین را انجام دهد.
این ابزار با استفاده از مرورگر داخلی خود، قادر است صفحات وب را مشاهده کرده و با آنها تعامل کند. از جمله قابلیتهای آن میتوان به تایپ، کلیک و اسکرول در صفحات وب اشاره کرد.
همچنین Operator از هوش مصنوعی پیشرفته استفاده میکند و به کاربران این امکان را میدهد که بدون نیاز به انجام اقدامات دستی، کارهای اینترنتی خود را انجام دهند.
این ابزار ابتدا برای مشترکان نسخه پرو ChatGPT در آمریکا در دسترس خواهد بود و OpenAI قصد دارد آن را به سایر کاربران نیز گسترش دهد.
تو این ویدئو میتونید توضیحات و نحوه کارکردش رو با حضور آقای سم آلتمن ببینید:
https://youtu.be/CSE77wAdDLg
@Ai_Events
شرکت OpenAI، از ابزار جدید خود به نام Operator رونمایی کرده است که میتواند بهطور خودکار وظایف مختلف آنلاین را انجام دهد.
این ابزار با استفاده از مرورگر داخلی خود، قادر است صفحات وب را مشاهده کرده و با آنها تعامل کند. از جمله قابلیتهای آن میتوان به تایپ، کلیک و اسکرول در صفحات وب اشاره کرد.
همچنین Operator از هوش مصنوعی پیشرفته استفاده میکند و به کاربران این امکان را میدهد که بدون نیاز به انجام اقدامات دستی، کارهای اینترنتی خود را انجام دهند.
این ابزار ابتدا برای مشترکان نسخه پرو ChatGPT در آمریکا در دسترس خواهد بود و OpenAI قصد دارد آن را به سایر کاربران نیز گسترش دهد.
تو این ویدئو میتونید توضیحات و نحوه کارکردش رو با حضور آقای سم آلتمن ببینید:
https://youtu.be/CSE77wAdDLg
@Ai_Events
سخنرانی تخصصی دانشکده مهندسی کامپیوتر با همکاری انجمن علمی برگزار میشود:
هوش مصنوعی و استنتاج کاتورهای💻
توسط دکتر سیاوش ارجمند بیگدلی، دانشیار دانشگاه صنعتی دانمارک
زمان: شنبه ۶ بهمن، ساعت ۱۲:۳۰ الی ۱۳:۳۰
📍 مکان: آمفی تئاتر دانشکده مهندسی کامپیوتر دانشگاه امیرکبیر
@Ai_Events
هوش مصنوعی و استنتاج کاتورهای💻
توسط دکتر سیاوش ارجمند بیگدلی، دانشیار دانشگاه صنعتی دانمارک
زمان: شنبه ۶ بهمن، ساعت ۱۲:۳۰ الی ۱۳:۳۰
📍 مکان: آمفی تئاتر دانشکده مهندسی کامپیوتر دانشگاه امیرکبیر
@Ai_Events
انتشار کد، پارامترها و مقالهی مدل هوشمصنوعی DeepSeek-R1 تکاندهنده است. ارزیابیهای کمی، رقابت شانهبهشانهی آن با ChatGPT o1 را نشان میدهد. طبق تجربهی شخصی، این مدل در مواردی حتی بهتر از o1-pro عمل میکند. مهمتر از همه: رایگان است.
دکتر علی شریفزارچی
@Ai_Events
دکتر علی شریفزارچی
@Ai_Events
دکتر فرهاد نیلی:
در کنفرانس مدیریت نوآوری و فناوری، با عنوان «تجاریسازی هوش مصنوعی» در مورد استراتژیهای درآمدی هوش مصنوعی صحبت کردم.
لینک به ویدیو
لینک به پست
@Ai_Events
در کنفرانس مدیریت نوآوری و فناوری، با عنوان «تجاریسازی هوش مصنوعی» در مورد استراتژیهای درآمدی هوش مصنوعی صحبت کردم.
لینک به ویدیو
لینک به پست
@Ai_Events
Compositional Learning Journal Club
This Week's Presentation:
Title: Can We Generate Images with CoT? Let's Verify and Reinforce Image Generation Step by Step
Presenter: Amir Kasaei
Abstract:
This paper explores the use of Chain-of-Thought (CoT) reasoning to improve autoregressive image generation, an area not widely studied. The authors propose three techniques: scaling computation for verification, aligning preferences with Direct Preference Optimization (DPO), and integrating these methods for enhanced performance. They introduce two new reward models, PARM and PARM++, which adaptively assess and correct image generations. Their approach improves the Show-o model, achieving a +24% gain on the GenEval benchmark and surpassing Stable Diffusion 3 by +15%.
Papers: Can We Generate Images with CoT? Let's Verify and Reinforce Image Generation Step by Step
Session Details:
- Date: Sunday
- Time: 5:30 - 6:30 PM
- Location: Online at vc.sharif.edu/ch/rohban
@Ai_Events
This Week's Presentation:
Title: Can We Generate Images with CoT? Let's Verify and Reinforce Image Generation Step by Step
Presenter: Amir Kasaei
Abstract:
This paper explores the use of Chain-of-Thought (CoT) reasoning to improve autoregressive image generation, an area not widely studied. The authors propose three techniques: scaling computation for verification, aligning preferences with Direct Preference Optimization (DPO), and integrating these methods for enhanced performance. They introduce two new reward models, PARM and PARM++, which adaptively assess and correct image generations. Their approach improves the Show-o model, achieving a +24% gain on the GenEval benchmark and surpassing Stable Diffusion 3 by +15%.
Papers: Can We Generate Images with CoT? Let's Verify and Reinforce Image Generation Step by Step
Session Details:
- Date: Sunday
- Time: 5:30 - 6:30 PM
- Location: Online at vc.sharif.edu/ch/rohban
@Ai_Events
سقوط سنگین سهام Nvidia!
سهام شرکت انویدیا امروز با کاهش ۱۳ درصدی مواجه شده و بیش از ۵۰۰ میلیارد دلار از ارزش بازار این شرکت از بین رفت!
دلیلش هم اینه که میگن دیپسیک تونسته با تعداد بسیار کمتری پردازنده گرافیکی به نتایج خوبی برسه، پس تقاضای پردازنده گرافیکی کم خواهد شد.
#Nvidia #هوش_مصنوعی #بازار_سهام
#Nvidia #هوش_مصنوعی #بازار_سهام #تکنولوژی #کارت_گرافیک #اقتصاد_دیجیتال #فناوری_اطلاعات
@Ai_Events
سهام شرکت انویدیا امروز با کاهش ۱۳ درصدی مواجه شده و بیش از ۵۰۰ میلیارد دلار از ارزش بازار این شرکت از بین رفت!
دلیلش هم اینه که میگن دیپسیک تونسته با تعداد بسیار کمتری پردازنده گرافیکی به نتایج خوبی برسه، پس تقاضای پردازنده گرافیکی کم خواهد شد.
#Nvidia #هوش_مصنوعی #بازار_سهام
#Nvidia #هوش_مصنوعی #بازار_سهام #تکنولوژی #کارت_گرافیک #اقتصاد_دیجیتال #فناوری_اطلاعات
@Ai_Events
Ai Events️
سقوط سنگین سهام Nvidia! سهام شرکت انویدیا امروز با کاهش ۱۳ درصدی مواجه شده و بیش از ۵۰۰ میلیارد دلار از ارزش بازار این شرکت از بین رفت! دلیلش هم اینه که میگن دیپسیک تونسته با تعداد بسیار کمتری پردازنده گرافیکی به نتایج خوبی برسه، پس تقاضای پردازنده…
فقط همین ۵۰۰ میلیاردی که انویدیا از دست داده، تقریبا سه برابر کل بازار سرمایه ایرانه!!!
کاهش 1 تریلیون دلاری بورس آمریکا به دلیل سقوط سهام فناوری!
@Ai_Events
کاهش 1 تریلیون دلاری بورس آمریکا به دلیل سقوط سهام فناوری!
@Ai_Events
Ai Events️
فقط همین ۵۰۰ میلیاردی که انویدیا از دست داده، تقریبا سه برابر کل بازار سرمایه ایرانه!!! کاهش 1 تریلیون دلاری بورس آمریکا به دلیل سقوط سهام فناوری! @Ai_Events
You dont necessarly need Tanks and missles to start a war. Sometimes it’s just an AI model that cost 5m to train.
@Ai_Events
@Ai_Events
یوتیوب یه باگ جدید داره که مثلا تو ثانیه 59 یهو دیگه هیچی دانلود نمیکنه و بقیه ویدیو رو نشونتون نمیده.
برای حل موقت این مشکل، وقتی ویدیوتون متوقف شد، روی صفحه کلیک راست کنید و گزینهی Copy videoo URL at current time رو بزنید، این گزینه آدرس همین ویدیو رو که داخلش ثانیهای که در حال مشاهدهش هستید رو بهتون میده. آدرس رو تو نوار جستجوی مرورگرتون بچسبونید و دو ثانیه به عددی که آدرس نمایش میده اضافه کنید و ادامه ویدیو رو مشاهده کنید.
@Ai_Events
برای حل موقت این مشکل، وقتی ویدیوتون متوقف شد، روی صفحه کلیک راست کنید و گزینهی Copy videoo URL at current time رو بزنید، این گزینه آدرس همین ویدیو رو که داخلش ثانیهای که در حال مشاهدهش هستید رو بهتون میده. آدرس رو تو نوار جستجوی مرورگرتون بچسبونید و دو ثانیه به عددی که آدرس نمایش میده اضافه کنید و ادامه ویدیو رو مشاهده کنید.
@Ai_Events
مدل DeepSeek ثابت کرد که Palantir درست میگفت!
مدتی پیش، شرکت Palantir اعلام کرده بود که ارزش هوش مصنوعی در مدلها باقی نمیمونه، بلکه به سمت برنامهها، گردش کار و امنیت منتقل میشه.
تو ماه سپتامبر، آقای الکس کارپ، مدیرعامل شرکت Palantir گفته بود که:
"مردم به اشتباه فکر میکنند که تمام ارزش در مدلهای زبانی بزرگ (LLM) است.
مدلهای هوش مصنوعی باید پردازش شوند."
به نظر من پیشرفت DeepSeek در کاهش هزینههای مدلسازی، دیدگاه Palantir را تأیید میکند که ارزش اصلی در لایه کاربردهای عملیاتی و جریانهای کاری نهفته است.
پرواضحه که با پیشرفت فناوری، مدلهای هوش مصنوعی در دسترس و ارزانتر میشن. پس تفاوتهای رقابتی دیگه تو خود مدلها نیست، بلکه تو نحوهی استفاده ازشون و کاربردهای واقعی خواهد بود. مثل کاربردی که تو این پست مطرح شده، سا استفاده از مدلها تو حوزهی خدمات مشتری، آموزش، سلامت و ...
@Ai_Events
مدتی پیش، شرکت Palantir اعلام کرده بود که ارزش هوش مصنوعی در مدلها باقی نمیمونه، بلکه به سمت برنامهها، گردش کار و امنیت منتقل میشه.
تو ماه سپتامبر، آقای الکس کارپ، مدیرعامل شرکت Palantir گفته بود که:
"مردم به اشتباه فکر میکنند که تمام ارزش در مدلهای زبانی بزرگ (LLM) است.
مدلهای هوش مصنوعی باید پردازش شوند."
به نظر من پیشرفت DeepSeek در کاهش هزینههای مدلسازی، دیدگاه Palantir را تأیید میکند که ارزش اصلی در لایه کاربردهای عملیاتی و جریانهای کاری نهفته است.
پرواضحه که با پیشرفت فناوری، مدلهای هوش مصنوعی در دسترس و ارزانتر میشن. پس تفاوتهای رقابتی دیگه تو خود مدلها نیست، بلکه تو نحوهی استفاده ازشون و کاربردهای واقعی خواهد بود. مثل کاربردی که تو این پست مطرح شده، سا استفاده از مدلها تو حوزهی خدمات مشتری، آموزش، سلامت و ...
@Ai_Events
Compositional Learning Journal Club
Join us this week for an in-depth discussion on Compositional Learning in the context of cutting-edge text-to-image generative models. We will explore recent breakthroughs and challenges, focusing on how these models handle compositional tasks and where improvements can be made.
This Week's Presentation:
🔹 Title: Correcting Diffusion Generation through Resampling
🔸 Presenter: Ali Aghayari
🌀 Abstract:
This paper addresses distributional discrepancies in diffusion models, which cause missing objects in text-to-image generation and reduced image quality. Existing methods overlook this root issue, leading to
suboptimal results. The authors propose a particle filtering framework that uses real images and a pre-trained object detector to measure and correct these discrepancies through resampling. Their approach improves object occurrence by 5% and FID by 1.0 on MS-COCO, outperforming previous methods in generating more accurate and higher-quality images.
📄 Papers: Correcting Diffusion Generation through Resampling
Session Details:
- 📅 Date: Tuesday
- 🕒 Time: 5:30 - 6:30 PM
- 🌐 Location: Online at vc.sharif.edu/ch/rohban
@Ai_Events
Join us this week for an in-depth discussion on Compositional Learning in the context of cutting-edge text-to-image generative models. We will explore recent breakthroughs and challenges, focusing on how these models handle compositional tasks and where improvements can be made.
This Week's Presentation:
🔹 Title: Correcting Diffusion Generation through Resampling
🔸 Presenter: Ali Aghayari
🌀 Abstract:
This paper addresses distributional discrepancies in diffusion models, which cause missing objects in text-to-image generation and reduced image quality. Existing methods overlook this root issue, leading to
suboptimal results. The authors propose a particle filtering framework that uses real images and a pre-trained object detector to measure and correct these discrepancies through resampling. Their approach improves object occurrence by 5% and FID by 1.0 on MS-COCO, outperforming previous methods in generating more accurate and higher-quality images.
📄 Papers: Correcting Diffusion Generation through Resampling
Session Details:
- 📅 Date: Tuesday
- 🕒 Time: 5:30 - 6:30 PM
- 🌐 Location: Online at vc.sharif.edu/ch/rohban
@Ai_Events
Andrej Karpathy released today a new course focused on LLM, such as chatGPT architecture. This three and half hour course dives into the foundation topics such as working and processing text, language model architecture, and dive into applications of foundation models such as Llama 3.1, DeepSeek-R1, etc.
https://www.youtube.com/watch?v=7xTGNNLPyMI
@Ai_Events
https://www.youtube.com/watch?v=7xTGNNLPyMI
@Ai_Events
ارائهی دکتر مهدیه سلیمانی (استاد گروه هوش مصنوعی دانشگاه شریف) در مورد مقاله DeepSeek R1 و تفاوت رویکرد آن در استفاده از RL برای جستجو
مشاهده در یوتیوب
مشاهده در آپارات
برای اطلاع از رویدادهای هوش مصنوعی، به کانال زیر بپیوندید:
https://www.tg-me.com/AI_Events
@Ai_Events
مشاهده در یوتیوب
مشاهده در آپارات
برای اطلاع از رویدادهای هوش مصنوعی، به کانال زیر بپیوندید:
https://www.tg-me.com/AI_Events
@Ai_Events
Join Richard Sutton’s Talk at Sharif University of Technology
Title: The Increasing Role of Sensorimotor Experience in Artificial Intelligence
Speaker: Rich Sutton (Keen Technologies, University of Alberta, OpenMind Research Institute)
Date: Wednesday
Time: 8 PM Iran Time
Sign Up Here: https://forms.gle/q1M7qErWvydFxR9m6
@Ai_Events
Title: The Increasing Role of Sensorimotor Experience in Artificial Intelligence
Speaker: Rich Sutton (Keen Technologies, University of Alberta, OpenMind Research Institute)
Date: Wednesday
Time: 8 PM Iran Time
Sign Up Here: https://forms.gle/q1M7qErWvydFxR9m6
@Ai_Events
Ai Events️
حقوق یک مهندس هوشمصنوعی میان-رده (mid-level) در سال 1403 چقدره؟ اواخر هر سال معمولا مذاکرات بین کارمند و کارفرما سر موضوع میزان افزایش حقوق و دستمزد شکل میگیره. تو چند سال اخیر با جهشهای متوالی قیمت ارز و در پی اون افزایش تورم و گرانی کالا و خدمات،…
Please open Telegram to view this post
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
ایلان ماسک نقش کلیدی در ایجاد OpenAI ایفا کرد و حتی نام "OpenAI" را پیشنهاد داد تا نشاندهنده تعهد این شرکت به متنباز (open source) بودن باشد.
اما سام آلتمن این شرکت غیرانتفاعی و متنباز را به یک شرکت سودمحور و با کد بسته (closed-source) تبدیل کرد.
@Ai_Events
اما سام آلتمن این شرکت غیرانتفاعی و متنباز را به یک شرکت سودمحور و با کد بسته (closed-source) تبدیل کرد.
@Ai_Events