Telegram Web Link
پروژه 500 میلیارد دلاری هوش مصنوعی

پروژه استارگیت OpenAI با هدف ایجاد یک زیرساخت بزرگ هوش مصنوعی، با دسترسی انحصاری OpenAI، طراحی شده است. این طرح مستلزم بیش از 500 میلیارد دلار بودجه در طول چهار ساله که با 100 میلیارد دلار شروع میشه (یکی از بزرگترین سرمایه‌گذاری‌های زیرساختی در تاریخ آمریکا) که حتی از پروژه منهتن و برنامه آپولو (در صورت تعدیل تورم) پیشی میگیره!!!

انتظار میره که Stargate بیش از 100000 شغل ایجاد کنه، با تمرکز روی برنامه‌های پزشکی مثل تحقیق در مورد داروهای سرطان، تشخیص زودهنگام بیماری و...

شرکای کلیدی این پروژه عبارتند از Softbank، Nvidia، Oracle، MGX (امارات متحده عربی)، مایکروسافت و Arm.

قرار است ساخت ده مرکز داده در تگزاس، با برنامه ریزی برای بیست مرکز داده در سراسر آمریکا، که همه به هم مرتبط هستند، آغاز شود.

فقط برای اینکه متوجه بشید این پروژه چقدر بزرگه:
پروژه منهتن (دهه 1940): 30 میلیارد دلار به پول امروز
برنامه آپولو (دهه 1960 تا 70): 257 میلیارد دلار به پول امروز
پروژه StarGate: حدود 500 میلیارد دلار در مدت تنها چهار سال

@Ai_Events
داستان غول نوظهور چینی هوش مصنوعی  Deepseek

شرکت deepseek که امروز همه‌مون از مدل رایگان بی‌محدودیت deepseek v3 به وجود اومدیم و الان هم مدل متن باز رایگان R1 رو به عنوان رقیب برای o1 داده، چطوری شکل گرفته؟
این شرکت بدون هیچ سرمایه‌گذاری خطرپذیر، مدلی متن‌باز تولید کرد که با غول‌هایی مانند OpenAI و Anthropic رقابت می‌کند. مدلی که با یک‌دهم هزینه آموزش و ۲۰ تا ۵۰ برابر ارزان‌تر در استنتاج، به مرزهای جدیدی در هوش مصنوعی دست یافته است.
در سال ۲۰۰۷، سه مهندس به نام‌های Xu Jin، Zheng Dawei و Liang Wenfeng (مدیرعامل فعلی) در دانشگاه Zhejiang با هم آشنا شدند و با هدف ساخت یک صندوق کمّی (Quant) که با هوش مصنوعی پیشرفته کار کند، دور هم جمع شدند. از آن زمان تا امروز یک استراتژی در جذب نیرو انسانی داشتند، به جای استخدام افراد باتجربه، آن‌ها روی استعدادهای جوان و کنجکاو سرمایه‌گذاری کردند. مدیر مدیر عامل deepseek l می‌گه: «ما بیشتر نقش‌های فنی را به فارغ‌التحصیلان جدید یا افرادی با ۱ تا ۲ سال تجربه سپردیم.».

این تیم به مدت ۸ سال به‌طور خاموش روی ایده‌های مختلف معاملات الگوریتمی کار کردند تا اینکه در سال ۲۰۱۵ شرکت High-Flyer را تأسیس کردند. فرهنگ استخدام و نوآوری آن‌ها به خوبی جواب داد. تا سال ۲۰۲۱، آن‌ها به موفقیت‌های چشمگیری دست یافته بودند:
۱۴۰ میلیون دلار سرمایه‌گذاری و ساخت یک پلتفرم بزرگ هوش مصنوعی برای معاملات.
مالکیت ۱۰,۰۰۰ کارت گرافیک NVIDIA A100.
تبدیل شدن به یکی از ۴ صندوق کمّی برتر با ۱۵ میلیارد دلار دارایی تحت مدیریت (AUM).

اما سپس همه چیز فروپاشید. سال ۲۰۲۲ موفقیت High-Flyer به نقطه ضعف آن تبدیل شد. آن‌ها خیلی بزرگ و سریع رشد کرده بودند و شروع به از دست دادن میلیاردها دلار کردند، طی چند فصل متوالی روی سرمایه‌های تحت مدیریت‌شون ضرر دادند و از شاخص بازار بورس چین عقب ماندند.
دولت چین در پی کندی اقتصادی، بحران مسکن و کاهش شاخص بورس، شروع به محدود کردن صنعت معاملات کمّی کرد. شاخص CSI300 (شاخص سهام برتر چین) به پایین‌ترین حد خود رسید و معامله‌گران فرکانس بالا را مقصر اصلی این فروپاشی دانستند. High-Flyer با خطر انقراض مواجه شد.
در سال ۲۰۲۳ آن‌ها تغییر جهت دادند. DeepSeek، یک آزمایشگاه هوش مصنوعی، با استفاده از استعدادهای موجود و ۱۰,۰۰۰ کارت گرافیک خود تأسیس کردند. بدون هیچ سرمایه‌گذاری خطرپذیر. آن‌ها همه چیز را روی این شرط بستند.
آن‌ها همان فلسفه استخدام خود را حفظ کردند: استخدام «فارغ‌التحصیلان نخبه» جای محققان باتجربه هوش مصنوعی.
مدیر عامل deepseek می‌گه: «هیچ جادوگری وجود ندارد. ما بیشتر فارغ‌التحصیلان جدید از دانشگاه‌های برتر، دانشجویان دکتری در سال‌های چهارم یا پنجم و برخی جوانانی که چند سال پیش فارغ‌التحصیل شده‌اند را استخدام می‌کنیم.»

شرکت DeepSeek در اوایل سال ۲۰۲۴ با معرفی DeepSeek v2 را ارائه کردند.
تا سپتامبر، آن‌ها ابتدا مقاله‌ی R1-lite-preview را به عنوان اولین مدلی که با مدل استدلالی o1 OpenAI رقابت می‌کرد، منتشر کردند، . این مدل با استفاده از یک تکنیک جدید یادگیری تقویتی (RL) که از محاسبات زمان استنتاج  استفاده می‌کرد، از همه رقبا (متن‌باز یا اختصاصی) پیشی گرفت.
در کریسمس، آن‌ها DeepSeek v3  ارائه کردند که با تنها ۶ میلیون دلار هزینه آموزش، با ChatGPT-4o و Claude 3.5 Sonnet رقابت کرد.
هزینه‌های API که ۲۰ تا ۵۰ برابر ارزان‌تر از رقبا است.

این هفته، آن‌ها اولین مدل استدلالی کاملاً متن‌باز را منتشر کردند که با OpenAI o1 برابری می‌کرد. آن‌ها یافته‌های خود را به‌صورت عمومی به اشتراک گذاشتند و فاش کردند که این مدل را تنها از طریق یادگیری تقویتی (RL) و بدون نیاز به تنظیم دقیق نظارت‌شده یا مدل‌سازی پاداش آموزش داده‌اند.
و هزینه‌های API هنوز ۲۰ تا ۵۰ برابر ارزان‌تر از رقبا هستند:
مدل DeepSeek R1 حدود  ۰.۱۴ تا ۰.۵۵ دلار برای هر ۱ میلیون توکن ورودی، ۲.۱۹ دلار برای هر ۱ میلیون توکن خروجی.
مدل OpenAI o1 حدود ۷.۵۰ تا ۱۵ دلار برای هر ۱ میلیون توکن ورودی، ۶۰ دلار برای هر ۱ میلیون توکن خروجی.
Source

@Ai_Events
شرکت OpenAI از ابزار جدید Operator رونمایی کرد: تحولی در انجام کارهای اینترنتی

شرکت OpenAI، از ابزار جدید خود به نام Operator رونمایی کرده است که می‌تواند به‌طور خودکار وظایف مختلف آنلاین را انجام دهد.

این ابزار با استفاده از مرورگر داخلی خود، قادر است صفحات وب را مشاهده کرده و با آن‌ها تعامل کند. از جمله قابلیت‌های آن می‌توان به تایپ، کلیک و اسکرول در صفحات وب اشاره کرد.

همچنین Operator از هوش مصنوعی پیشرفته استفاده می‌کند و به کاربران این امکان را می‌دهد که بدون نیاز به انجام اقدامات دستی، کارهای اینترنتی خود را انجام دهند.

این ابزار ابتدا برای مشترکان نسخه پرو ChatGPT در آمریکا در دسترس خواهد بود و OpenAI قصد دارد آن را به سایر کاربران نیز گسترش دهد.

تو این ویدئو می‌تونید توضیحات و نحوه کارکردش رو با حضور آقای سم‌ آلتمن ببینید:
https://youtu.be/CSE77wAdDLg


@Ai_Events
سخنرانی تخصصی دانشکده مهندسی کامپیوتر با همکاری انجمن علمی برگزار می‌شود:

هوش مصنوعی و استنتاج کاتوره‌ای💻
توسط دکتر سیاوش ارجمند بیگدلی، دانشیار دانشگاه صنعتی دانمارک

زمان: شنبه ۶ بهمن، ساعت ۱۲:۳۰ الی ۱۳:۳۰



📍 مکان: آمفی تئاتر دانشکده مهندسی کامپیوتر دانشگاه امیرکبیر

@Ai_Events
انتشار کد، پارامترها و مقاله‌ی مدل هوش‌مصنوعی DeepSeek-R1 تکان‌دهنده است. ارزیابی‌های کمی، رقابت شانه‌به‌شانه‌ی آن با ChatGPT o1 را نشان می‌دهد. طبق تجربه‌ی شخصی، این مدل در مواردی حتی بهتر از o1-pro عمل می‌کند. مهم‌تر از همه: رایگان است.


دکتر علی شریف‌زارچی

@Ai_Events
دکتر فرهاد نیلی:

در کنفرانس مدیریت نوآوری و فناوری، با عنوان «تجاری‌سازی‌ هوش مصنوعی» در مورد استراتژی‌های درآمدی هوش مصنوعی صحبت کردم.

لینک به ویدیو

لینک به پست
@Ai_Events
Compositional Learning Journal Club

This Week's Presentation:

Title: Can We Generate Images with CoT? Let's Verify and Reinforce Image Generation Step by Step


Presenter: Amir Kasaei

Abstract:
This paper explores the use of Chain-of-Thought (CoT) reasoning to improve autoregressive image generation, an area not widely studied. The authors propose three techniques: scaling computation for verification, aligning preferences with Direct Preference Optimization (DPO), and integrating these methods for enhanced performance. They introduce two new reward models, PARM and PARM++, which adaptively assess and correct image generations. Their approach improves the Show-o model, achieving a +24% gain on the GenEval benchmark and surpassing Stable Diffusion 3 by +15%.


Papers: Can We Generate Images with CoT? Let's Verify and Reinforce Image Generation Step by Step


Session Details:
- Date: Sunday
- Time: 5:30 - 6:30 PM
- Location: Online at vc.sharif.edu/ch/rohban

@Ai_Events
سقوط سنگین سهام Nvidia! 

سهام شرکت انویدیا امروز با کاهش ۱۳ درصدی مواجه شده و بیش از ۵۰۰ میلیارد دلار از ارزش بازار این شرکت از بین رفت! 

دلیلش هم اینه که می‌گن دیپ‌سیک تونسته با تعداد بسیار کمتری پردازنده گرافیکی به نتایج خوبی برسه، پس تقاضای پردازنده گرافیکی کم خواهد شد.

#Nvidia #هوش_مصنوعی #بازار_سهام
#Nvidia  #هوش_مصنوعی  #بازار_سهام  #تکنولوژی   #کارت_گرافیک      #اقتصاد_دیجیتال    #فناوری_اطلاعات 

@Ai_Events
یوتیوب یه باگ جدید داره که مثلا تو ثانیه 59 یهو دیگه هیچی دانلود نمی‌کنه و بقیه ویدیو رو نشون‌تون نمیده.
برای حل موقت این مشکل،‌ وقتی ویدیوتون متوقف شد، روی صفحه کلیک راست کنید و گزینه‌ی Copy videoo URL at current time رو بزنید، این گزینه آدرس همین ویدیو رو که داخلش ثانیه‌ای که در حال مشاهده‌ش هستید رو بهتون میده. آدرس رو تو نوار جستجوی مرورگرتون بچسبونید و دو ثانیه به عددی که آدرس نمایش میده اضافه کنید و ادامه ویدیو رو مشاهده کنید.

@Ai_Events
مدل DeepSeek ثابت کرد که Palantir درست می‌گفت!

مدتی پیش، شرکت Palantir اعلام کرده بود که ارزش هوش مصنوعی در مدل‌ها باقی نمی‌مونه، بلکه به سمت برنامه‌ها، گردش کار و امنیت منتقل میشه.

تو ماه سپتامبر، آقای الکس کارپ، مدیرعامل شرکت Palantir گفته بود که:
"مردم به اشتباه فکر می‌کنند که تمام ارزش در مدل‌های زبانی بزرگ (LLM) است.
مدل‌های هوش مصنوعی باید پردازش شوند."

به نظر من پیشرفت DeepSeek در کاهش هزینه‌های مدل‌سازی، دیدگاه Palantir را تأیید می‌کند که ارزش اصلی در لایه کاربردهای عملیاتی و جریان‌های کاری نهفته است.

پرواضحه که با پیشرفت فناوری، مدل‌های هوش مصنوعی در دسترس و ارزان‌تر می‌شن. پس تفاوت‌های رقابتی دیگه تو خود مدل‌ها نیست، بلکه تو نحوه‌ی استفاده ازشون و کاربردهای واقعی خواهد بود. مثل کاربردی که تو این پست مطرح شده، سا استفاده از مدل‌ها تو حوزه‌ی خدمات مشتری،‌ آموزش، سلامت و ...


@Ai_Events
Compositional Learning Journal Club

Join us this week for an in-depth discussion on Compositional Learning in the context of cutting-edge text-to-image generative models. We will explore recent breakthroughs and challenges, focusing on how these models handle compositional tasks and where improvements can be made.


This Week's Presentation:

🔹 Title: Correcting Diffusion Generation through Resampling


🔸 Presenter: Ali Aghayari

🌀 Abstract:
This paper addresses distributional discrepancies in diffusion models, which cause missing objects in text-to-image generation and reduced image quality. Existing methods overlook this root issue, leading to
suboptimal results. The authors propose a particle filtering framework that uses real images and a pre-trained object detector to measure and correct these discrepancies through resampling. Their approach improves object occurrence by 5% and FID by 1.0 on MS-COCO, outperforming previous methods in generating more accurate and higher-quality images.


📄 Papers: Correcting Diffusion Generation through Resampling


Session Details:
- 📅 Date: Tuesday
- 🕒 Time: 5:30 - 6:30 PM
- 🌐 Location: Online at vc.sharif.edu/ch/rohban


@Ai_Events
Andrej Karpathy released today a new course focused on LLM, such as chatGPT architecture. This three and half hour course dives into the foundation topics such as working and processing text, language model architecture, and dive into applications of foundation models such as Llama 3.1, DeepSeek-R1, etc.

https://www.youtube.com/watch?v=7xTGNNLPyMI


@Ai_Events
هوش مصنوعی و طراحی محیط های یادگیری
#اردیبهشت۱۴۰۴
aile.khu.ac.ir


@Ai_Events
ارائه‌ی دکتر مهدیه سلیمانی (استاد گروه هوش مصنوعی دانشگاه شریف) در مورد مقاله DeepSeek R1 و تفاوت رویکرد آن در استفاده از RL برای جستجو

مشاهده در یوتیوب


مشاهده در آپارات


برای اطلاع از رویدادهای هوش مصنوعی، به کانال زیر بپیوندید:
https://www.tg-me.com/AI_Events
@Ai_Events
یه درس عالی برای بچه‌های دانشگاه تهران که از ترم بعد ارائه میشه

@Ai_Events
Join Richard Sutton’s Talk at Sharif University of Technology

Title: The Increasing Role of Sensorimotor Experience in Artificial Intelligence

Speaker: Rich Sutton (Keen Technologies, University of Alberta, OpenMind Research Institute)

Date: Wednesday
Time: 8 PM Iran Time

Sign Up Here: https://forms.gle/q1M7qErWvydFxR9m6


@Ai_Events
This media is not supported in your browser
VIEW IN TELEGRAM
ایلان ماسک نقش کلیدی در ایجاد OpenAI ایفا کرد و حتی نام "OpenAI" را پیشنهاد داد تا نشان‌دهنده تعهد این شرکت به متن‌باز (open source) بودن باشد.

اما سام آلتمن این شرکت غیرانتفاعی و متن‌باز را به یک شرکت سودمحور و با کد بسته (closed-source) تبدیل کرد.

@Ai_Events
2025/07/07 15:23:23
Back to Top
HTML Embed Code: