Telegram Web Link
How Machine Learning Algorithms works!

@Ai_Events
جلسه‌ی دوازدهم ژورنال‌کلاب مدل‌های زبانی بزرگ با موضوع:
Molmo and PixMo: Open Weights and Open Data for State-of-the-Art Vision-Language Models

سخنران: محمدرضا صالحی، دانشجوی دکترای دانشگاه واشینگتن و پژوهشگر در شرکت اپل

زمان: یک‌شنبه ۱۴۰۳/۱۰/۳۰، ساعت ۲۱:۳۰ تا ۲۳:۰۰
مکان برگزاری: vc.sharif.edu/ch/mjafari

در این جلسه:
مدل‌های Molmo و PixMo بررسی می‌شوند که با استفاده از وزن‌ها و داده‌های باز، پیشرفت‌هایی چشمگیر در مدل‌های چندوجهی زبان-تصویر ارائه داده‌اند. این مدل‌ها با تکیه بر مجموعه‌داده‌های نوآورانه، زیرنویس‌های دقیق انسانی، و معماری بهینه‌سازی‌شده، عملکردی رقابتی با سیستم‌های انحصاری دارند و تمامی وزن‌ها، داده‌ها و کدهای آن‌ها به‌صورت باز منتشر شده است.

منابع:

Molmo and PixMo: Open Weights and Open Data for State-of-the-Art Vision-Language Models

افزودن رویداد به تقویم گوگل

@Ai_Events
Audio
رادیو جادی، شماره 186
در رادیوی ۱۸۶ خیلی خبرها از هوش مصنوعی هستن. از پول‌های عظیمی که دراومده و خرج می‌شه تا جایگزینی انسان‌ها. چین ساخت
باتری برای جهان رو سختتر کرده و اروپا شارژ باتری رو آسونتر. با ما باشین
که جهان هکرهای بیشتری می‌خواد حتی اگر دوربینشون جای اشتباهی باشه.


00:00 - رادیوجادی ۱۸۶ خوش اومدی پاپای
01:20 - ربات هایی که از فیلم جراحی یاد گرفتن
07:20 - بازمتن شدن ران:ای آی توسط انویدیا
13:31 - حمایت ساپورت از ویزاهای اچ ۱ب آمریکا
15:30 - محدودیت‌های بیشتر چین بر روی فلزات مرتبط با باتری
18:30 - سرمایه‌گذاری ۸۰ میلیارد دلاری مایکروسافت در دیتاسنترهای هوش مصنوعی
24:16 - روز پابلک دامین ۲۰۲۵ و پایان یکسری کپی رایت‌ها
25:24 - قانون اجبار شارژ از طریق یو اس بی سی در اروپا عملیاتی شد
28:34 - بخش آخر
35:12 - تشکر از حامیان

https://youtu.be/JK9MNhlv6aA

@Ai_Container
شرکت VideoLAN، سازنده پلیر محبوب VLC، اعلام کرده در حال کار روی قابلیت جدیدی هست که نه تنها امکان زیرنویس کردن خودکار فایلهای پخش شده در این پلیر رو با استفاده از هوش مصنوعی افلاین و از طریق سخت افزار موجود در کامپیوتر مهیا میکنه بلکه امکان ترجمه اونهارو به طور اتوماتیک به 100 زبان مختلف هم فراهم میکنه.

این شرکت هنوز زمانی برای عرضه این قابلیت اعلام نکرده.

@Ai_Events
سهمیه‌بندی هوش مصنوعی توسط آمریکا/ ایران به طور کامل از دریافت این فناوری منع می شود

رویترز: دولت آمریکا اعلام کرد که محدودیت‌های بیشتری بر صادرات تراشه‌های هوش مصنوعی و فناوری‌های مرتبط اعمال خواهد کرد.

این مقررات جهان را به سه سطح تقسیم می‌کند. حدود ۱۸ کشور، از جمله ژاپن، بریتانیا، کره جنوبی و هلند، اساساً از قوانین معاف خواهند بود.

حدود ۱۲۰ کشور، از جمله سنگاپور، عربستان و امارات، با محدودیت‌ مواجه خواهند شد و کشورهایی که تحت تحریم تسلیحاتی هستند مانند روسیه، چین و ایران به‌طور کامل از دریافت این نوع فناوری منع خواهند شد.

منبع
@Ai_Events
انجمن علمی دانشکده مهندسی کامپیوتر دانشگاه امیرکبیر با همکاری پیام‌رسان بله برگزار می‌کند:

پنجمین دوره‌ی رویداد هوش مصنوعی امیرکبیر
AAISS

سخنرانی و کارگاه

زمان برگزاری از ۲ لغایت ۱۵ بهمن‌ماه(به صورت مجازی)

در صورت حضور در هر کدام از ارائه ها و کارگاه ها،گواهی مجازی حضور در آن ارائه و کارگاه به شخص شرکت کننده اعطا خواهد شد.

اطلاعات بیشتر و ثبت نام:
autaaiss.com

@ceitssc
@aaiss_aut

@Ai_Events
گوگل یک نوع معماری جدید از خانواده‌ی transformerها به نام Titans معرفی کرده که مثل مغز انسان عمل می‌کنه و حتی تو بعضی از وظایف از اون بهتر هم عمل کرده!

این سیستم:
• دارای سه نوع حافظه بلندمدت، کوتاه مدت و دائمی است و می‌تواند داده‌های بی‌اهمیت را در حین حفظ چیزهای مهم فراموش کند.
• حافظه بلند مدت آن یاد می گیرد و به روز می شود و امکان پردازش سریعتر و کارآمدتر را فراهم می کند.
ا • Titans در کارهایی مانند پیش‌بینی، تجزیه و تحلیل ژنوم و پردازش داده‌های مبتنی بر زمان برتری دارد.
• می تواند حجم بسیار بیشتری از اطلاعات را نسبت به GPT-4 مدیریت کند و معادل 25 کتاب را در آن واحد تجزیه و تحلیل کند.


این پست مدیوم کمک می‌کنه که نحوه‌ی عملکرد این معماری رو بهتر متوجه بشید!

@Ai_Events
توی مراسم سوگند ترامپ، تکنولوژیست‌ها جایگاه بهتری از اعضای کنگره داشتن. مطمئنا به پول و قدرت مرتبطه ولی همین که در یک کشور تکنولوژیست ها می‌شن منبع قدرت و جاشون بهتر از سیاستمدارها است، نکته جالبیه.

حالا اینکه حواس زوکربرگ کمی پرته، بحث دیگه‌ای است 😜
منبع

@Ai_Events
پروژه 500 میلیارد دلاری هوش مصنوعی

پروژه استارگیت OpenAI با هدف ایجاد یک زیرساخت بزرگ هوش مصنوعی، با دسترسی انحصاری OpenAI، طراحی شده است. این طرح مستلزم بیش از 500 میلیارد دلار بودجه در طول چهار ساله که با 100 میلیارد دلار شروع میشه (یکی از بزرگترین سرمایه‌گذاری‌های زیرساختی در تاریخ آمریکا) که حتی از پروژه منهتن و برنامه آپولو (در صورت تعدیل تورم) پیشی میگیره!!!

انتظار میره که Stargate بیش از 100000 شغل ایجاد کنه، با تمرکز روی برنامه‌های پزشکی مثل تحقیق در مورد داروهای سرطان، تشخیص زودهنگام بیماری و...

شرکای کلیدی این پروژه عبارتند از Softbank، Nvidia، Oracle، MGX (امارات متحده عربی)، مایکروسافت و Arm.

قرار است ساخت ده مرکز داده در تگزاس، با برنامه ریزی برای بیست مرکز داده در سراسر آمریکا، که همه به هم مرتبط هستند، آغاز شود.

فقط برای اینکه متوجه بشید این پروژه چقدر بزرگه:
پروژه منهتن (دهه 1940): 30 میلیارد دلار به پول امروز
برنامه آپولو (دهه 1960 تا 70): 257 میلیارد دلار به پول امروز
پروژه StarGate: حدود 500 میلیارد دلار در مدت تنها چهار سال

@Ai_Events
داستان غول نوظهور چینی هوش مصنوعی  Deepseek

شرکت deepseek که امروز همه‌مون از مدل رایگان بی‌محدودیت deepseek v3 به وجود اومدیم و الان هم مدل متن باز رایگان R1 رو به عنوان رقیب برای o1 داده، چطوری شکل گرفته؟
این شرکت بدون هیچ سرمایه‌گذاری خطرپذیر، مدلی متن‌باز تولید کرد که با غول‌هایی مانند OpenAI و Anthropic رقابت می‌کند. مدلی که با یک‌دهم هزینه آموزش و ۲۰ تا ۵۰ برابر ارزان‌تر در استنتاج، به مرزهای جدیدی در هوش مصنوعی دست یافته است.
در سال ۲۰۰۷، سه مهندس به نام‌های Xu Jin، Zheng Dawei و Liang Wenfeng (مدیرعامل فعلی) در دانشگاه Zhejiang با هم آشنا شدند و با هدف ساخت یک صندوق کمّی (Quant) که با هوش مصنوعی پیشرفته کار کند، دور هم جمع شدند. از آن زمان تا امروز یک استراتژی در جذب نیرو انسانی داشتند، به جای استخدام افراد باتجربه، آن‌ها روی استعدادهای جوان و کنجکاو سرمایه‌گذاری کردند. مدیر مدیر عامل deepseek l می‌گه: «ما بیشتر نقش‌های فنی را به فارغ‌التحصیلان جدید یا افرادی با ۱ تا ۲ سال تجربه سپردیم.».

این تیم به مدت ۸ سال به‌طور خاموش روی ایده‌های مختلف معاملات الگوریتمی کار کردند تا اینکه در سال ۲۰۱۵ شرکت High-Flyer را تأسیس کردند. فرهنگ استخدام و نوآوری آن‌ها به خوبی جواب داد. تا سال ۲۰۲۱، آن‌ها به موفقیت‌های چشمگیری دست یافته بودند:
۱۴۰ میلیون دلار سرمایه‌گذاری و ساخت یک پلتفرم بزرگ هوش مصنوعی برای معاملات.
مالکیت ۱۰,۰۰۰ کارت گرافیک NVIDIA A100.
تبدیل شدن به یکی از ۴ صندوق کمّی برتر با ۱۵ میلیارد دلار دارایی تحت مدیریت (AUM).

اما سپس همه چیز فروپاشید. سال ۲۰۲۲ موفقیت High-Flyer به نقطه ضعف آن تبدیل شد. آن‌ها خیلی بزرگ و سریع رشد کرده بودند و شروع به از دست دادن میلیاردها دلار کردند، طی چند فصل متوالی روی سرمایه‌های تحت مدیریت‌شون ضرر دادند و از شاخص بازار بورس چین عقب ماندند.
دولت چین در پی کندی اقتصادی، بحران مسکن و کاهش شاخص بورس، شروع به محدود کردن صنعت معاملات کمّی کرد. شاخص CSI300 (شاخص سهام برتر چین) به پایین‌ترین حد خود رسید و معامله‌گران فرکانس بالا را مقصر اصلی این فروپاشی دانستند. High-Flyer با خطر انقراض مواجه شد.
در سال ۲۰۲۳ آن‌ها تغییر جهت دادند. DeepSeek، یک آزمایشگاه هوش مصنوعی، با استفاده از استعدادهای موجود و ۱۰,۰۰۰ کارت گرافیک خود تأسیس کردند. بدون هیچ سرمایه‌گذاری خطرپذیر. آن‌ها همه چیز را روی این شرط بستند.
آن‌ها همان فلسفه استخدام خود را حفظ کردند: استخدام «فارغ‌التحصیلان نخبه» جای محققان باتجربه هوش مصنوعی.
مدیر عامل deepseek می‌گه: «هیچ جادوگری وجود ندارد. ما بیشتر فارغ‌التحصیلان جدید از دانشگاه‌های برتر، دانشجویان دکتری در سال‌های چهارم یا پنجم و برخی جوانانی که چند سال پیش فارغ‌التحصیل شده‌اند را استخدام می‌کنیم.»

شرکت DeepSeek در اوایل سال ۲۰۲۴ با معرفی DeepSeek v2 را ارائه کردند.
تا سپتامبر، آن‌ها ابتدا مقاله‌ی R1-lite-preview را به عنوان اولین مدلی که با مدل استدلالی o1 OpenAI رقابت می‌کرد، منتشر کردند، . این مدل با استفاده از یک تکنیک جدید یادگیری تقویتی (RL) که از محاسبات زمان استنتاج  استفاده می‌کرد، از همه رقبا (متن‌باز یا اختصاصی) پیشی گرفت.
در کریسمس، آن‌ها DeepSeek v3  ارائه کردند که با تنها ۶ میلیون دلار هزینه آموزش، با ChatGPT-4o و Claude 3.5 Sonnet رقابت کرد.
هزینه‌های API که ۲۰ تا ۵۰ برابر ارزان‌تر از رقبا است.

این هفته، آن‌ها اولین مدل استدلالی کاملاً متن‌باز را منتشر کردند که با OpenAI o1 برابری می‌کرد. آن‌ها یافته‌های خود را به‌صورت عمومی به اشتراک گذاشتند و فاش کردند که این مدل را تنها از طریق یادگیری تقویتی (RL) و بدون نیاز به تنظیم دقیق نظارت‌شده یا مدل‌سازی پاداش آموزش داده‌اند.
و هزینه‌های API هنوز ۲۰ تا ۵۰ برابر ارزان‌تر از رقبا هستند:
مدل DeepSeek R1 حدود  ۰.۱۴ تا ۰.۵۵ دلار برای هر ۱ میلیون توکن ورودی، ۲.۱۹ دلار برای هر ۱ میلیون توکن خروجی.
مدل OpenAI o1 حدود ۷.۵۰ تا ۱۵ دلار برای هر ۱ میلیون توکن ورودی، ۶۰ دلار برای هر ۱ میلیون توکن خروجی.
Source

@Ai_Events
شرکت OpenAI از ابزار جدید Operator رونمایی کرد: تحولی در انجام کارهای اینترنتی

شرکت OpenAI، از ابزار جدید خود به نام Operator رونمایی کرده است که می‌تواند به‌طور خودکار وظایف مختلف آنلاین را انجام دهد.

این ابزار با استفاده از مرورگر داخلی خود، قادر است صفحات وب را مشاهده کرده و با آن‌ها تعامل کند. از جمله قابلیت‌های آن می‌توان به تایپ، کلیک و اسکرول در صفحات وب اشاره کرد.

همچنین Operator از هوش مصنوعی پیشرفته استفاده می‌کند و به کاربران این امکان را می‌دهد که بدون نیاز به انجام اقدامات دستی، کارهای اینترنتی خود را انجام دهند.

این ابزار ابتدا برای مشترکان نسخه پرو ChatGPT در آمریکا در دسترس خواهد بود و OpenAI قصد دارد آن را به سایر کاربران نیز گسترش دهد.

تو این ویدئو می‌تونید توضیحات و نحوه کارکردش رو با حضور آقای سم‌ آلتمن ببینید:
https://youtu.be/CSE77wAdDLg


@Ai_Events
سخنرانی تخصصی دانشکده مهندسی کامپیوتر با همکاری انجمن علمی برگزار می‌شود:

هوش مصنوعی و استنتاج کاتوره‌ای💻
توسط دکتر سیاوش ارجمند بیگدلی، دانشیار دانشگاه صنعتی دانمارک

زمان: شنبه ۶ بهمن، ساعت ۱۲:۳۰ الی ۱۳:۳۰



📍 مکان: آمفی تئاتر دانشکده مهندسی کامپیوتر دانشگاه امیرکبیر

@Ai_Events
انتشار کد، پارامترها و مقاله‌ی مدل هوش‌مصنوعی DeepSeek-R1 تکان‌دهنده است. ارزیابی‌های کمی، رقابت شانه‌به‌شانه‌ی آن با ChatGPT o1 را نشان می‌دهد. طبق تجربه‌ی شخصی، این مدل در مواردی حتی بهتر از o1-pro عمل می‌کند. مهم‌تر از همه: رایگان است.


دکتر علی شریف‌زارچی

@Ai_Events
دکتر فرهاد نیلی:

در کنفرانس مدیریت نوآوری و فناوری، با عنوان «تجاری‌سازی‌ هوش مصنوعی» در مورد استراتژی‌های درآمدی هوش مصنوعی صحبت کردم.

لینک به ویدیو

لینک به پست
@Ai_Events
Compositional Learning Journal Club

This Week's Presentation:

Title: Can We Generate Images with CoT? Let's Verify and Reinforce Image Generation Step by Step


Presenter: Amir Kasaei

Abstract:
This paper explores the use of Chain-of-Thought (CoT) reasoning to improve autoregressive image generation, an area not widely studied. The authors propose three techniques: scaling computation for verification, aligning preferences with Direct Preference Optimization (DPO), and integrating these methods for enhanced performance. They introduce two new reward models, PARM and PARM++, which adaptively assess and correct image generations. Their approach improves the Show-o model, achieving a +24% gain on the GenEval benchmark and surpassing Stable Diffusion 3 by +15%.


Papers: Can We Generate Images with CoT? Let's Verify and Reinforce Image Generation Step by Step


Session Details:
- Date: Sunday
- Time: 5:30 - 6:30 PM
- Location: Online at vc.sharif.edu/ch/rohban

@Ai_Events
سقوط سنگین سهام Nvidia! 

سهام شرکت انویدیا امروز با کاهش ۱۳ درصدی مواجه شده و بیش از ۵۰۰ میلیارد دلار از ارزش بازار این شرکت از بین رفت! 

دلیلش هم اینه که می‌گن دیپ‌سیک تونسته با تعداد بسیار کمتری پردازنده گرافیکی به نتایج خوبی برسه، پس تقاضای پردازنده گرافیکی کم خواهد شد.

#Nvidia #هوش_مصنوعی #بازار_سهام
#Nvidia  #هوش_مصنوعی  #بازار_سهام  #تکنولوژی   #کارت_گرافیک      #اقتصاد_دیجیتال    #فناوری_اطلاعات 

@Ai_Events
2025/07/01 03:33:21
Back to Top
HTML Embed Code: