جلسهی دوازدهم ژورنالکلاب مدلهای زبانی بزرگ با موضوع:
Molmo and PixMo: Open Weights and Open Data for State-of-the-Art Vision-Language Models
سخنران: محمدرضا صالحی، دانشجوی دکترای دانشگاه واشینگتن و پژوهشگر در شرکت اپل
زمان: یکشنبه ۱۴۰۳/۱۰/۳۰، ساعت ۲۱:۳۰ تا ۲۳:۰۰
مکان برگزاری: vc.sharif.edu/ch/mjafari
در این جلسه:
مدلهای Molmo و PixMo بررسی میشوند که با استفاده از وزنها و دادههای باز، پیشرفتهایی چشمگیر در مدلهای چندوجهی زبان-تصویر ارائه دادهاند. این مدلها با تکیه بر مجموعهدادههای نوآورانه، زیرنویسهای دقیق انسانی، و معماری بهینهسازیشده، عملکردی رقابتی با سیستمهای انحصاری دارند و تمامی وزنها، دادهها و کدهای آنها بهصورت باز منتشر شده است.
منابع:
Molmo and PixMo: Open Weights and Open Data for State-of-the-Art Vision-Language Models
افزودن رویداد به تقویم گوگل
@Ai_Events
Molmo and PixMo: Open Weights and Open Data for State-of-the-Art Vision-Language Models
سخنران: محمدرضا صالحی، دانشجوی دکترای دانشگاه واشینگتن و پژوهشگر در شرکت اپل
زمان: یکشنبه ۱۴۰۳/۱۰/۳۰، ساعت ۲۱:۳۰ تا ۲۳:۰۰
مکان برگزاری: vc.sharif.edu/ch/mjafari
در این جلسه:
مدلهای Molmo و PixMo بررسی میشوند که با استفاده از وزنها و دادههای باز، پیشرفتهایی چشمگیر در مدلهای چندوجهی زبان-تصویر ارائه دادهاند. این مدلها با تکیه بر مجموعهدادههای نوآورانه، زیرنویسهای دقیق انسانی، و معماری بهینهسازیشده، عملکردی رقابتی با سیستمهای انحصاری دارند و تمامی وزنها، دادهها و کدهای آنها بهصورت باز منتشر شده است.
منابع:
Molmo and PixMo: Open Weights and Open Data for State-of-the-Art Vision-Language Models
افزودن رویداد به تقویم گوگل
@Ai_Events
Audio
رادیو جادی، شماره 186
در رادیوی ۱۸۶ خیلی خبرها از هوش مصنوعی هستن. از پولهای عظیمی که دراومده و خرج میشه تا جایگزینی انسانها. چین ساخت
باتری برای جهان رو سختتر کرده و اروپا شارژ باتری رو آسونتر. با ما باشین
که جهان هکرهای بیشتری میخواد حتی اگر دوربینشون جای اشتباهی باشه.
00:00 - رادیوجادی ۱۸۶ خوش اومدی پاپای
01:20 - ربات هایی که از فیلم جراحی یاد گرفتن
07:20 - بازمتن شدن ران:ای آی توسط انویدیا
13:31 - حمایت ساپورت از ویزاهای اچ ۱ب آمریکا
15:30 - محدودیتهای بیشتر چین بر روی فلزات مرتبط با باتری
18:30 - سرمایهگذاری ۸۰ میلیارد دلاری مایکروسافت در دیتاسنترهای هوش مصنوعی
24:16 - روز پابلک دامین ۲۰۲۵ و پایان یکسری کپی رایتها
25:24 - قانون اجبار شارژ از طریق یو اس بی سی در اروپا عملیاتی شد
28:34 - بخش آخر
35:12 - تشکر از حامیان
https://youtu.be/JK9MNhlv6aA
@Ai_Container
در رادیوی ۱۸۶ خیلی خبرها از هوش مصنوعی هستن. از پولهای عظیمی که دراومده و خرج میشه تا جایگزینی انسانها. چین ساخت
باتری برای جهان رو سختتر کرده و اروپا شارژ باتری رو آسونتر. با ما باشین
که جهان هکرهای بیشتری میخواد حتی اگر دوربینشون جای اشتباهی باشه.
00:00 - رادیوجادی ۱۸۶ خوش اومدی پاپای
01:20 - ربات هایی که از فیلم جراحی یاد گرفتن
07:20 - بازمتن شدن ران:ای آی توسط انویدیا
13:31 - حمایت ساپورت از ویزاهای اچ ۱ب آمریکا
15:30 - محدودیتهای بیشتر چین بر روی فلزات مرتبط با باتری
18:30 - سرمایهگذاری ۸۰ میلیارد دلاری مایکروسافت در دیتاسنترهای هوش مصنوعی
24:16 - روز پابلک دامین ۲۰۲۵ و پایان یکسری کپی رایتها
25:24 - قانون اجبار شارژ از طریق یو اس بی سی در اروپا عملیاتی شد
28:34 - بخش آخر
35:12 - تشکر از حامیان
https://youtu.be/JK9MNhlv6aA
@Ai_Container
شرکت VideoLAN، سازنده پلیر محبوب VLC، اعلام کرده در حال کار روی قابلیت جدیدی هست که نه تنها امکان زیرنویس کردن خودکار فایلهای پخش شده در این پلیر رو با استفاده از هوش مصنوعی افلاین و از طریق سخت افزار موجود در کامپیوتر مهیا میکنه بلکه امکان ترجمه اونهارو به طور اتوماتیک به 100 زبان مختلف هم فراهم میکنه.
این شرکت هنوز زمانی برای عرضه این قابلیت اعلام نکرده.
@Ai_Events
این شرکت هنوز زمانی برای عرضه این قابلیت اعلام نکرده.
@Ai_Events
سهمیهبندی هوش مصنوعی توسط آمریکا/ ایران به طور کامل از دریافت این فناوری منع می شود
رویترز: دولت آمریکا اعلام کرد که محدودیتهای بیشتری بر صادرات تراشههای هوش مصنوعی و فناوریهای مرتبط اعمال خواهد کرد.
این مقررات جهان را به سه سطح تقسیم میکند. حدود ۱۸ کشور، از جمله ژاپن، بریتانیا، کره جنوبی و هلند، اساساً از قوانین معاف خواهند بود.
حدود ۱۲۰ کشور، از جمله سنگاپور، عربستان و امارات، با محدودیت مواجه خواهند شد و کشورهایی که تحت تحریم تسلیحاتی هستند مانند روسیه، چین و ایران بهطور کامل از دریافت این نوع فناوری منع خواهند شد.
منبع
@Ai_Events
رویترز: دولت آمریکا اعلام کرد که محدودیتهای بیشتری بر صادرات تراشههای هوش مصنوعی و فناوریهای مرتبط اعمال خواهد کرد.
این مقررات جهان را به سه سطح تقسیم میکند. حدود ۱۸ کشور، از جمله ژاپن، بریتانیا، کره جنوبی و هلند، اساساً از قوانین معاف خواهند بود.
حدود ۱۲۰ کشور، از جمله سنگاپور، عربستان و امارات، با محدودیت مواجه خواهند شد و کشورهایی که تحت تحریم تسلیحاتی هستند مانند روسیه، چین و ایران بهطور کامل از دریافت این نوع فناوری منع خواهند شد.
منبع
@Ai_Events
انجمن علمی دانشکده مهندسی کامپیوتر دانشگاه امیرکبیر با همکاری پیامرسان بله برگزار میکند:
پنجمین دورهی رویداد هوش مصنوعی امیرکبیر
AAISS
سخنرانی و کارگاه
زمان برگزاری از ۲ لغایت ۱۵ بهمنماه(به صورت مجازی)
در صورت حضور در هر کدام از ارائه ها و کارگاه ها،گواهی مجازی حضور در آن ارائه و کارگاه به شخص شرکت کننده اعطا خواهد شد.
اطلاعات بیشتر و ثبت نام:
autaaiss.com
@ceitssc
@aaiss_aut
@Ai_Events
پنجمین دورهی رویداد هوش مصنوعی امیرکبیر
AAISS
سخنرانی و کارگاه
زمان برگزاری از ۲ لغایت ۱۵ بهمنماه(به صورت مجازی)
در صورت حضور در هر کدام از ارائه ها و کارگاه ها،گواهی مجازی حضور در آن ارائه و کارگاه به شخص شرکت کننده اعطا خواهد شد.
اطلاعات بیشتر و ثبت نام:
autaaiss.com
@ceitssc
@aaiss_aut
@Ai_Events
گوگل یک نوع معماری جدید از خانوادهی transformerها به نام Titans معرفی کرده که مثل مغز انسان عمل میکنه و حتی تو بعضی از وظایف از اون بهتر هم عمل کرده!
این سیستم:
• دارای سه نوع حافظه بلندمدت، کوتاه مدت و دائمی است و میتواند دادههای بیاهمیت را در حین حفظ چیزهای مهم فراموش کند.
• حافظه بلند مدت آن یاد می گیرد و به روز می شود و امکان پردازش سریعتر و کارآمدتر را فراهم می کند.
ا • Titans در کارهایی مانند پیشبینی، تجزیه و تحلیل ژنوم و پردازش دادههای مبتنی بر زمان برتری دارد.
• می تواند حجم بسیار بیشتری از اطلاعات را نسبت به GPT-4 مدیریت کند و معادل 25 کتاب را در آن واحد تجزیه و تحلیل کند.
این پست مدیوم کمک میکنه که نحوهی عملکرد این معماری رو بهتر متوجه بشید!
@Ai_Events
این سیستم:
• دارای سه نوع حافظه بلندمدت، کوتاه مدت و دائمی است و میتواند دادههای بیاهمیت را در حین حفظ چیزهای مهم فراموش کند.
• حافظه بلند مدت آن یاد می گیرد و به روز می شود و امکان پردازش سریعتر و کارآمدتر را فراهم می کند.
ا • Titans در کارهایی مانند پیشبینی، تجزیه و تحلیل ژنوم و پردازش دادههای مبتنی بر زمان برتری دارد.
• می تواند حجم بسیار بیشتری از اطلاعات را نسبت به GPT-4 مدیریت کند و معادل 25 کتاب را در آن واحد تجزیه و تحلیل کند.
این پست مدیوم کمک میکنه که نحوهی عملکرد این معماری رو بهتر متوجه بشید!
@Ai_Events
توی مراسم سوگند ترامپ، تکنولوژیستها جایگاه بهتری از اعضای کنگره داشتن. مطمئنا به پول و قدرت مرتبطه ولی همین که در یک کشور تکنولوژیست ها میشن منبع قدرت و جاشون بهتر از سیاستمدارها است، نکته جالبیه.
حالا اینکه حواس زوکربرگ کمی پرته، بحث دیگهای است 😜
منبع
@Ai_Events
حالا اینکه حواس زوکربرگ کمی پرته، بحث دیگهای است 😜
منبع
@Ai_Events
پروژه 500 میلیارد دلاری هوش مصنوعی
پروژه استارگیت OpenAI با هدف ایجاد یک زیرساخت بزرگ هوش مصنوعی، با دسترسی انحصاری OpenAI، طراحی شده است. این طرح مستلزم بیش از 500 میلیارد دلار بودجه در طول چهار ساله که با 100 میلیارد دلار شروع میشه (یکی از بزرگترین سرمایهگذاریهای زیرساختی در تاریخ آمریکا) که حتی از پروژه منهتن و برنامه آپولو (در صورت تعدیل تورم) پیشی میگیره!!!
انتظار میره که Stargate بیش از 100000 شغل ایجاد کنه، با تمرکز روی برنامههای پزشکی مثل تحقیق در مورد داروهای سرطان، تشخیص زودهنگام بیماری و...
شرکای کلیدی این پروژه عبارتند از Softbank، Nvidia، Oracle، MGX (امارات متحده عربی)، مایکروسافت و Arm.
قرار است ساخت ده مرکز داده در تگزاس، با برنامه ریزی برای بیست مرکز داده در سراسر آمریکا، که همه به هم مرتبط هستند، آغاز شود.
فقط برای اینکه متوجه بشید این پروژه چقدر بزرگه:
پروژه منهتن (دهه 1940): 30 میلیارد دلار به پول امروز
برنامه آپولو (دهه 1960 تا 70): 257 میلیارد دلار به پول امروز
پروژه StarGate: حدود 500 میلیارد دلار در مدت تنها چهار سال
@Ai_Events
پروژه استارگیت OpenAI با هدف ایجاد یک زیرساخت بزرگ هوش مصنوعی، با دسترسی انحصاری OpenAI، طراحی شده است. این طرح مستلزم بیش از 500 میلیارد دلار بودجه در طول چهار ساله که با 100 میلیارد دلار شروع میشه (یکی از بزرگترین سرمایهگذاریهای زیرساختی در تاریخ آمریکا) که حتی از پروژه منهتن و برنامه آپولو (در صورت تعدیل تورم) پیشی میگیره!!!
انتظار میره که Stargate بیش از 100000 شغل ایجاد کنه، با تمرکز روی برنامههای پزشکی مثل تحقیق در مورد داروهای سرطان، تشخیص زودهنگام بیماری و...
شرکای کلیدی این پروژه عبارتند از Softbank، Nvidia، Oracle، MGX (امارات متحده عربی)، مایکروسافت و Arm.
قرار است ساخت ده مرکز داده در تگزاس، با برنامه ریزی برای بیست مرکز داده در سراسر آمریکا، که همه به هم مرتبط هستند، آغاز شود.
فقط برای اینکه متوجه بشید این پروژه چقدر بزرگه:
پروژه منهتن (دهه 1940): 30 میلیارد دلار به پول امروز
برنامه آپولو (دهه 1960 تا 70): 257 میلیارد دلار به پول امروز
پروژه StarGate: حدود 500 میلیارد دلار در مدت تنها چهار سال
@Ai_Events
داستان غول نوظهور چینی هوش مصنوعی Deepseek
شرکت deepseek که امروز همهمون از مدل رایگان بیمحدودیت deepseek v3 به وجود اومدیم و الان هم مدل متن باز رایگان R1 رو به عنوان رقیب برای o1 داده، چطوری شکل گرفته؟
این شرکت بدون هیچ سرمایهگذاری خطرپذیر، مدلی متنباز تولید کرد که با غولهایی مانند OpenAI و Anthropic رقابت میکند. مدلی که با یکدهم هزینه آموزش و ۲۰ تا ۵۰ برابر ارزانتر در استنتاج، به مرزهای جدیدی در هوش مصنوعی دست یافته است.
در سال ۲۰۰۷، سه مهندس به نامهای Xu Jin، Zheng Dawei و Liang Wenfeng (مدیرعامل فعلی) در دانشگاه Zhejiang با هم آشنا شدند و با هدف ساخت یک صندوق کمّی (Quant) که با هوش مصنوعی پیشرفته کار کند، دور هم جمع شدند. از آن زمان تا امروز یک استراتژی در جذب نیرو انسانی داشتند، به جای استخدام افراد باتجربه، آنها روی استعدادهای جوان و کنجکاو سرمایهگذاری کردند. مدیر مدیر عامل deepseek l میگه: «ما بیشتر نقشهای فنی را به فارغالتحصیلان جدید یا افرادی با ۱ تا ۲ سال تجربه سپردیم.».
این تیم به مدت ۸ سال بهطور خاموش روی ایدههای مختلف معاملات الگوریتمی کار کردند تا اینکه در سال ۲۰۱۵ شرکت High-Flyer را تأسیس کردند. فرهنگ استخدام و نوآوری آنها به خوبی جواب داد. تا سال ۲۰۲۱، آنها به موفقیتهای چشمگیری دست یافته بودند:
۱۴۰ میلیون دلار سرمایهگذاری و ساخت یک پلتفرم بزرگ هوش مصنوعی برای معاملات.
مالکیت ۱۰,۰۰۰ کارت گرافیک NVIDIA A100.
تبدیل شدن به یکی از ۴ صندوق کمّی برتر با ۱۵ میلیارد دلار دارایی تحت مدیریت (AUM).
اما سپس همه چیز فروپاشید. سال ۲۰۲۲ موفقیت High-Flyer به نقطه ضعف آن تبدیل شد. آنها خیلی بزرگ و سریع رشد کرده بودند و شروع به از دست دادن میلیاردها دلار کردند، طی چند فصل متوالی روی سرمایههای تحت مدیریتشون ضرر دادند و از شاخص بازار بورس چین عقب ماندند.
دولت چین در پی کندی اقتصادی، بحران مسکن و کاهش شاخص بورس، شروع به محدود کردن صنعت معاملات کمّی کرد. شاخص CSI300 (شاخص سهام برتر چین) به پایینترین حد خود رسید و معاملهگران فرکانس بالا را مقصر اصلی این فروپاشی دانستند. High-Flyer با خطر انقراض مواجه شد.
در سال ۲۰۲۳ آنها تغییر جهت دادند. DeepSeek، یک آزمایشگاه هوش مصنوعی، با استفاده از استعدادهای موجود و ۱۰,۰۰۰ کارت گرافیک خود تأسیس کردند. بدون هیچ سرمایهگذاری خطرپذیر. آنها همه چیز را روی این شرط بستند.
آنها همان فلسفه استخدام خود را حفظ کردند: استخدام «فارغالتحصیلان نخبه» جای محققان باتجربه هوش مصنوعی.
مدیر عامل deepseek میگه: «هیچ جادوگری وجود ندارد. ما بیشتر فارغالتحصیلان جدید از دانشگاههای برتر، دانشجویان دکتری در سالهای چهارم یا پنجم و برخی جوانانی که چند سال پیش فارغالتحصیل شدهاند را استخدام میکنیم.»
شرکت DeepSeek در اوایل سال ۲۰۲۴ با معرفی DeepSeek v2 را ارائه کردند.
تا سپتامبر، آنها ابتدا مقالهی R1-lite-preview را به عنوان اولین مدلی که با مدل استدلالی o1 OpenAI رقابت میکرد، منتشر کردند، . این مدل با استفاده از یک تکنیک جدید یادگیری تقویتی (RL) که از محاسبات زمان استنتاج استفاده میکرد، از همه رقبا (متنباز یا اختصاصی) پیشی گرفت.
در کریسمس، آنها DeepSeek v3 ارائه کردند که با تنها ۶ میلیون دلار هزینه آموزش، با ChatGPT-4o و Claude 3.5 Sonnet رقابت کرد.
هزینههای API که ۲۰ تا ۵۰ برابر ارزانتر از رقبا است.
این هفته، آنها اولین مدل استدلالی کاملاً متنباز را منتشر کردند که با OpenAI o1 برابری میکرد. آنها یافتههای خود را بهصورت عمومی به اشتراک گذاشتند و فاش کردند که این مدل را تنها از طریق یادگیری تقویتی (RL) و بدون نیاز به تنظیم دقیق نظارتشده یا مدلسازی پاداش آموزش دادهاند.
و هزینههای API هنوز ۲۰ تا ۵۰ برابر ارزانتر از رقبا هستند:
مدل DeepSeek R1 حدود ۰.۱۴ تا ۰.۵۵ دلار برای هر ۱ میلیون توکن ورودی، ۲.۱۹ دلار برای هر ۱ میلیون توکن خروجی.
مدل OpenAI o1 حدود ۷.۵۰ تا ۱۵ دلار برای هر ۱ میلیون توکن ورودی، ۶۰ دلار برای هر ۱ میلیون توکن خروجی.
Source
@Ai_Events
شرکت deepseek که امروز همهمون از مدل رایگان بیمحدودیت deepseek v3 به وجود اومدیم و الان هم مدل متن باز رایگان R1 رو به عنوان رقیب برای o1 داده، چطوری شکل گرفته؟
این شرکت بدون هیچ سرمایهگذاری خطرپذیر، مدلی متنباز تولید کرد که با غولهایی مانند OpenAI و Anthropic رقابت میکند. مدلی که با یکدهم هزینه آموزش و ۲۰ تا ۵۰ برابر ارزانتر در استنتاج، به مرزهای جدیدی در هوش مصنوعی دست یافته است.
در سال ۲۰۰۷، سه مهندس به نامهای Xu Jin، Zheng Dawei و Liang Wenfeng (مدیرعامل فعلی) در دانشگاه Zhejiang با هم آشنا شدند و با هدف ساخت یک صندوق کمّی (Quant) که با هوش مصنوعی پیشرفته کار کند، دور هم جمع شدند. از آن زمان تا امروز یک استراتژی در جذب نیرو انسانی داشتند، به جای استخدام افراد باتجربه، آنها روی استعدادهای جوان و کنجکاو سرمایهگذاری کردند. مدیر مدیر عامل deepseek l میگه: «ما بیشتر نقشهای فنی را به فارغالتحصیلان جدید یا افرادی با ۱ تا ۲ سال تجربه سپردیم.».
این تیم به مدت ۸ سال بهطور خاموش روی ایدههای مختلف معاملات الگوریتمی کار کردند تا اینکه در سال ۲۰۱۵ شرکت High-Flyer را تأسیس کردند. فرهنگ استخدام و نوآوری آنها به خوبی جواب داد. تا سال ۲۰۲۱، آنها به موفقیتهای چشمگیری دست یافته بودند:
۱۴۰ میلیون دلار سرمایهگذاری و ساخت یک پلتفرم بزرگ هوش مصنوعی برای معاملات.
مالکیت ۱۰,۰۰۰ کارت گرافیک NVIDIA A100.
تبدیل شدن به یکی از ۴ صندوق کمّی برتر با ۱۵ میلیارد دلار دارایی تحت مدیریت (AUM).
اما سپس همه چیز فروپاشید. سال ۲۰۲۲ موفقیت High-Flyer به نقطه ضعف آن تبدیل شد. آنها خیلی بزرگ و سریع رشد کرده بودند و شروع به از دست دادن میلیاردها دلار کردند، طی چند فصل متوالی روی سرمایههای تحت مدیریتشون ضرر دادند و از شاخص بازار بورس چین عقب ماندند.
دولت چین در پی کندی اقتصادی، بحران مسکن و کاهش شاخص بورس، شروع به محدود کردن صنعت معاملات کمّی کرد. شاخص CSI300 (شاخص سهام برتر چین) به پایینترین حد خود رسید و معاملهگران فرکانس بالا را مقصر اصلی این فروپاشی دانستند. High-Flyer با خطر انقراض مواجه شد.
در سال ۲۰۲۳ آنها تغییر جهت دادند. DeepSeek، یک آزمایشگاه هوش مصنوعی، با استفاده از استعدادهای موجود و ۱۰,۰۰۰ کارت گرافیک خود تأسیس کردند. بدون هیچ سرمایهگذاری خطرپذیر. آنها همه چیز را روی این شرط بستند.
آنها همان فلسفه استخدام خود را حفظ کردند: استخدام «فارغالتحصیلان نخبه» جای محققان باتجربه هوش مصنوعی.
مدیر عامل deepseek میگه: «هیچ جادوگری وجود ندارد. ما بیشتر فارغالتحصیلان جدید از دانشگاههای برتر، دانشجویان دکتری در سالهای چهارم یا پنجم و برخی جوانانی که چند سال پیش فارغالتحصیل شدهاند را استخدام میکنیم.»
شرکت DeepSeek در اوایل سال ۲۰۲۴ با معرفی DeepSeek v2 را ارائه کردند.
تا سپتامبر، آنها ابتدا مقالهی R1-lite-preview را به عنوان اولین مدلی که با مدل استدلالی o1 OpenAI رقابت میکرد، منتشر کردند، . این مدل با استفاده از یک تکنیک جدید یادگیری تقویتی (RL) که از محاسبات زمان استنتاج استفاده میکرد، از همه رقبا (متنباز یا اختصاصی) پیشی گرفت.
در کریسمس، آنها DeepSeek v3 ارائه کردند که با تنها ۶ میلیون دلار هزینه آموزش، با ChatGPT-4o و Claude 3.5 Sonnet رقابت کرد.
هزینههای API که ۲۰ تا ۵۰ برابر ارزانتر از رقبا است.
این هفته، آنها اولین مدل استدلالی کاملاً متنباز را منتشر کردند که با OpenAI o1 برابری میکرد. آنها یافتههای خود را بهصورت عمومی به اشتراک گذاشتند و فاش کردند که این مدل را تنها از طریق یادگیری تقویتی (RL) و بدون نیاز به تنظیم دقیق نظارتشده یا مدلسازی پاداش آموزش دادهاند.
و هزینههای API هنوز ۲۰ تا ۵۰ برابر ارزانتر از رقبا هستند:
مدل DeepSeek R1 حدود ۰.۱۴ تا ۰.۵۵ دلار برای هر ۱ میلیون توکن ورودی، ۲.۱۹ دلار برای هر ۱ میلیون توکن خروجی.
مدل OpenAI o1 حدود ۷.۵۰ تا ۱۵ دلار برای هر ۱ میلیون توکن ورودی، ۶۰ دلار برای هر ۱ میلیون توکن خروجی.
Source
@Ai_Events
⭕ شرکت OpenAI از ابزار جدید Operator رونمایی کرد: تحولی در انجام کارهای اینترنتی
شرکت OpenAI، از ابزار جدید خود به نام Operator رونمایی کرده است که میتواند بهطور خودکار وظایف مختلف آنلاین را انجام دهد.
این ابزار با استفاده از مرورگر داخلی خود، قادر است صفحات وب را مشاهده کرده و با آنها تعامل کند. از جمله قابلیتهای آن میتوان به تایپ، کلیک و اسکرول در صفحات وب اشاره کرد.
همچنین Operator از هوش مصنوعی پیشرفته استفاده میکند و به کاربران این امکان را میدهد که بدون نیاز به انجام اقدامات دستی، کارهای اینترنتی خود را انجام دهند.
این ابزار ابتدا برای مشترکان نسخه پرو ChatGPT در آمریکا در دسترس خواهد بود و OpenAI قصد دارد آن را به سایر کاربران نیز گسترش دهد.
تو این ویدئو میتونید توضیحات و نحوه کارکردش رو با حضور آقای سم آلتمن ببینید:
https://youtu.be/CSE77wAdDLg
@Ai_Events
شرکت OpenAI، از ابزار جدید خود به نام Operator رونمایی کرده است که میتواند بهطور خودکار وظایف مختلف آنلاین را انجام دهد.
این ابزار با استفاده از مرورگر داخلی خود، قادر است صفحات وب را مشاهده کرده و با آنها تعامل کند. از جمله قابلیتهای آن میتوان به تایپ، کلیک و اسکرول در صفحات وب اشاره کرد.
همچنین Operator از هوش مصنوعی پیشرفته استفاده میکند و به کاربران این امکان را میدهد که بدون نیاز به انجام اقدامات دستی، کارهای اینترنتی خود را انجام دهند.
این ابزار ابتدا برای مشترکان نسخه پرو ChatGPT در آمریکا در دسترس خواهد بود و OpenAI قصد دارد آن را به سایر کاربران نیز گسترش دهد.
تو این ویدئو میتونید توضیحات و نحوه کارکردش رو با حضور آقای سم آلتمن ببینید:
https://youtu.be/CSE77wAdDLg
@Ai_Events
سخنرانی تخصصی دانشکده مهندسی کامپیوتر با همکاری انجمن علمی برگزار میشود:
هوش مصنوعی و استنتاج کاتورهای💻
توسط دکتر سیاوش ارجمند بیگدلی، دانشیار دانشگاه صنعتی دانمارک
زمان: شنبه ۶ بهمن، ساعت ۱۲:۳۰ الی ۱۳:۳۰
📍 مکان: آمفی تئاتر دانشکده مهندسی کامپیوتر دانشگاه امیرکبیر
@Ai_Events
هوش مصنوعی و استنتاج کاتورهای💻
توسط دکتر سیاوش ارجمند بیگدلی، دانشیار دانشگاه صنعتی دانمارک
زمان: شنبه ۶ بهمن، ساعت ۱۲:۳۰ الی ۱۳:۳۰
📍 مکان: آمفی تئاتر دانشکده مهندسی کامپیوتر دانشگاه امیرکبیر
@Ai_Events
انتشار کد، پارامترها و مقالهی مدل هوشمصنوعی DeepSeek-R1 تکاندهنده است. ارزیابیهای کمی، رقابت شانهبهشانهی آن با ChatGPT o1 را نشان میدهد. طبق تجربهی شخصی، این مدل در مواردی حتی بهتر از o1-pro عمل میکند. مهمتر از همه: رایگان است.
دکتر علی شریفزارچی
@Ai_Events
دکتر علی شریفزارچی
@Ai_Events
دکتر فرهاد نیلی:
در کنفرانس مدیریت نوآوری و فناوری، با عنوان «تجاریسازی هوش مصنوعی» در مورد استراتژیهای درآمدی هوش مصنوعی صحبت کردم.
لینک به ویدیو
لینک به پست
@Ai_Events
در کنفرانس مدیریت نوآوری و فناوری، با عنوان «تجاریسازی هوش مصنوعی» در مورد استراتژیهای درآمدی هوش مصنوعی صحبت کردم.
لینک به ویدیو
لینک به پست
@Ai_Events
Compositional Learning Journal Club
This Week's Presentation:
Title: Can We Generate Images with CoT? Let's Verify and Reinforce Image Generation Step by Step
Presenter: Amir Kasaei
Abstract:
This paper explores the use of Chain-of-Thought (CoT) reasoning to improve autoregressive image generation, an area not widely studied. The authors propose three techniques: scaling computation for verification, aligning preferences with Direct Preference Optimization (DPO), and integrating these methods for enhanced performance. They introduce two new reward models, PARM and PARM++, which adaptively assess and correct image generations. Their approach improves the Show-o model, achieving a +24% gain on the GenEval benchmark and surpassing Stable Diffusion 3 by +15%.
Papers: Can We Generate Images with CoT? Let's Verify and Reinforce Image Generation Step by Step
Session Details:
- Date: Sunday
- Time: 5:30 - 6:30 PM
- Location: Online at vc.sharif.edu/ch/rohban
@Ai_Events
This Week's Presentation:
Title: Can We Generate Images with CoT? Let's Verify and Reinforce Image Generation Step by Step
Presenter: Amir Kasaei
Abstract:
This paper explores the use of Chain-of-Thought (CoT) reasoning to improve autoregressive image generation, an area not widely studied. The authors propose three techniques: scaling computation for verification, aligning preferences with Direct Preference Optimization (DPO), and integrating these methods for enhanced performance. They introduce two new reward models, PARM and PARM++, which adaptively assess and correct image generations. Their approach improves the Show-o model, achieving a +24% gain on the GenEval benchmark and surpassing Stable Diffusion 3 by +15%.
Papers: Can We Generate Images with CoT? Let's Verify and Reinforce Image Generation Step by Step
Session Details:
- Date: Sunday
- Time: 5:30 - 6:30 PM
- Location: Online at vc.sharif.edu/ch/rohban
@Ai_Events
سقوط سنگین سهام Nvidia!
سهام شرکت انویدیا امروز با کاهش ۱۳ درصدی مواجه شده و بیش از ۵۰۰ میلیارد دلار از ارزش بازار این شرکت از بین رفت!
دلیلش هم اینه که میگن دیپسیک تونسته با تعداد بسیار کمتری پردازنده گرافیکی به نتایج خوبی برسه، پس تقاضای پردازنده گرافیکی کم خواهد شد.
#Nvidia #هوش_مصنوعی #بازار_سهام
#Nvidia #هوش_مصنوعی #بازار_سهام #تکنولوژی #کارت_گرافیک #اقتصاد_دیجیتال #فناوری_اطلاعات
@Ai_Events
سهام شرکت انویدیا امروز با کاهش ۱۳ درصدی مواجه شده و بیش از ۵۰۰ میلیارد دلار از ارزش بازار این شرکت از بین رفت!
دلیلش هم اینه که میگن دیپسیک تونسته با تعداد بسیار کمتری پردازنده گرافیکی به نتایج خوبی برسه، پس تقاضای پردازنده گرافیکی کم خواهد شد.
#Nvidia #هوش_مصنوعی #بازار_سهام
#Nvidia #هوش_مصنوعی #بازار_سهام #تکنولوژی #کارت_گرافیک #اقتصاد_دیجیتال #فناوری_اطلاعات
@Ai_Events
Ai Events️
سقوط سنگین سهام Nvidia! سهام شرکت انویدیا امروز با کاهش ۱۳ درصدی مواجه شده و بیش از ۵۰۰ میلیارد دلار از ارزش بازار این شرکت از بین رفت! دلیلش هم اینه که میگن دیپسیک تونسته با تعداد بسیار کمتری پردازنده گرافیکی به نتایج خوبی برسه، پس تقاضای پردازنده…
فقط همین ۵۰۰ میلیاردی که انویدیا از دست داده، تقریبا سه برابر کل بازار سرمایه ایرانه!!!
کاهش 1 تریلیون دلاری بورس آمریکا به دلیل سقوط سهام فناوری!
@Ai_Events
کاهش 1 تریلیون دلاری بورس آمریکا به دلیل سقوط سهام فناوری!
@Ai_Events
Ai Events️
فقط همین ۵۰۰ میلیاردی که انویدیا از دست داده، تقریبا سه برابر کل بازار سرمایه ایرانه!!! کاهش 1 تریلیون دلاری بورس آمریکا به دلیل سقوط سهام فناوری! @Ai_Events
You dont necessarly need Tanks and missles to start a war. Sometimes it’s just an AI model that cost 5m to train.
@Ai_Events
@Ai_Events