افشای اطلاعات جدید درباره Gemini توسط گوگل!
در این ویدیو، Ani Baddepudi، مدیر ارشد محصول رفتار مدلهای Gemini، در کانال رسمی توسعه دهندگان گوگل اطلاعات تازه ای منتشر کرد.
در گفت و گویی با Logan Kilpatrick (مدیر فعلی Google AI Studio و از اعضای پیشین OpenAI)، به سؤالات مهم و قدیمی کاربران درباره Gemini پاسخ میده:
سؤالات کلیدی که مطرح شد:
چرا Gemini از ابتدا به صورت چند رسانهای (Multimodal) طراحی شد؟
آیا تبدیل تصویر و ویدیو به توکن باعث از بین رفتن اطلاعات میشه؟
چرا نسخه ۲.۵ Gemini در درک ویدیو عملکرد فوق العادهای داره؟
و ده ها نکته فنی دیگه
گفت وگو تقریبا به طور کامل بر محور چند رسانهای بودن Gemini می چرخه، از فلسفه طراحی اولیه، تا کاربردهای فعلی و مسیر توسعه آینده
https://www.youtube.com/watch?v=K4vXvaRV0dw
در این ویدیو، Ani Baddepudi، مدیر ارشد محصول رفتار مدلهای Gemini، در کانال رسمی توسعه دهندگان گوگل اطلاعات تازه ای منتشر کرد.
در گفت و گویی با Logan Kilpatrick (مدیر فعلی Google AI Studio و از اعضای پیشین OpenAI)، به سؤالات مهم و قدیمی کاربران درباره Gemini پاسخ میده:
سؤالات کلیدی که مطرح شد:
چرا Gemini از ابتدا به صورت چند رسانهای (Multimodal) طراحی شد؟
آیا تبدیل تصویر و ویدیو به توکن باعث از بین رفتن اطلاعات میشه؟
چرا نسخه ۲.۵ Gemini در درک ویدیو عملکرد فوق العادهای داره؟
و ده ها نکته فنی دیگه
گفت وگو تقریبا به طور کامل بر محور چند رسانهای بودن Gemini می چرخه، از فلسفه طراحی اولیه، تا کاربردهای فعلی و مسیر توسعه آینده
https://www.youtube.com/watch?v=K4vXvaRV0dw
YouTube
Release Notes: Gemini's multimodality
Ani Baddepudi, Gemini Model Behavior Product Lead, joins host Logan Kilpatrick for a deep dive into Gemini's multimodal capabilities. Their conversation explores why Gemini was built as a natively multimodal model from day one, the future of proactive AI…
Tensorflow(@CVision)
توی این پست در پاسخ در جواب به نقد یکی از مخاطبین گفتم که مدلهای مبتنی بر زبان (مانند chatgpt) نمیتونن درک واقعی انسان از جهان رو بازسازی کنن، چرا که زبان تنها نشانه هایی آماری هست و ریشه در ساختار فیزیکی نداره. در واقع مدل های زبانی به جهان واژگان تکیه…
مصاحبه کامل FEI FEI Li درباره wold models
ایشون معتقده بدون توانایی درک، مدل سازی و تعامل در دنیای سه بعدی، AGI ناقص خواهد بود.
https://www.youtube.com/watch?v=_PioN-CpOP0
ایشون معتقده بدون توانایی درک، مدل سازی و تعامل در دنیای سه بعدی، AGI ناقص خواهد بود.
https://www.youtube.com/watch?v=_PioN-CpOP0
YouTube
Fei-Fei Li: Spatial Intelligence is the Next Frontier in AI
A fireside with Dr. Fei-Fei Li on June 16, 2025 at AI Startup School in San Francisco.
Dr. Fei-Fei Li is often called the godmother of AI—and for good reason. Before the world had AI as we know it, she was helping build the foundation.
In this fireside…
Dr. Fei-Fei Li is often called the godmother of AI—and for good reason. Before the world had AI as we know it, she was helping build the foundation.
In this fireside…
🔍 معرفی داشبورد LLM Leaderboard از klu.ai
💡 اگر با مدلهای زبان بزرگ (LLM) سروکار دارید یا علاقهمند به مقایسه قدرت و عملکرد مدلهای مختلف هستید، داشبورد LLM Leaderboard از Klu یک ابزار فوقالعاده برای شماست.
📊 این داشبورد، یک نمای دقیق و بهروز از عملکرد مدلهای مطرح هوش مصنوعی (مثل GPT-4، Claude، Gemini، Mistral و غیره) ارائه میدهد. دادهها شامل ارزیابی کیفیت پاسخ، دقت، توانایی کدنویسی، استدلال و تطبیق با نیاز کاربران در سناریوهای واقعی هستند.
🧪 ارزیابیها بر پایه تستهای کاربردی و روزمره طراحی شدهاند، نه فقط بنچمارکهای مصنوعی، و شامل تحلیلهای دستهبندیشده برای کاربردهای مختلف (مثل برنامهنویسی، تحلیل متنی، خلاصهسازی و ...) هستند.
⚙️ ویژگیهای کلیدی: مقایسه لحظهای عملکرد مدلها - امکان فیلتر نتایج بر اساس تسکها - نمایش رتبهبندی مدلها بر اساس نوع کاربرد - دادههای قابل اعتماد با بهروزرسانی مداوم
🔗 مشاهده داشبورد 🔗
🌀 @cvision 🌀
💡 اگر با مدلهای زبان بزرگ (LLM) سروکار دارید یا علاقهمند به مقایسه قدرت و عملکرد مدلهای مختلف هستید، داشبورد LLM Leaderboard از Klu یک ابزار فوقالعاده برای شماست.
📊 این داشبورد، یک نمای دقیق و بهروز از عملکرد مدلهای مطرح هوش مصنوعی (مثل GPT-4، Claude، Gemini، Mistral و غیره) ارائه میدهد. دادهها شامل ارزیابی کیفیت پاسخ، دقت، توانایی کدنویسی، استدلال و تطبیق با نیاز کاربران در سناریوهای واقعی هستند.
🧪 ارزیابیها بر پایه تستهای کاربردی و روزمره طراحی شدهاند، نه فقط بنچمارکهای مصنوعی، و شامل تحلیلهای دستهبندیشده برای کاربردهای مختلف (مثل برنامهنویسی، تحلیل متنی، خلاصهسازی و ...) هستند.
⚙️ ویژگیهای کلیدی: مقایسه لحظهای عملکرد مدلها - امکان فیلتر نتایج بر اساس تسکها - نمایش رتبهبندی مدلها بر اساس نوع کاربرد - دادههای قابل اعتماد با بهروزرسانی مداوم
🔗 مشاهده داشبورد 🔗
🌀 @cvision 🌀
🔎 مقایسه قیمت و کارایی مدلهای هوش مصنوعی – راحت و شفاف!
🧠💰 + 🤖 = ❓
اگه توی پروژههات با مدلهای زبانی (LLM) مثل GPT، Claude، Mistral یا ... کار میکنی، حتماً برات مهمه که بدونی کدوم مدل چقدر هزینه و ارزش خرج کردن رو داره.
اینجا ابزار llmpricecheck.com به کمکت میاد 👇
✨ ویژگیهای کلیدی:
📌 مقایسه مدلها از نظر قیمت بهازای توکن
📌 بررسی کیفیت پاسخ در سناریوهای واقعی
📌 تحلیل بهرهوری (quality per $) برای استفاده هوشمندانه از بودجه
📌 جدولهای قابل فیلتر و مرتبسازی برای تصمیمگیری دقیقتر
🔥 چه برنامهنویس باشی، چه تیم محصول یا پژوهشگر، این ابزار یه نگاه سریع و شفاف میده به اینکه پولتو کجا خرج کنی که بیشترین خروجی رو بگیری.
🔗 لینک مشاهده 🔗
🌀 @cvision 🌀
🧠💰 + 🤖 = ❓
اگه توی پروژههات با مدلهای زبانی (LLM) مثل GPT، Claude، Mistral یا ... کار میکنی، حتماً برات مهمه که بدونی کدوم مدل چقدر هزینه و ارزش خرج کردن رو داره.
اینجا ابزار llmpricecheck.com به کمکت میاد 👇
✨ ویژگیهای کلیدی:
📌 مقایسه مدلها از نظر قیمت بهازای توکن
📌 بررسی کیفیت پاسخ در سناریوهای واقعی
📌 تحلیل بهرهوری (quality per $) برای استفاده هوشمندانه از بودجه
📌 جدولهای قابل فیلتر و مرتبسازی برای تصمیمگیری دقیقتر
🔥 چه برنامهنویس باشی، چه تیم محصول یا پژوهشگر، این ابزار یه نگاه سریع و شفاف میده به اینکه پولتو کجا خرج کنی که بیشترین خروجی رو بگیری.
🔗 لینک مشاهده 🔗
🌀 @cvision 🌀