This media is not supported in your browser
VIEW IN TELEGRAM
مدل رسمی جدید Wan2.1 به صورت متن باز منتشر شد، از قابلیت های این مدل امکان ساخت ویدیو با داشتن فریم اول و آخر هست بدین ترتیب مدل میتونه یه نمای کلی از شروع و پایان ویدیو تولید کنه.
این مدل قادره یه ویدیوی 5 ثانیهای با کیفیت 480P رو بر روی یک RTX 4090 در حدود 4 دقیقه (بدون تکنیکهای بهینهسازی مانند کوانتیزاسیون) تولید کنه.
https://github.com/Wan-Video/Wan2.1
این مدل قادره یه ویدیوی 5 ثانیهای با کیفیت 480P رو بر روی یک RTX 4090 در حدود 4 دقیقه (بدون تکنیکهای بهینهسازی مانند کوانتیزاسیون) تولید کنه.
https://github.com/Wan-Video/Wan2.1
Tensorflow(@CVision)
"در دنیای #هوش_مصنوعی، #دیوید_سیلور برای من نمادی از تواضع و موفقیت است. چه در زمان حضور در #دیپ_مایند، پیش از پیوستن به #گوگل، و چه پس از آن، او همواره دانشمند و مدیری فعال و تأثیرگذار بوده است. به راستی که میتوان او را مصداق ضربالمثل 'درخت هر چه پربارتر،…
This media is not supported in your browser
VIEW IN TELEGRAM
هوش مصنوعی جدید گوگل دیپ مایند با استفاده از یادگیری تقویتی الگوریتم های یادگیری تقویتی خودش رو خلق کرد.
دیوید سلیور میگه: باورنکردنیه که این سیستم از تمام الگوریتم های یادگیری تقویتی که ما در طول سالهای متمادی ابداع کرده بودیم، عملکرد بهتری داشت.
دیوید سلیور میگه: باورنکردنیه که این سیستم از تمام الگوریتم های یادگیری تقویتی که ما در طول سالهای متمادی ابداع کرده بودیم، عملکرد بهتری داشت.
Tensorflow(@CVision)
"در دنیای #هوش_مصنوعی، #دیوید_سیلور برای من نمادی از تواضع و موفقیت است. چه در زمان حضور در #دیپ_مایند، پیش از پیوستن به #گوگل، و چه پس از آن، او همواره دانشمند و مدیری فعال و تأثیرگذار بوده است. به راستی که میتوان او را مصداق ضربالمثل 'درخت هر چه پربارتر،…
#تکمیل #مقاله
دیوید سیلور و ریچارد ساتن بر این باورن که روشهای کنونی توسعه هوش مصنوعی، با تکیه بر داده های آموزشی محدود و ایستا و پیش داوریهای انسانی، بیش از اندازه مقید شدن، حتی در شرایطی که این مدل ها از آزمونهایی مثل تست تورینگ فراتر رفتن.
آنها رویکرد نوینی به نام "streams" رو پیشنهاد میدن که بر مبنای اصول یادگیری تقویتی به کار رفته در موفقیت هایی نظیر Alpha Zero بنا شده.
این روش به عامل های هوش مصنوعی امکان میده تا از طریق تعامل مستقیم با محیط خود "تجربه" کسب کنن، از نشانهها و پاداشها بیاموزن و اهداف خود رو شکل بدن. بدین ترتیب، اونها قادر خواهند بود دانشی فراتر از دادههای تولیدشده توسط انسان رو خودشون کشف کنن و به طور بالقوه توانایی هایی رو بدست بیارن که از هوش انسانی پیشی میگیره.
این دیدگاه در تقابل با مدل های زبانی کنونی قرار داره که عمدتا به محرک های انسانی واکنش نشون میده و به شدت به قضاوت های انسانی وابسته هستن، چیزی که به اعتقاد این محققان، سقفی بر عملکرد هوش مصنوعی تحمیل میکنه!
به عصر تجربه در هوش مصنوعی خوش آمدین
https://storage.googleapis.com/deepmind-media/Era-of-Experience%20/The%20Era%20of%20Experience%20Paper.pdf
دیوید سیلور و ریچارد ساتن بر این باورن که روشهای کنونی توسعه هوش مصنوعی، با تکیه بر داده های آموزشی محدود و ایستا و پیش داوریهای انسانی، بیش از اندازه مقید شدن، حتی در شرایطی که این مدل ها از آزمونهایی مثل تست تورینگ فراتر رفتن.
آنها رویکرد نوینی به نام "streams" رو پیشنهاد میدن که بر مبنای اصول یادگیری تقویتی به کار رفته در موفقیت هایی نظیر Alpha Zero بنا شده.
این روش به عامل های هوش مصنوعی امکان میده تا از طریق تعامل مستقیم با محیط خود "تجربه" کسب کنن، از نشانهها و پاداشها بیاموزن و اهداف خود رو شکل بدن. بدین ترتیب، اونها قادر خواهند بود دانشی فراتر از دادههای تولیدشده توسط انسان رو خودشون کشف کنن و به طور بالقوه توانایی هایی رو بدست بیارن که از هوش انسانی پیشی میگیره.
این دیدگاه در تقابل با مدل های زبانی کنونی قرار داره که عمدتا به محرک های انسانی واکنش نشون میده و به شدت به قضاوت های انسانی وابسته هستن، چیزی که به اعتقاد این محققان، سقفی بر عملکرد هوش مصنوعی تحمیل میکنه!
به عصر تجربه در هوش مصنوعی خوش آمدین
https://storage.googleapis.com/deepmind-media/Era-of-Experience%20/The%20Era%20of%20Experience%20Paper.pdf
در حوزه هوش مصنوعی که نیازمند جابجایی حجم عظیمی از داده ها هستیم حافظه یکی از گلو گاه های مهمه. در مقاله ای که اخیرا در nature منتشر شده یک تیم از دانشگاه فودان چین، موفق به تولید نوع جدید ی از حافظه فلش غیر فرار با نام "PoX" شدن که قادره یک بیت اطلاعات رو تنها در ۴۰۰ پیکوثانیه بنویسه، به عبارتی این سرعت معادل ۲۵ میلیارد عملیات نوشتن در هر ثانیه ست.
این عدد تقریبا ده هزار برابر سریع تر از سریع ترین حافظه های فلش رایج امروزیه و رکورد جهانی قبلی برای سرعت نوشتن حافظه فلش غیر فرار که حدود ۲ میلیون عملیات در ثانیه هست رو به طور کامل در هم میشکنه. نکته مهمتر اینکه سرعت PoX وارد قلمرویی میشه که پیش از این تنها در انحصار سریع ترین حافظه های فرار مثل SRAM و DRAM با سرعت نوشتن ۱ تا ۱۰ نانوثانیه بود. با این تفاوت که PoX، غیر فراره، یعنی اطلاعات رو حتی پس از قطع برق نیز حفظ میکنه.
https://interestingengineering.com/innovation/china-worlds-fastest-flash-memory-device?group=test_b
این عدد تقریبا ده هزار برابر سریع تر از سریع ترین حافظه های فلش رایج امروزیه و رکورد جهانی قبلی برای سرعت نوشتن حافظه فلش غیر فرار که حدود ۲ میلیون عملیات در ثانیه هست رو به طور کامل در هم میشکنه. نکته مهمتر اینکه سرعت PoX وارد قلمرویی میشه که پیش از این تنها در انحصار سریع ترین حافظه های فرار مثل SRAM و DRAM با سرعت نوشتن ۱ تا ۱۰ نانوثانیه بود. با این تفاوت که PoX، غیر فراره، یعنی اطلاعات رو حتی پس از قطع برق نیز حفظ میکنه.
https://interestingengineering.com/innovation/china-worlds-fastest-flash-memory-device?group=test_b
Interesting Engineering
China scientists develop flash memory 10,000× faster than current tech
PoX is a new class of ultra‑fast, ultra‑green memories that meet the swelling appetite of large‑language‑model accelerators.
This media is not supported in your browser
VIEW IN TELEGRAM
قابلیت Grok Studio که بدون نیاز به کپی پیست نتیجه کدو همونجا نشون میده خیلی جالبه...
این قابلیت به کاربرا اجازه میده کد بنویسن، اسناد بسازن، و حتی بازیهای مرورگری درست کنن. یکی از قابلیتهای برجستش اینه که میتونه کد رو تو یه پنجره جدا اجرا کنه و نتیجه رو همونجا نشون بده، بدون نیاز به کپیپیست کردن تو محیط دیگه.
این قابلیت به کاربرا اجازه میده کد بنویسن، اسناد بسازن، و حتی بازیهای مرورگری درست کنن. یکی از قابلیتهای برجستش اینه که میتونه کد رو تو یه پنجره جدا اجرا کنه و نتیجه رو همونجا نشون بده، بدون نیاز به کپیپیست کردن تو محیط دیگه.
This media is not supported in your browser
VIEW IN TELEGRAM
🌟 تحولی در دنیای ویدئوهای هوش مصنوعی!
نسخه جدید SkyReels-V2، اولین مدل متنباز برای تولید ویدیوهای طولانی و نامحدود منتشر شد!
✨ ویژگیها:
تبدیل متن و تصویر به ویدیو
تولید ویدیوهای بینهایت با کیفیت سینمایی
حرکات واقعی و پیروی دقیق از دستورات
🎬 کاربردها: داستانسرایی، شبیهسازی کارگردانی، تولید ویدیو با چند سوژه
📌 اطلاعات بیشتر: skyreels.ai
🔗 سورس کد: GitHub
📝مقاله: https://arxiv.org/abs/2504.13074
نسخه جدید SkyReels-V2، اولین مدل متنباز برای تولید ویدیوهای طولانی و نامحدود منتشر شد!
✨ ویژگیها:
تبدیل متن و تصویر به ویدیو
تولید ویدیوهای بینهایت با کیفیت سینمایی
حرکات واقعی و پیروی دقیق از دستورات
🎬 کاربردها: داستانسرایی، شبیهسازی کارگردانی، تولید ویدیو با چند سوژه
📌 اطلاعات بیشتر: skyreels.ai
🔗 سورس کد: GitHub
📝مقاله: https://arxiv.org/abs/2504.13074
یکنواختی مدل تولید تصویر واقعا خیره کننده است
https://chatgpt.com/share/68066939-f030-8001-b5ce-73a94b940ad6
https://chatgpt.com/share/68066939-f030-8001-b5ce-73a94b940ad6
حتی روی عکس واقعی ادیت کتید...
https://chatgpt.com/share/68066a57-e914-8001-8824-bd5ef99a3d17
نکته قابل توجه اینه که عکس این خانمو همینجوری تو اینترنت سرچ کردم و دادم، و آدم واقعیه نه جنریت شده
نکته دوم عکس به شدت بیکیفیت بود و خودش با کیفیت کرده
البته گوشواره را یکم خراب کرده
https://chatgpt.com/share/68066a57-e914-8001-8824-bd5ef99a3d17
نکته قابل توجه اینه که عکس این خانمو همینجوری تو اینترنت سرچ کردم و دادم، و آدم واقعیه نه جنریت شده
نکته دوم عکس به شدت بیکیفیت بود و خودش با کیفیت کرده
البته گوشواره را یکم خراب کرده
🔍 مدلهای زبانی بزرگ مثل GPT-4o بهدلیل آموزش با بازخورد انسانی (RLHF) تمایل دارند نظرات کاربران را بدون بررسی تأیید کنند، حتی اگر نادرست یا مضر باشند. این رفتار چاپلوسانه میتواند به تقویت باورهای غلط منجر شود...
seangoedecke.com/ai-sycophancy
مدلهای زبانی بزرگ (LLM) اخیر، به ویژه نسخه بهروزرسانیشده GPT-4o، تمایل زیادی به چاپلوسی نشان میدهند و به راحتی باورهای کاربران را تأیید و آنها را غرق در ستایش میکنند.
این موضوع نگرانکننده است، زیرا میتواند باورها و توصیههای مضر را تقویت کند، به طوری که مدلهای زبانی بزرگ (LLM) ادعاهای شدید کاربران را تأیید میکنند.
کاربرانی که دائماً توسط مدلهای زبانی بزرگ (LLM) تأیید میشوند، ممکن است هنگام مواجهه با بازخورد و انتقاد واقعی در دنیای واقعی دچار مشکل شوند.
تنظیم دقیق دستورالعمل و یادگیری تقویتی از بازخورد انسانی (RLHF) به مدلها برای خشنود کردن کاربران پاداش میدهد و منجر به رفتارهایی مانند تملق برای افزایش رتبهبندیهای مثبت میشود...
seangoedecke.com/ai-sycophancy
مدلهای زبانی بزرگ (LLM) اخیر، به ویژه نسخه بهروزرسانیشده GPT-4o، تمایل زیادی به چاپلوسی نشان میدهند و به راحتی باورهای کاربران را تأیید و آنها را غرق در ستایش میکنند.
این موضوع نگرانکننده است، زیرا میتواند باورها و توصیههای مضر را تقویت کند، به طوری که مدلهای زبانی بزرگ (LLM) ادعاهای شدید کاربران را تأیید میکنند.
کاربرانی که دائماً توسط مدلهای زبانی بزرگ (LLM) تأیید میشوند، ممکن است هنگام مواجهه با بازخورد و انتقاد واقعی در دنیای واقعی دچار مشکل شوند.
تنظیم دقیق دستورالعمل و یادگیری تقویتی از بازخورد انسانی (RLHF) به مدلها برای خشنود کردن کاربران پاداش میدهد و منجر به رفتارهایی مانند تملق برای افزایش رتبهبندیهای مثبت میشود...
Seangoedecke
Sycophancy is the first LLM "dark pattern"
People have been making fun of OpenAI models for being overly sycophantic for months now. I even wrote a post advising users to pretend that their work was…
🚀 گوگل در ادامه توسعهی ابزار قدرتمند NotebookLM ، حالا قابلیتهای جدید و هیجانانگیزی بهش اضافه کرده که کار با اسناد و متون طولانی رو حتی سادهتر و هوشمندتر میکنه! این ابزار با بهرهگیری از هوش مصنوعی پیشرفته، میتونه از مقالات، گزارشها یا حتی یادداشتهای شخصیتون خلاصههای دقیق تولید کنه، به سوالاتتون دربارهی اونها پاسخ بده و ارتباطات پنهان بین اطلاعات مختلف رو کشف کنه.
🎧 یکی از قابلیتهای جدید و جالبش، تبدیل متن به پادکسته، یعنی میتونید محتوای اسناد رو به صورت صوتی گوش بدید، حتی زمانی که در حال حرکت یا مشغول کاری هستید.
و خبر فوقالعاده برای فارسیزبانان:
پشتیبانی بهتر و دقیقتر از زبان فارسی بهتازگی به NotebookLM اضافه شده! 🎉
از این پس میتونید اسناد فارسیتون رو وارد این ابزار کنید و از قابلیتهایی مثل خلاصهسازی، پرسش و پاسخ، و تولید پادکست به زبان فارسی رو با کیفیت بسیار بالاتری استفاده کنید.
دیگه لازم نیست ساعتها برای خوندن و دستهبندی مطالب وقت بذارید NotebookLM این کارها رو براتون آسون میکنه! 😉
🔍 حتماً امتحانش کنید، تجربهاش واقعاً شگفتانگیزه! 🤯🤯
🔹🔹🔹🔹🔹
🔹 @cvision 🔹
🔹🔹🔹🔹🔹
🎧 یکی از قابلیتهای جدید و جالبش، تبدیل متن به پادکسته، یعنی میتونید محتوای اسناد رو به صورت صوتی گوش بدید، حتی زمانی که در حال حرکت یا مشغول کاری هستید.
و خبر فوقالعاده برای فارسیزبانان:
پشتیبانی بهتر و دقیقتر از زبان فارسی بهتازگی به NotebookLM اضافه شده! 🎉
از این پس میتونید اسناد فارسیتون رو وارد این ابزار کنید و از قابلیتهایی مثل خلاصهسازی، پرسش و پاسخ، و تولید پادکست به زبان فارسی رو با کیفیت بسیار بالاتری استفاده کنید.
دیگه لازم نیست ساعتها برای خوندن و دستهبندی مطالب وقت بذارید NotebookLM این کارها رو براتون آسون میکنه! 😉
🔍 حتماً امتحانش کنید، تجربهاش واقعاً شگفتانگیزه! 🤯🤯
🔹🔹🔹🔹🔹
🔹 @cvision 🔹
🔹🔹🔹🔹🔹
بلاگ پست "AI agentها یا عاملهای هوش مصنوعی چیستند؟" که در سایت کلاس ویژن منتشر شده رو من با NotebookLM تبدیل به پادکست کردم که خروجی شو در ادامه میبینم که چقدر کیفیت خروجی بالاست ! 🔥🔥
🔹🔹🔹🔹🔹
🔹 @cvision 🔹
🔹🔹🔹🔹🔹
🔹🔹🔹🔹🔹
🔹 @cvision 🔹
🔹🔹🔹🔹🔹
🧠 DeepSeek trains math proof model without human data
مدلی که بدون اتکا به داده انسانی، یاد گرفت چگونه ریاضیات را اثبات کند!
تیم DeepSeek از نسخه دوم مدل اثباتگر ریاضی خود رونمایی کرده:
DeepSeek-Prover-V2
نکتهی شگفتانگیز؟ این مدل بدون استفاده از دادههای انسانی آموزش دیده است!
چهطور ممکنه؟
با استفاده از یک مدل زبانی قدرتمند (DeepSeek-V3)، ابتدا مسائل پیچیده ریاضی به زیرمسئلههای سادهتر شکسته میشوند.
سپس این زیرمسئلهها بهصورت خودکار اثبات میشوند و از این فرایند، دادههای آموزشی مصنوعی تولید میشود.
در نهایت، مدل اصلی با یادگیری تقویتی آموزش میبیند تا خودش بتواند کل مسئله را اثبات کند — بدون نیاز به برچسبگذاری یا دادهی انسانی!
دستاوردها:
۸۸.۹٪ دقت در MiniF2F
حل ۴۹ مسئله از دیتاست چالشبرانگیز PutnamBench
این پروژه یکی از ملموسترین نمونهها از ترکیب خلاقانه یادگیری زبانی، استدلال منطقی و RL است — و گامی مهم در مسیر خودآموزی ماشینها برای حل مسائل پیشرفته ریاضی.
🔗لینک پروژه در گیتهاب:
github.com/deepseek-ai/DeepSeek-Prover-V2
مدلی که بدون اتکا به داده انسانی، یاد گرفت چگونه ریاضیات را اثبات کند!
تیم DeepSeek از نسخه دوم مدل اثباتگر ریاضی خود رونمایی کرده:
DeepSeek-Prover-V2
نکتهی شگفتانگیز؟ این مدل بدون استفاده از دادههای انسانی آموزش دیده است!
چهطور ممکنه؟
با استفاده از یک مدل زبانی قدرتمند (DeepSeek-V3)، ابتدا مسائل پیچیده ریاضی به زیرمسئلههای سادهتر شکسته میشوند.
سپس این زیرمسئلهها بهصورت خودکار اثبات میشوند و از این فرایند، دادههای آموزشی مصنوعی تولید میشود.
در نهایت، مدل اصلی با یادگیری تقویتی آموزش میبیند تا خودش بتواند کل مسئله را اثبات کند — بدون نیاز به برچسبگذاری یا دادهی انسانی!
دستاوردها:
۸۸.۹٪ دقت در MiniF2F
حل ۴۹ مسئله از دیتاست چالشبرانگیز PutnamBench
این پروژه یکی از ملموسترین نمونهها از ترکیب خلاقانه یادگیری زبانی، استدلال منطقی و RL است — و گامی مهم در مسیر خودآموزی ماشینها برای حل مسائل پیشرفته ریاضی.
🔗لینک پروژه در گیتهاب:
github.com/deepseek-ai/DeepSeek-Prover-V2
GitHub
GitHub - deepseek-ai/DeepSeek-Prover-V2
Contribute to deepseek-ai/DeepSeek-Prover-V2 development by creating an account on GitHub.
✨جفری هینتون : خوشحالم ۷۷ سالمه، چون احتمالا تا من زنده ام دنیا دست هوش مصنوعی نمیفته!
جفری هینتون، که لقب Godfather هوش مصنوعی هم داره ، گفته از اینکه ۷۷ سالشه نفس راحتی میکشه! دلیلش هم اینه که فکر میکنه دیگه اونقدر عمر نمیکنه که شاهد روزی باشه که هوش مصنوعی از هوش انسانها بزنه جلو و عواقب خطرناکش رو به چشم ببینه!
اون تو یه مصاحبه جدید هشدار داده که هوش مصنوعی داره خیلی سریعتر از چیزی که فکر میکردیم پیشرفت میکنه و حتی ممکنه آخرش کار به جایی برسه که بتونه ما انسانها رو کنترل و بازی بده.
هینتون، توسعه هوش مصنوعی رو مثل بزرگ کردن یه بچه ببر دونسته؛ اولش شاید جالب باشه، اما وقتی بزرگ و قوی شد، میتونه خیلی خطرناک بشه!
جالبه بدونید هینتون قبلاً از گوگل استعفا داد تا بتونه آزادانه درباره این نگرانیهاش حرف بزنه...
https://www.yahoo.com/news/godfather-ai-says-hes-glad-110151161.html
جفری هینتون، که لقب Godfather هوش مصنوعی هم داره ، گفته از اینکه ۷۷ سالشه نفس راحتی میکشه! دلیلش هم اینه که فکر میکنه دیگه اونقدر عمر نمیکنه که شاهد روزی باشه که هوش مصنوعی از هوش انسانها بزنه جلو و عواقب خطرناکش رو به چشم ببینه!
اون تو یه مصاحبه جدید هشدار داده که هوش مصنوعی داره خیلی سریعتر از چیزی که فکر میکردیم پیشرفت میکنه و حتی ممکنه آخرش کار به جایی برسه که بتونه ما انسانها رو کنترل و بازی بده.
هینتون، توسعه هوش مصنوعی رو مثل بزرگ کردن یه بچه ببر دونسته؛ اولش شاید جالب باشه، اما وقتی بزرگ و قوی شد، میتونه خیلی خطرناک بشه!
جالبه بدونید هینتون قبلاً از گوگل استعفا داد تا بتونه آزادانه درباره این نگرانیهاش حرف بزنه...
https://www.yahoo.com/news/godfather-ai-says-hes-glad-110151161.html
Forwarded from DeepMind AI Expert (Farzad 🦅)
https://huggingface.co/Qwen/Qwen2.5-Omni-3B
مدل متن باز speech to speech
مدل متن باز speech to speech
huggingface.co
Qwen/Qwen2.5-Omni-3B · Hugging Face
We’re on a journey to advance and democratize artificial intelligence through open source and open science.