This media is not supported in your browser
VIEW IN TELEGRAM
🌟 تحولی در دنیای ویدئوهای هوش مصنوعی!
نسخه جدید SkyReels-V2، اولین مدل متنباز برای تولید ویدیوهای طولانی و نامحدود منتشر شد!
✨ ویژگیها:
تبدیل متن و تصویر به ویدیو
تولید ویدیوهای بینهایت با کیفیت سینمایی
حرکات واقعی و پیروی دقیق از دستورات
🎬 کاربردها: داستانسرایی، شبیهسازی کارگردانی، تولید ویدیو با چند سوژه
📌 اطلاعات بیشتر: skyreels.ai
🔗 سورس کد: GitHub
📝مقاله: https://arxiv.org/abs/2504.13074
نسخه جدید SkyReels-V2، اولین مدل متنباز برای تولید ویدیوهای طولانی و نامحدود منتشر شد!
✨ ویژگیها:
تبدیل متن و تصویر به ویدیو
تولید ویدیوهای بینهایت با کیفیت سینمایی
حرکات واقعی و پیروی دقیق از دستورات
🎬 کاربردها: داستانسرایی، شبیهسازی کارگردانی، تولید ویدیو با چند سوژه
📌 اطلاعات بیشتر: skyreels.ai
🔗 سورس کد: GitHub
📝مقاله: https://arxiv.org/abs/2504.13074
👍16❤🔥6
یکنواختی مدل تولید تصویر واقعا خیره کننده است
https://chatgpt.com/share/68066939-f030-8001-b5ce-73a94b940ad6
https://chatgpt.com/share/68066939-f030-8001-b5ce-73a94b940ad6
1😱15👍6👌2
حتی روی عکس واقعی ادیت کتید...
https://chatgpt.com/share/68066a57-e914-8001-8824-bd5ef99a3d17
نکته قابل توجه اینه که عکس این خانمو همینجوری تو اینترنت سرچ کردم و دادم، و آدم واقعیه نه جنریت شده
نکته دوم عکس به شدت بیکیفیت بود و خودش با کیفیت کرده
البته گوشواره را یکم خراب کرده
https://chatgpt.com/share/68066a57-e914-8001-8824-bd5ef99a3d17
نکته قابل توجه اینه که عکس این خانمو همینجوری تو اینترنت سرچ کردم و دادم، و آدم واقعیه نه جنریت شده
نکته دوم عکس به شدت بیکیفیت بود و خودش با کیفیت کرده
البته گوشواره را یکم خراب کرده
1👌23👍15😱7
🔍 مدلهای زبانی بزرگ مثل GPT-4o بهدلیل آموزش با بازخورد انسانی (RLHF) تمایل دارند نظرات کاربران را بدون بررسی تأیید کنند، حتی اگر نادرست یا مضر باشند. این رفتار چاپلوسانه میتواند به تقویت باورهای غلط منجر شود...
seangoedecke.com/ai-sycophancy
مدلهای زبانی بزرگ (LLM) اخیر، به ویژه نسخه بهروزرسانیشده GPT-4o، تمایل زیادی به چاپلوسی نشان میدهند و به راحتی باورهای کاربران را تأیید و آنها را غرق در ستایش میکنند.
این موضوع نگرانکننده است، زیرا میتواند باورها و توصیههای مضر را تقویت کند، به طوری که مدلهای زبانی بزرگ (LLM) ادعاهای شدید کاربران را تأیید میکنند.
کاربرانی که دائماً توسط مدلهای زبانی بزرگ (LLM) تأیید میشوند، ممکن است هنگام مواجهه با بازخورد و انتقاد واقعی در دنیای واقعی دچار مشکل شوند.
تنظیم دقیق دستورالعمل و یادگیری تقویتی از بازخورد انسانی (RLHF) به مدلها برای خشنود کردن کاربران پاداش میدهد و منجر به رفتارهایی مانند تملق برای افزایش رتبهبندیهای مثبت میشود...
seangoedecke.com/ai-sycophancy
مدلهای زبانی بزرگ (LLM) اخیر، به ویژه نسخه بهروزرسانیشده GPT-4o، تمایل زیادی به چاپلوسی نشان میدهند و به راحتی باورهای کاربران را تأیید و آنها را غرق در ستایش میکنند.
این موضوع نگرانکننده است، زیرا میتواند باورها و توصیههای مضر را تقویت کند، به طوری که مدلهای زبانی بزرگ (LLM) ادعاهای شدید کاربران را تأیید میکنند.
کاربرانی که دائماً توسط مدلهای زبانی بزرگ (LLM) تأیید میشوند، ممکن است هنگام مواجهه با بازخورد و انتقاد واقعی در دنیای واقعی دچار مشکل شوند.
تنظیم دقیق دستورالعمل و یادگیری تقویتی از بازخورد انسانی (RLHF) به مدلها برای خشنود کردن کاربران پاداش میدهد و منجر به رفتارهایی مانند تملق برای افزایش رتبهبندیهای مثبت میشود...
Seangoedecke
Sycophancy is the first LLM "dark pattern"
People have been making fun of OpenAI models for being overly sycophantic for months now. I even wrote a post advising users to pretend that their work was…
👍38👏2👌2❤1
🚀 گوگل در ادامه توسعهی ابزار قدرتمند NotebookLM ، حالا قابلیتهای جدید و هیجانانگیزی بهش اضافه کرده که کار با اسناد و متون طولانی رو حتی سادهتر و هوشمندتر میکنه! این ابزار با بهرهگیری از هوش مصنوعی پیشرفته، میتونه از مقالات، گزارشها یا حتی یادداشتهای شخصیتون خلاصههای دقیق تولید کنه، به سوالاتتون دربارهی اونها پاسخ بده و ارتباطات پنهان بین اطلاعات مختلف رو کشف کنه.
🎧 یکی از قابلیتهای جدید و جالبش، تبدیل متن به پادکسته، یعنی میتونید محتوای اسناد رو به صورت صوتی گوش بدید، حتی زمانی که در حال حرکت یا مشغول کاری هستید.
و خبر فوقالعاده برای فارسیزبانان:
پشتیبانی بهتر و دقیقتر از زبان فارسی بهتازگی به NotebookLM اضافه شده! 🎉
از این پس میتونید اسناد فارسیتون رو وارد این ابزار کنید و از قابلیتهایی مثل خلاصهسازی، پرسش و پاسخ، و تولید پادکست به زبان فارسی رو با کیفیت بسیار بالاتری استفاده کنید.
دیگه لازم نیست ساعتها برای خوندن و دستهبندی مطالب وقت بذارید NotebookLM این کارها رو براتون آسون میکنه! 😉
🔍 حتماً امتحانش کنید، تجربهاش واقعاً شگفتانگیزه! 🤯🤯
🔹🔹🔹🔹🔹
🔹 @cvision 🔹
🔹🔹🔹🔹🔹
🎧 یکی از قابلیتهای جدید و جالبش، تبدیل متن به پادکسته، یعنی میتونید محتوای اسناد رو به صورت صوتی گوش بدید، حتی زمانی که در حال حرکت یا مشغول کاری هستید.
و خبر فوقالعاده برای فارسیزبانان:
پشتیبانی بهتر و دقیقتر از زبان فارسی بهتازگی به NotebookLM اضافه شده! 🎉
از این پس میتونید اسناد فارسیتون رو وارد این ابزار کنید و از قابلیتهایی مثل خلاصهسازی، پرسش و پاسخ، و تولید پادکست به زبان فارسی رو با کیفیت بسیار بالاتری استفاده کنید.
دیگه لازم نیست ساعتها برای خوندن و دستهبندی مطالب وقت بذارید NotebookLM این کارها رو براتون آسون میکنه! 😉
🔍 حتماً امتحانش کنید، تجربهاش واقعاً شگفتانگیزه! 🤯🤯
🔹🔹🔹🔹🔹
🔹 @cvision 🔹
🔹🔹🔹🔹🔹
👍23🔥5❤3👏3
بلاگ پست "AI agentها یا عاملهای هوش مصنوعی چیستند؟" که در سایت کلاس ویژن منتشر شده رو من با NotebookLM تبدیل به پادکست کردم که خروجی شو در ادامه میبینم که چقدر کیفیت خروجی بالاست ! 🔥🔥
🔹🔹🔹🔹🔹
🔹 @cvision 🔹
🔹🔹🔹🔹🔹
🔹🔹🔹🔹🔹
🔹 @cvision 🔹
🔹🔹🔹🔹🔹
👍10
Audio
🤯19👍3🔥3😱3❤2
🧠 DeepSeek trains math proof model without human data
مدلی که بدون اتکا به داده انسانی، یاد گرفت چگونه ریاضیات را اثبات کند!
تیم DeepSeek از نسخه دوم مدل اثباتگر ریاضی خود رونمایی کرده:
DeepSeek-Prover-V2
نکتهی شگفتانگیز؟ این مدل بدون استفاده از دادههای انسانی آموزش دیده است!
چهطور ممکنه؟
با استفاده از یک مدل زبانی قدرتمند (DeepSeek-V3)، ابتدا مسائل پیچیده ریاضی به زیرمسئلههای سادهتر شکسته میشوند.
سپس این زیرمسئلهها بهصورت خودکار اثبات میشوند و از این فرایند، دادههای آموزشی مصنوعی تولید میشود.
در نهایت، مدل اصلی با یادگیری تقویتی آموزش میبیند تا خودش بتواند کل مسئله را اثبات کند — بدون نیاز به برچسبگذاری یا دادهی انسانی!
دستاوردها:
۸۸.۹٪ دقت در MiniF2F
حل ۴۹ مسئله از دیتاست چالشبرانگیز PutnamBench
این پروژه یکی از ملموسترین نمونهها از ترکیب خلاقانه یادگیری زبانی، استدلال منطقی و RL است — و گامی مهم در مسیر خودآموزی ماشینها برای حل مسائل پیشرفته ریاضی.
🔗لینک پروژه در گیتهاب:
github.com/deepseek-ai/DeepSeek-Prover-V2
مدلی که بدون اتکا به داده انسانی، یاد گرفت چگونه ریاضیات را اثبات کند!
تیم DeepSeek از نسخه دوم مدل اثباتگر ریاضی خود رونمایی کرده:
DeepSeek-Prover-V2
نکتهی شگفتانگیز؟ این مدل بدون استفاده از دادههای انسانی آموزش دیده است!
چهطور ممکنه؟
با استفاده از یک مدل زبانی قدرتمند (DeepSeek-V3)، ابتدا مسائل پیچیده ریاضی به زیرمسئلههای سادهتر شکسته میشوند.
سپس این زیرمسئلهها بهصورت خودکار اثبات میشوند و از این فرایند، دادههای آموزشی مصنوعی تولید میشود.
در نهایت، مدل اصلی با یادگیری تقویتی آموزش میبیند تا خودش بتواند کل مسئله را اثبات کند — بدون نیاز به برچسبگذاری یا دادهی انسانی!
دستاوردها:
۸۸.۹٪ دقت در MiniF2F
حل ۴۹ مسئله از دیتاست چالشبرانگیز PutnamBench
این پروژه یکی از ملموسترین نمونهها از ترکیب خلاقانه یادگیری زبانی، استدلال منطقی و RL است — و گامی مهم در مسیر خودآموزی ماشینها برای حل مسائل پیشرفته ریاضی.
🔗لینک پروژه در گیتهاب:
github.com/deepseek-ai/DeepSeek-Prover-V2
GitHub
GitHub - deepseek-ai/DeepSeek-Prover-V2
Contribute to deepseek-ai/DeepSeek-Prover-V2 development by creating an account on GitHub.
👍25🔥7❤6
✨جفری هینتون : خوشحالم ۷۷ سالمه، چون احتمالا تا من زنده ام دنیا دست هوش مصنوعی نمیفته!
جفری هینتون، که لقب Godfather هوش مصنوعی هم داره ، گفته از اینکه ۷۷ سالشه نفس راحتی میکشه! دلیلش هم اینه که فکر میکنه دیگه اونقدر عمر نمیکنه که شاهد روزی باشه که هوش مصنوعی از هوش انسانها بزنه جلو و عواقب خطرناکش رو به چشم ببینه!
اون تو یه مصاحبه جدید هشدار داده که هوش مصنوعی داره خیلی سریعتر از چیزی که فکر میکردیم پیشرفت میکنه و حتی ممکنه آخرش کار به جایی برسه که بتونه ما انسانها رو کنترل و بازی بده.
هینتون، توسعه هوش مصنوعی رو مثل بزرگ کردن یه بچه ببر دونسته؛ اولش شاید جالب باشه، اما وقتی بزرگ و قوی شد، میتونه خیلی خطرناک بشه!
جالبه بدونید هینتون قبلاً از گوگل استعفا داد تا بتونه آزادانه درباره این نگرانیهاش حرف بزنه...
https://www.yahoo.com/news/godfather-ai-says-hes-glad-110151161.html
جفری هینتون، که لقب Godfather هوش مصنوعی هم داره ، گفته از اینکه ۷۷ سالشه نفس راحتی میکشه! دلیلش هم اینه که فکر میکنه دیگه اونقدر عمر نمیکنه که شاهد روزی باشه که هوش مصنوعی از هوش انسانها بزنه جلو و عواقب خطرناکش رو به چشم ببینه!
اون تو یه مصاحبه جدید هشدار داده که هوش مصنوعی داره خیلی سریعتر از چیزی که فکر میکردیم پیشرفت میکنه و حتی ممکنه آخرش کار به جایی برسه که بتونه ما انسانها رو کنترل و بازی بده.
هینتون، توسعه هوش مصنوعی رو مثل بزرگ کردن یه بچه ببر دونسته؛ اولش شاید جالب باشه، اما وقتی بزرگ و قوی شد، میتونه خیلی خطرناک بشه!
جالبه بدونید هینتون قبلاً از گوگل استعفا داد تا بتونه آزادانه درباره این نگرانیهاش حرف بزنه...
https://www.yahoo.com/news/godfather-ai-says-hes-glad-110151161.html
👍29🤔7❤3👀2
Forwarded from DeepMind AI Expert (Farzad 🦅)
https://huggingface.co/Qwen/Qwen2.5-Omni-3B
مدل متن باز speech to speech
مدل متن باز speech to speech
huggingface.co
Qwen/Qwen2.5-Omni-3B · Hugging Face
We’re on a journey to advance and democratize artificial intelligence through open source and open science.
❤9👍2
Forwarded from Shenasa-ai.ir
https://www.linkedin.com/posts/shenasa-ai_shenasaenglish-persian-parallel-dataset-activity-7324707430267801600-h-Yf
🔹 مجموعهدادهای شامل ۴ میلیون جمله موازی انگلیسی-فارسی برای ارتقاء سیستمهای ترجمه ماشینی منتشر شد.
در این پروژه، علاوه بر ارائه یک دیتاست بزرگمقیاس، از نمایش موقعیت نسبی (Relative Position Representations) در مدلهای ترجمه عصبی استفاده شده که منجر به بهبود عملکرد شده است.
📦 دسترسی به دیتاست در Hugging Face:
🔗 https://huggingface.co/datasets/shenasa/English-Persian-Parallel-Dataset
📄 مقاله:
Enhancing English-Persian Neural Machine Translation with a Large-Scale Parallel Dataset and Relative Position Representations
🔗 https://ieeexplore.ieee.org/abstract/document/10967409
#NLP #MachineTranslation #PersianNLP #AI #DeepLearning #HuggingFace #DataScience
🔹 مجموعهدادهای شامل ۴ میلیون جمله موازی انگلیسی-فارسی برای ارتقاء سیستمهای ترجمه ماشینی منتشر شد.
در این پروژه، علاوه بر ارائه یک دیتاست بزرگمقیاس، از نمایش موقعیت نسبی (Relative Position Representations) در مدلهای ترجمه عصبی استفاده شده که منجر به بهبود عملکرد شده است.
📦 دسترسی به دیتاست در Hugging Face:
🔗 https://huggingface.co/datasets/shenasa/English-Persian-Parallel-Dataset
📄 مقاله:
Enhancing English-Persian Neural Machine Translation with a Large-Scale Parallel Dataset and Relative Position Representations
🔗 https://ieeexplore.ieee.org/abstract/document/10967409
#NLP #MachineTranslation #PersianNLP #AI #DeepLearning #HuggingFace #DataScience
Linkedin
🔹 مجموعهدادهای شامل ۴ میلیون جمله موازی انگلیسی-فارسی برای ارتقاء سیستمهای ترجمه ماشینی منتشر شد. | shenasa ai
🔹 مجموعهدادهای شامل ۴ میلیون جمله موازی انگلیسی-فارسی برای ارتقاء سیستمهای ترجمه ماشینی منتشر شد.
در این پروژه، علاوه بر ارائه یک دیتاست بزرگمقیاس، از نمایش موقعیت نسبی (Relative Position Representations) در مدلهای ترجمه عصبی استفاده شده که منجر به…
در این پروژه، علاوه بر ارائه یک دیتاست بزرگمقیاس، از نمایش موقعیت نسبی (Relative Position Representations) در مدلهای ترجمه عصبی استفاده شده که منجر به…
1👍14🔥1👏1👌1
MedSAM2 Explained: One Prompt to Segment Anything in Medical Imaging
https://learnopencv.com/medsam2-explained/
https://learnopencv.com/medsam2-explained/
LearnOpenCV – Learn OpenCV, PyTorch, Keras, Tensorflow with code, & tutorials
MedSAM2 Explained: One Prompt to Segment Anything in Medical Imaging
MedSAM2 brings “segment anything” power to healthcare, carving organs, tumours, and even moving heart chambers from CT, MRI, PET, and live ultrasound with a single prompt. Running in < 1 second per slice and slashing annotation time by 90 %, it’s your shortcut…
👍11🔥1
ارائه آنلاین چالشهای مدلهای زبانی و بینایی ماشین🔥
با حضور مجتبی کمیلی، مهندس تحقیقاتی در فیسبوک
شنبه ۲۰ اردیبهشت | ساعت ۱۸ تا ۱۹ 🕕
منتظر شما هستیم تا با هم وارد عمق مفاهیم هوش مصنوعی بشیم! ✨
برگزاری + پرسش و پاسخ آنلاین در بستر تلگرام
@podcast3o14
با حضور مجتبی کمیلی، مهندس تحقیقاتی در فیسبوک
شنبه ۲۰ اردیبهشت | ساعت ۱۸ تا ۱۹ 🕕
منتظر شما هستیم تا با هم وارد عمق مفاهیم هوش مصنوعی بشیم! ✨
برگزاری + پرسش و پاسخ آنلاین در بستر تلگرام
@podcast3o14
👍7🔥1
در اپلیکیشن BoldVoice، لهجه به عنوان یه پدیده زبانی پیچیده مورد بررسی قرار میگیره که شامل الگوهای صوتی مثل شکل گیری مصوت ها، زیر و بم صدا و ریتم گفتاره. هدف این پلتفرم، تحلیل و آموزش لهجه نه از منظر انسانی (زبانشناسی سنتی)، بلکه از طریق الگوریتم های یادگیری ماشینه. به بیان دیگه، کامپیوتر باید بتونه بدون درک زبانی انسان محور، تفاوت ها و شدت لهجه رو تشخیص بده.
برای رسیدن به این هدف، تیم BoldVoice مفهومی به نام accent fingerprint معرفی کرده. این اثر انگشت در واقع یک بردار عددیه (embedding) که با پردازش صدای کاربر توسط یه مدل هوش مصنوعی تولید میشه.
این بردار، ویژگیهای عمیق و نهفته گفتار رو در فضای نهان (latent space) نمایش میده که در اون فاصله ها نشان دهنده میزان شباهت یا تفاوت لهجهها و جهت ها نشان دهنده مسیرهای احتمالی تغییر یا پیشرفت لهجه هستن.
از این رو، تحلیل لهجه از سطح توصیف کیفی به سطح عددی و قابل محاسبه ارتقا پیدا میکنه. در مثالی کاربردی، این فناوری برای کمک به ویکتور (کارآموزی با لهجه غیر بومی) بهکار گرفته شد تا بتونه لهجه خودش رو به لهجه آمریکایی مربی متخصص، الیزا، نزدیک تر کنه. این مقاله نشان میده که چطور میشه با تحلیل داده های صوتی و بردارهای نهان، آموزش لهجه رو از یه فرآیند ذهنی و کیفی به فرآیندی کمی، هد فمند و شخصی سازی شده تبدیل کرد.
https://accent-strength.boldvoice.com/
برای رسیدن به این هدف، تیم BoldVoice مفهومی به نام accent fingerprint معرفی کرده. این اثر انگشت در واقع یک بردار عددیه (embedding) که با پردازش صدای کاربر توسط یه مدل هوش مصنوعی تولید میشه.
این بردار، ویژگیهای عمیق و نهفته گفتار رو در فضای نهان (latent space) نمایش میده که در اون فاصله ها نشان دهنده میزان شباهت یا تفاوت لهجهها و جهت ها نشان دهنده مسیرهای احتمالی تغییر یا پیشرفت لهجه هستن.
از این رو، تحلیل لهجه از سطح توصیف کیفی به سطح عددی و قابل محاسبه ارتقا پیدا میکنه. در مثالی کاربردی، این فناوری برای کمک به ویکتور (کارآموزی با لهجه غیر بومی) بهکار گرفته شد تا بتونه لهجه خودش رو به لهجه آمریکایی مربی متخصص، الیزا، نزدیک تر کنه. این مقاله نشان میده که چطور میشه با تحلیل داده های صوتی و بردارهای نهان، آموزش لهجه رو از یه فرآیند ذهنی و کیفی به فرآیندی کمی، هد فمند و شخصی سازی شده تبدیل کرد.
https://accent-strength.boldvoice.com/
👍16⚡3👌1