Telegram Web Link
This media is not supported in your browser
VIEW IN TELEGRAM
🌟 تحولی در دنیای ویدئوهای هوش مصنوعی!
نسخه جدید SkyReels-V2، اولین مدل متن‌باز برای تولید ویدیوهای طولانی و نامحدود منتشر شد!
ویژگی‌ها:
تبدیل متن و تصویر به ویدیو
تولید ویدیوهای بی‌نهایت با کیفیت سینمایی
حرکات واقعی و پیروی دقیق از دستورات
🎬 کاربردها: داستان‌سرایی، شبیه‌سازی کارگردانی، تولید ویدیو با چند سوژه

📌 اطلاعات بیشتر: skyreels.ai
🔗 سورس کد: GitHub
📝مقاله: https://arxiv.org/abs/2504.13074
👍16❤‍🔥6
یکنواختی مدل تولید تصویر واقعا خیره کننده است

https://chatgpt.com/share/68066939-f030-8001-b5ce-73a94b940ad6
1😱15👍6👌2
حتی روی عکس واقعی ادیت کتید...

https://chatgpt.com/share/68066a57-e914-8001-8824-bd5ef99a3d17

نکته قابل توجه اینه که عکس این خانمو همینجوری تو اینترنت سرچ کردم و دادم، و آدم واقعیه نه جنریت شده

نکته دوم عکس به شدت بی‌کیفیت بود و خودش با کیفیت کرده

البته گوشواره را یکم خراب کرده
1👌23👍15😱7
🔍 مدل‌های زبانی بزرگ مثل GPT-4o به‌دلیل آموزش با بازخورد انسانی (RLHF) تمایل دارند نظرات کاربران را بدون بررسی تأیید کنند، حتی اگر نادرست یا مضر باشند. این رفتار چاپلوسانه می‌تواند به تقویت باورهای غلط منجر شود...


seangoedecke.com/ai-sycophancy

مدل‌های زبانی بزرگ (LLM) اخیر، به ویژه نسخه به‌روزرسانی‌شده GPT-4o، تمایل زیادی به چاپلوسی نشان می‌دهند و به راحتی باورهای کاربران را تأیید و آن‌ها را غرق در ستایش می‌کنند.
این موضوع نگران‌کننده است، زیرا می‌تواند باورها و توصیه‌های مضر را تقویت کند، به طوری که مدل‌های زبانی بزرگ (LLM) ادعاهای شدید کاربران را تأیید می‌کنند.
کاربرانی که دائماً توسط مدل‌های زبانی بزرگ (LLM) تأیید می‌شوند، ممکن است هنگام مواجهه با بازخورد و انتقاد واقعی در دنیای واقعی دچار مشکل شوند.
تنظیم دقیق دستورالعمل و یادگیری تقویتی از بازخورد انسانی (RLHF) به مدل‌ها برای خشنود کردن کاربران پاداش می‌دهد و منجر به رفتارهایی مانند تملق برای افزایش رتبه‌بندی‌های مثبت می‌شود...
👍38👏2👌21
🚀 گوگل در ادامه توسعه‌ی ابزار قدرتمند NotebookLM، حالا قابلیت‌های جدید و هیجان‌انگیزی بهش اضافه کرده که کار با اسناد و متون طولانی رو حتی ساده‌تر و هوشمندتر می‌کنه! این ابزار با بهره‌گیری از هوش مصنوعی پیشرفته، می‌تونه از مقالات، گزارش‌ها یا حتی یادداشت‌های شخصی‌تون خلاصه‌های دقیق تولید کنه، به سوالات‌تون درباره‌ی اون‌ها پاسخ بده و ارتباطات پنهان بین اطلاعات مختلف رو کشف کنه.

🎧 یکی از قابلیت‌های جدید و جالبش، تبدیل متن به پادکسته، یعنی می‌تونید محتوای اسناد رو به صورت صوتی گوش بدید، حتی زمانی که در حال حرکت یا مشغول کاری هستید.

و خبر فوق‌العاده برای فارسی‌زبانان:
پشتیبانی بهتر و دقیق‌تر از زبان فارسی به‌تازگی به NotebookLM اضافه شده! 🎉
از این پس می‌تونید اسناد فارسی‌تون رو وارد این ابزار کنید و از قابلیت‌هایی مثل خلاصه‌سازی، پرسش و پاسخ، و تولید پادکست به زبان فارسی رو با کیفیت بسیار بالاتری استفاده کنید.

دیگه لازم نیست ساعت‌ها برای خوندن و دسته‌بندی مطالب وقت بذارید NotebookLM این کارها رو براتون آسون می‌کنه! 😉

🔍 حتماً امتحانش کنید، تجربه‌اش واقعاً شگفت‌انگیزه! 🤯🤯

🔹🔹🔹🔹🔹
🔹 @cvision 🔹
🔹🔹🔹🔹🔹
👍23🔥53👏3
بلاگ پست "AI agentها یا عامل‌های هوش مصنوعی چیستند؟" که در سایت کلاس ویژن منتشر شده رو من با NotebookLM تبدیل به پادکست کردم که خروجی شو در ادامه میبینم که چقدر کیفیت خروجی بالاست ! 🔥🔥

🔹🔹🔹🔹🔹
🔹 @cvision 🔹
🔹🔹🔹🔹🔹
👍10
Audio
پادکست "AI agentها یا عامل‌های هوش مصنوعی چیستند؟"

🔹🔹🔹🔹🔹
🔹 @cvision 🔹
🔹🔹🔹🔹🔹
🤯19👍3🔥3😱32
🧠 DeepSeek trains math proof model without human data
مدلی که بدون اتکا به داده انسانی، یاد گرفت چگونه ریاضیات را اثبات کند!
تیم DeepSeek از نسخه دوم مدل اثبات‌گر ریاضی خود رونمایی کرده:
DeepSeek-Prover-V2
نکته‌ی شگفت‌انگیز؟ این مدل بدون استفاده از داده‌های انسانی آموزش دیده است!
چه‌طور ممکنه؟
با استفاده از یک مدل زبانی قدرتمند (DeepSeek-V3)، ابتدا مسائل پیچیده ریاضی به زیرمسئله‌های ساده‌تر شکسته می‌شوند.
سپس این زیرمسئله‌ها به‌صورت خودکار اثبات می‌شوند و از این فرایند، داده‌های آموزشی مصنوعی تولید می‌شود.
در نهایت، مدل اصلی با یادگیری تقویتی آموزش می‌بیند تا خودش بتواند کل مسئله را اثبات کند — بدون نیاز به برچسب‌گذاری یا داده‌ی انسانی!
دستاوردها:
۸۸.۹٪ دقت در MiniF2F
حل ۴۹ مسئله از دیتاست چالش‌برانگیز PutnamBench
این پروژه یکی از ملموس‌ترین نمونه‌ها از ترکیب خلاقانه یادگیری زبانی، استدلال منطقی و RL است — و گامی مهم در مسیر خودآموزی ماشین‌ها برای حل مسائل پیشرفته ریاضی.

🔗لینک پروژه در گیت‌هاب:
github.com/deepseek-ai/DeepSeek-Prover-V2
👍25🔥76
جفری هینتون : خوشحالم ۷۷ سالمه، چون احتمالا تا من زنده ام دنیا دست هوش مصنوعی نمیفته!

جفری هینتون، که لقب Godfather هوش مصنوعی هم داره ، گفته از اینکه ۷۷ سالشه نفس راحتی می‌کشه! دلیلش هم اینه که فکر می‌کنه دیگه اونقدر عمر نمی‌کنه که شاهد روزی باشه که هوش مصنوعی از هوش انسان‌ها بزنه جلو و عواقب خطرناکش رو به چشم ببینه!

اون تو یه مصاحبه جدید هشدار داده که هوش مصنوعی داره خیلی سریع‌تر از چیزی که فکر می‌کردیم پیشرفت می‌کنه و حتی ممکنه آخرش کار به جایی برسه که بتونه ما انسان‌ها رو کنترل و بازی بده.

هینتون، توسعه هوش مصنوعی رو مثل بزرگ کردن یه بچه ببر دونسته؛ اولش شاید جالب باشه، اما وقتی بزرگ و قوی شد، می‌تونه خیلی خطرناک بشه!

جالبه بدونید هینتون قبلاً از گوگل استعفا داد تا بتونه آزادانه درباره این نگرانی‌هاش حرف بزنه...

https://www.yahoo.com/news/godfather-ai-says-hes-glad-110151161.html
👍29🤔73👀2
Forwarded from Shenasa-ai.ir
https://www.linkedin.com/posts/shenasa-ai_shenasaenglish-persian-parallel-dataset-activity-7324707430267801600-h-Yf


🔹 مجموعه‌داده‌ای شامل ۴ میلیون جمله موازی انگلیسی-فارسی برای ارتقاء سیستم‌های ترجمه ماشینی منتشر شد.


در این پروژه، علاوه بر ارائه یک دیتاست بزرگ‌مقیاس، از نمایش موقعیت نسبی (Relative Position Representations) در مدل‌های ترجمه عصبی استفاده شده که منجر به بهبود عملکرد شده است.


📦 دسترسی به دیتاست در Hugging Face:

🔗 https://huggingface.co/datasets/shenasa/English-Persian-Parallel-Dataset


📄 مقاله:
Enhancing English-Persian Neural Machine Translation with a Large-Scale Parallel Dataset and Relative Position Representations
🔗 https://ieeexplore.ieee.org/abstract/document/10967409


#NLP #MachineTranslation #PersianNLP #AI #DeepLearning #HuggingFace #DataScience
1👍14🔥1👏1👌1
ارائه آنلاین چالش‌های مدل‌های زبانی و بینایی ماشین🔥

با حضور مجتبی کمیلی، مهندس تحقیقاتی در فیسبوک
شنبه ۲۰ اردیبهشت | ساعت ۱۸ تا ۱۹ 🕕

منتظر شما هستیم تا با هم وارد عمق مفاهیم هوش مصنوعی بشیم!

برگزاری + پرسش و پاسخ آنلاین در بستر تلگرام


@podcast3o14
👍7🔥1
در اپلیکیشن BoldVoice، لهجه به‌ عنوان یه پدیده زبانی پیچیده مورد بررسی قرار می‌گیره که شامل الگوهای صوتی مثل شکل‌ گیری مصوت‌ ها، زیر و بم صدا و ریتم گفتاره. هدف این پلتفرم، تحلیل و آموزش لهجه نه از منظر انسانی (زبان‌شناسی سنتی)، بلکه از طریق الگوریتم‌ های یادگیری ماشینه. به بیان دیگه، کامپیوتر باید بتونه بدون درک زبانی انسان‌ محور، تفاوت‌ ها و شدت لهجه رو تشخیص بده.

برای رسیدن به این هدف، تیم BoldVoice مفهومی به نام accent fingerprint معرفی کرده. این اثر انگشت در واقع یک بردار عددیه (embedding) که با پردازش  صدای کاربر توسط یه مدل هوش مصنوعی تولید میشه.

 این بردار، ویژگی‌های عمیق و نهفته گفتار رو در فضای نهان (latent space) نمایش میده که در اون فاصله‌ ها نشان‌ دهنده میزان شباهت یا تفاوت لهجه‌ها و جهت‌ ها نشان‌ دهنده مسیرهای احتمالی تغییر یا پیشرفت لهجه هستن.

از این رو، تحلیل لهجه از سطح توصیف کیفی به سطح عددی و قابل محاسبه ارتقا پیدا می‌کنه. در مثالی کاربردی، این فناوری برای کمک به ویکتور (کارآموزی با لهجه غیر بومی) به‌کار گرفته شد تا بتونه لهجه خودش رو به لهجه آمریکایی مربی متخصص، الیزا، نزدیک‌ تر کنه. این مقاله نشان میده که چطور میشه با تحلیل داده‌ های صوتی و بردارهای نهان، آموزش لهجه رو از یه فرآیند ذهنی و کیفی به فرآیندی کمی، هد فمند و شخصی‌ سازی‌ شده تبدیل کرد.

https://accent-strength.boldvoice.com/
👍163👌1
2025/07/13 16:54:50
Back to Top
HTML Embed Code: