Tensorflow(@CVision) 4026

🌟 تحولی در دنیای ویدئوهای هوش مصنوعی!
نسخه جدید SkyReels-V2، اولین مدل متن‌باز برای تولید ویدیوهای طولانی و نامحدود منتشر شد!
✨ ویژگی‌ها:
تبدیل متن و تصویر به ویدیو
تولید ویدیوهای بی‌نهایت با کیفیت سینمایی
حرکات واقعی و پیروی دقیق از دستورات
🎬 کاربردها: داستان‌سرایی، شبیه‌سازی کارگردانی، تولید ویدیو با چند سوژه

📌 اطلاعات بیشتر: skyreels.ai
🔗 سورس کد: GitHub
📝مقاله: https://arxiv.org/abs/2504.13074

👍16❤‍🔥6

4.49K viewsedited 15:42

Tensorflow(@CVision)

یکنواختی مدل تولید تصویر واقعا خیره کننده است

https://chatgpt.com/share/68066939-f030-8001-b5ce-73a94b940ad6

1😱15👍6👌2

5.5K views15:52

Tensorflow(@CVision)

حتی روی عکس واقعی ادیت کتید...

https://chatgpt.com/share/68066a57-e914-8001-8824-bd5ef99a3d17

نکته قابل توجه اینه که عکس این خانمو همینجوری تو اینترنت سرچ کردم و دادم، و آدم واقعیه نه جنریت شده

نکته دوم عکس به شدت بی‌کیفیت بود و خودش با کیفیت کرده

البته گوشواره را یکم خراب کرده

1👌23👍15😱7

5.79K views15:59

Tensorflow(@CVision)

🔍 مدل‌های زبانی بزرگ مثل GPT-4o به‌دلیل آموزش با بازخورد انسانی (RLHF) تمایل دارند نظرات کاربران را بدون بررسی تأیید کنند، حتی اگر نادرست یا مضر باشند. این رفتار چاپلوسانه می‌تواند به تقویت باورهای غلط منجر شود...

seangoedecke.com/ai-sycophancy

مدل‌های زبانی بزرگ (LLM) اخیر، به ویژه نسخه به‌روزرسانی‌شده GPT-4o، تمایل زیادی به چاپلوسی نشان می‌دهند و به راحتی باورهای کاربران را تأیید و آن‌ها را غرق در ستایش می‌کنند.
این موضوع نگران‌کننده است، زیرا می‌تواند باورها و توصیه‌های مضر را تقویت کند، به طوری که مدل‌های زبانی بزرگ (LLM) ادعاهای شدید کاربران را تأیید می‌کنند.
کاربرانی که دائماً توسط مدل‌های زبانی بزرگ (LLM) تأیید می‌شوند، ممکن است هنگام مواجهه با بازخورد و انتقاد واقعی در دنیای واقعی دچار مشکل شوند.
تنظیم دقیق دستورالعمل و یادگیری تقویتی از بازخورد انسانی (RLHF) به مدل‌ها برای خشنود کردن کاربران پاداش می‌دهد و منجر به رفتارهایی مانند تملق برای افزایش رتبه‌بندی‌های مثبت می‌شود...

Seangoedecke

Sycophancy is the first LLM "dark pattern"

People have been making fun of OpenAI models for being overly sycophantic for months now. I even wrote a post advising users to pretend that their work was…

👍38👏2👌2❤1

4.04K views12:57

Tensorflow(@CVision)

🚀 گوگل در ادامه توسعه‌ی ابزار قدرتمند NotebookLM، حالا قابلیت‌های جدید و هیجان‌انگیزی بهش اضافه کرده که کار با اسناد و متون طولانی رو حتی ساده‌تر و هوشمندتر می‌کنه! این ابزار با بهره‌گیری از هوش مصنوعی پیشرفته، می‌تونه از مقالات، گزارش‌ها یا حتی یادداشت‌های شخصی‌تون خلاصه‌های دقیق تولید کنه، به سوالات‌تون درباره‌ی اون‌ها پاسخ بده و ارتباطات پنهان بین اطلاعات مختلف رو کشف کنه.

🎧 یکی از قابلیت‌های جدید و جالبش، تبدیل متن به پادکسته، یعنی می‌تونید محتوای اسناد رو به صورت صوتی گوش بدید، حتی زمانی که در حال حرکت یا مشغول کاری هستید.

و خبر فوق‌العاده برای فارسی‌زبانان:
پشتیبانی بهتر و دقیق‌تر از زبان فارسی به‌تازگی به NotebookLM اضافه شده! 🎉
از این پس می‌تونید اسناد فارسی‌تون رو وارد این ابزار کنید و از قابلیت‌هایی مثل خلاصه‌سازی، پرسش و پاسخ، و تولید پادکست به زبان فارسی رو با کیفیت بسیار بالاتری استفاده کنید.

دیگه لازم نیست ساعت‌ها برای خوندن و دسته‌بندی مطالب وقت بذارید NotebookLM این کارها رو براتون آسون می‌کنه! 😉

🔍 حتماً امتحانش کنید، تجربه‌اش واقعاً شگفت‌انگیزه! 🤯🤯

🔹🔹🔹🔹🔹
🔹 @cvision 🔹
🔹🔹🔹🔹🔹

👍23🔥5❤3👏3

3.93K views`Șίɴλ`, 06:24

Tensorflow(@CVision)

بلاگ پست "AI agentها یا عامل‌های هوش مصنوعی چیستند؟" که در سایت کلاس ویژن منتشر شده رو من با NotebookLM تبدیل به پادکست کردم که خروجی شو در ادامه میبینم که چقدر کیفیت خروجی بالاست ! 🔥🔥

🔹🔹🔹🔹🔹
🔹 @cvision 🔹
🔹🔹🔹🔹🔹

👍10

4.7K views`Șίɴλ`, 06:24

Tensorflow(@CVision)

Audio

پادکست "AI agentها یا عامل‌های هوش مصنوعی چیستند؟"

🔹🔹🔹🔹🔹
🔹 @cvision 🔹
🔹🔹🔹🔹🔹

🤯19👍3🔥3😱3❤2

4.16K views`Șίɴλ`, 06:24

Tensorflow(@CVision)

🧠 DeepSeek trains math proof model without human data
مدلی که بدون اتکا به داده انسانی، یاد گرفت چگونه ریاضیات را اثبات کند!
تیم DeepSeek از نسخه دوم مدل اثبات‌گر ریاضی خود رونمایی کرده:
DeepSeek-Prover-V2
نکته‌ی شگفت‌انگیز؟ این مدل بدون استفاده از داده‌های انسانی آموزش دیده است!
چه‌طور ممکنه؟
با استفاده از یک مدل زبانی قدرتمند (DeepSeek-V3)، ابتدا مسائل پیچیده ریاضی به زیرمسئله‌های ساده‌تر شکسته می‌شوند.
سپس این زیرمسئله‌ها به‌صورت خودکار اثبات می‌شوند و از این فرایند، داده‌های آموزشی مصنوعی تولید می‌شود.
در نهایت، مدل اصلی با یادگیری تقویتی آموزش می‌بیند تا خودش بتواند کل مسئله را اثبات کند — بدون نیاز به برچسب‌گذاری یا داده‌ی انسانی!
دستاوردها:
۸۸.۹٪ دقت در MiniF2F
حل ۴۹ مسئله از دیتاست چالش‌برانگیز PutnamBench
این پروژه یکی از ملموس‌ترین نمونه‌ها از ترکیب خلاقانه یادگیری زبانی، استدلال منطقی و RL است — و گامی مهم در مسیر خودآموزی ماشین‌ها برای حل مسائل پیشرفته ریاضی.

🔗لینک پروژه در گیت‌هاب:
github.com/deepseek-ai/DeepSeek-Prover-V2

GitHub

GitHub - deepseek-ai/DeepSeek-Prover-V2

Contribute to deepseek-ai/DeepSeek-Prover-V2 development by creating an account on GitHub.

👍25🔥7❤6

4.05K views18:11

Tensorflow(@CVision)

✨جفری هینتون : خوشحالم ۷۷ سالمه، چون احتمالا تا من زنده ام دنیا دست هوش مصنوعی نمیفته!

جفری هینتون، که لقب Godfather هوش مصنوعی هم داره ، گفته از اینکه ۷۷ سالشه نفس راحتی می‌کشه! دلیلش هم اینه که فکر می‌کنه دیگه اونقدر عمر نمی‌کنه که شاهد روزی باشه که هوش مصنوعی از هوش انسان‌ها بزنه جلو و عواقب خطرناکش رو به چشم ببینه!

اون تو یه مصاحبه جدید هشدار داده که هوش مصنوعی داره خیلی سریع‌تر از چیزی که فکر می‌کردیم پیشرفت می‌کنه و حتی ممکنه آخرش کار به جایی برسه که بتونه ما انسان‌ها رو کنترل و بازی بده.

هینتون، توسعه هوش مصنوعی رو مثل بزرگ کردن یه بچه ببر دونسته؛ اولش شاید جالب باشه، اما وقتی بزرگ و قوی شد، می‌تونه خیلی خطرناک بشه!

جالبه بدونید هینتون قبلاً از گوگل استعفا داد تا بتونه آزادانه درباره این نگرانی‌هاش حرف بزنه...

https://www.yahoo.com/news/godfather-ai-says-hes-glad-110151161.html

👍29🤔7❤3👀2

3.76K viewsedited 09:58

Tensorflow(@CVision)

Forwarded from DeepMind AI Expert (Farzad 🦅)

https://huggingface.co/Qwen/Qwen2.5-Omni-3B
مدل متن باز speech to speech

huggingface.co

Qwen/Qwen2.5-Omni-3B · Hugging Face

We’re on a journey to advance and democratize artificial intelligence through open source and open science.

❤9👍2

3.06K views10:13

Tensorflow(@CVision)

https://m.youtube.com/watch?v=E8Mju53VB00

YouTube

Stanford CS336 Language Modeling from Scratch | Spring 2025 | Lecture 6: Kernels, Triton

For more information about Stanford's online Artificial Intelligence programs visit: https://stanford.io/ai

To learn more about enrolling in this course visit: https://online.stanford.edu/courses/cs336-language-modeling-scratch

To follow along with the…

❤8

3.19K views19:17

Tensorflow(@CVision)

Forwarded from Shenasa-ai.ir

https://www.linkedin.com/posts/shenasa-ai_shenasaenglish-persian-parallel-dataset-activity-7324707430267801600-h-Yf

🔹 مجموعه‌داده‌ای شامل ۴ میلیون جمله موازی انگلیسی-فارسی برای ارتقاء سیستم‌های ترجمه ماشینی منتشر شد.

در این پروژه، علاوه بر ارائه یک دیتاست بزرگ‌مقیاس، از نمایش موقعیت نسبی (Relative Position Representations) در مدل‌های ترجمه عصبی استفاده شده که منجر به بهبود عملکرد شده است.

📦 دسترسی به دیتاست در Hugging Face:

🔗 https://huggingface.co/datasets/shenasa/English-Persian-Parallel-Dataset

📄 مقاله:
Enhancing English-Persian Neural Machine Translation with a Large-Scale Parallel Dataset and Relative Position Representations
🔗 https://ieeexplore.ieee.org/abstract/document/10967409

#NLP #MachineTranslation #PersianNLP #AI #DeepLearning #HuggingFace #DataScience

🔹 مجموعه‌داده‌ای شامل ۴ میلیون جمله موازی انگلیسی-فارسی برای ارتقاء سیستم‌های ترجمه ماشینی منتشر شد. | shenasa ai

🔹 مجموعه‌داده‌ای شامل ۴ میلیون جمله موازی انگلیسی-فارسی برای ارتقاء سیستم‌های ترجمه ماشینی منتشر شد.

در این پروژه، علاوه بر ارائه یک دیتاست بزرگ‌مقیاس، از نمایش موقعیت نسبی (Relative Position Representations) در مدل‌های ترجمه عصبی استفاده شده که منجر به…

1👍14🔥1👏1👌1

3.66K views08:16

Tensorflow(@CVision)

MedSAM2 Explained: One Prompt to Segment Anything in Medical Imaging

https://learnopencv.com/medsam2-explained/

LearnOpenCV – Learn OpenCV, PyTorch, Keras, Tensorflow with code, & tutorials

MedSAM2 Explained: One Prompt to Segment Anything in Medical Imaging

MedSAM2 brings “segment anything” power to healthcare, carving organs, tumours, and even moving heart chambers from CT, MRI, PET, and live ultrasound with a single prompt. Running in < 1 second per slice and slashing annotation time by 90 %, it’s your shortcut…

👍11🔥1

5.17K views09:33

Tensorflow(@CVision)

ارائه آنلاین چالش‌های مدل‌های زبانی و بینایی ماشین🔥

با حضور مجتبی کمیلی، مهندس تحقیقاتی در فیسبوک
شنبه ۲۰ اردیبهشت | ساعت ۱۸ تا ۱۹ 🕕

منتظر شما هستیم تا با هم وارد عمق مفاهیم هوش مصنوعی بشیم! ✨

برگزاری + پرسش و پاسخ آنلاین در بستر تلگرام

@podcast3o14

👍7🔥1

3.45K viewsedited 11:17

Tensorflow(@CVision)

در اپلیکیشن BoldVoice، لهجه به‌ عنوان یه پدیده زبانی پیچیده مورد بررسی قرار می‌گیره که شامل الگوهای صوتی مثل شکل‌ گیری مصوت‌ ها، زیر و بم صدا و ریتم گفتاره. هدف این پلتفرم، تحلیل و آموزش لهجه نه از منظر انسانی (زبان‌شناسی سنتی)، بلکه از طریق الگوریتم‌ های یادگیری ماشینه. به بیان دیگه، کامپیوتر باید بتونه بدون درک زبانی انسان‌ محور، تفاوت‌ ها و شدت لهجه رو تشخیص بده.

برای رسیدن به این هدف، تیم BoldVoice مفهومی به نام accent fingerprint معرفی کرده. این اثر انگشت در واقع یک بردار عددیه (embedding) که با پردازش صدای کاربر توسط یه مدل هوش مصنوعی تولید میشه.

این بردار، ویژگی‌های عمیق و نهفته گفتار رو در فضای نهان (latent space) نمایش میده که در اون فاصله‌ ها نشان‌ دهنده میزان شباهت یا تفاوت لهجه‌ها و جهت‌ ها نشان‌ دهنده مسیرهای احتمالی تغییر یا پیشرفت لهجه هستن.

از این رو، تحلیل لهجه از سطح توصیف کیفی به سطح عددی و قابل محاسبه ارتقا پیدا می‌کنه. در مثالی کاربردی، این فناوری برای کمک به ویکتور (کارآموزی با لهجه غیر بومی) به‌کار گرفته شد تا بتونه لهجه خودش رو به لهجه آمریکایی مربی متخصص، الیزا، نزدیک‌ تر کنه. این مقاله نشان میده که چطور میشه با تحلیل داده‌ های صوتی و بردارهای نهان، آموزش لهجه رو از یه فرآیند ذهنی و کیفی به فرآیندی کمی، هد فمند و شخصی‌ سازی‌ شده تبدیل کرد.

https://accent-strength.boldvoice.com/

👍16⚡3👌1

3.75K viewsAlister☄️, 16:32

2025/07/13 16:54:50
Back to Top

HTML Embed Code:

<iframe width="100%" src="https://www.bootg.com/buyppe/web?embed=1" title="Telegram Web" frameborder="0" allow="accelerometer; autoplay; clipboard-write; encrypted-media; gyroscope; picture-in-picture" allowfullscreen></iframe>