Tensorflow(@CVision) 3719

😁7😱4

3.95K viewsAlister ☄️, 15:59

This media is not supported in your browser

این مدل ویدیویی مبتنی بر هوش مصنوعی، از طریق متن، ویدیوهای باکیفیت 6 ثانیه ای با رزولوشن 720p و سرعت 25 فریم در ثانیه تولید می کنه و یه راه حل سریع و کارآمد برای ایجاد محتوای ویدیویی جذابه

دو تا سرباز هخامنشی ایران باستان رو در نظر بگیرین که در حال بازی کردن سوپر ماریو هستن

Two Achaemenid soldiers with ancient Persian battle attire are playing Super Mario

https://hailuoai.com/

❤14👍2

4.86K viewsAlister ☄️, edited 17:08

Tensorflow(@CVision)

مدل جدید OpenAI o1-preview معرفی شد که یه سری از مدل‌های هوش مصنوعی برای حل مسائل پیچیدست. این مدل‌ها با تمرکز بیشتر روی استدلال و تحلیل، می‌تونن وظایف دشوار در زمینه‌های علمی، برنامه‌نویسی و ریاضی رو بهتر حل کنن.

این مدل‌ها هنوز برخی ویژگی‌های ChatGPT، مانند جستجوی وب و آپلود فایل را ندارن، اما برای وظایف استدلال پیچیده پیشرفتی قابل‌توجه به حساب میاد.

https://openai.com/index/introducing-openai-o1-preview/

Openai

Introducing OpenAI o1

👍9

4.96K viewsAlister ☄️, 17:35

Tensorflow(@CVision)

Audio

به اینجا رسیدیم با اوپن‌اِی‌آی اُو۱

یه مدل تازه، هوشمند و نو

حالا بیشتر فکر می‌کنه، قبل از جواب

همه چیز رو می‌سنجه، دقیق و حساب

خبر تازه داریم، از او۱ و تلاش

پژوهش و محصول، پیشرفت و فراش

جهان هوش مصنوعی، درگیر و دل‌فریب

با او۱ می‌ریم به آینده، نزدیک و عجیب

Low Beat😁

😁12👍1😱1

4.89K viewsAlister ☄️, edited 18:16

Tensorflow(@CVision)

2:43

This media is not supported in your browser

VIEW IN TELEGRAM

یک مثال بسیار جالب از قابلیت های O1 برای مصور سازی آموزش مکانیسم اتنشن به دانشجویان که قابلیت های برنامه نویسی مدل جدید رو به تصویر میکشه.

در این ویدئو یه مثال عملی از مدل‌ جدید openai برای بهبود فرایند تدریس نشون داده میشه. اینجا گوینده به دنبال ایجاد ابزارهای تعاملی برای آموزش مکانیزم‌های پیچیدای مثل "Self-attention" در ترانسفورمرها ست. هدف اصلی ایشون، توسعه ابزارهای تعاملی و مصورسازی برای فهم بهتر دانشجویان از این مفاهیم پیچیده ست. اشاره می‌کنه که مدل جدید می‌تونه با دقت بیشتری به دستورالعمل‌های پیچیده پاسخ بده و ابزارهای کارآمدتری رو ایجاد کنه.

👌17🔥5👍3❤2

5.6K viewsAlister ☄️, edited 19:28

Tensorflow(@CVision)

صحبت های چند ماه پیش Andrew Ng در مورد تحولات آینده و توسعه هوش مصنوعی با امکانات ارایه شده در مدل جدید openai O1 کاملا همخوانی داره.

به طور خلاصه در ویدیو میگه:

مدل های بزرگ زبانی کنونی، معمولا با وارد کردن یه پرسش یا درخواست، پاسخی رو ارائه میدن. اما در مدل‌های جدیدتر، فرآیند پاسخ‌دهی به صورت تکراری و بازخوردی طراحی شده، به این صورت که سیستم هوش مصنوعی می‌توانه به صورت مداوم به اصلاح و بهبود پاسخ بپردازه. این روند به نام agentic workflows شناخته می‌شه.

ایشون بیان می‌کنه که با استفاده از این مدل‌های تعاملی، نتایج بهتری حاصل میشه و مثالی از برنامه‌نویسی ارائه می‌دهه که در اون سیستم‌های هوش مصنوعی جدید با بازبینی و اصلاح کدهای خود، عملکردی بهتر از سیستم‌های پیشرفته‌تر دارن.

همچنین میگه که استفاده از ابزارهایی مانند reflection و multi-agent collaboration به‌زودی در توسعه برنامه‌های هوش مصنوعی نقش مهمی ایفا خواهند کرد.

در آخر هم پیش‌بینی می‌کنه که این نوع سیستم‌ها به پیشرفت‌های بزرگی در عملکرد و قابلیت‌های هوش مصنوعی منجر خواهد شد و استفاده از اونها در کارهای پیچیده‌ای مثل تحقیق و توسعه بسیار کارآمد خواهد بود.

https://youtu.be/sal78ACtGTc?feature=shared

یک نمونه دیگه:

مقاله google deepmind هست که در ماه آگوست منتشر شد. این مقاله به بررسی این موضوع میپردازه که اگه به یه مدل زبانی بزرگ (LLM) زمان بیشتری برای استنتاج داده شه تا به پاسخ برسه، این مدل میتونه به عملکردی برسه که با مدلی 14 برابر بزرگ‌تر از اون برابره:

https://arxiv.org/abs/2408.03314

YouTube

What's next for AI agentic workflows ft. Andrew Ng of AI Fund

Andrew Ng, founder of DeepLearning.AI and AI Fund, speaks at Sequoia Capital's AI Ascent about what's next for AI agentic workflows and their potential to significantly propel AI advancements—perhaps even surpassing the impact of the forthcoming generation…

👍6🔥4

4.37K viewsAlister ☄️, edited 12:33

Tensorflow(@CVision)

صحبت های چند ماه پیش Andrew Ng در مورد تحولات آینده و توسعه هوش مصنوعی با امکانات ارایه شده در مدل جدید openai O1 کاملا همخوانی داره. به طور خلاصه در ویدیو میگه: مدل های بزرگ زبانی کنونی، معمولا با وارد کردن یه پرسش یا درخواست، پاسخی رو ارائه میدن. اما…

0:55

This media is not supported in your browser

VIEW IN TELEGRAM

این یه نمونه آزمایشگاهی جالب متن باز استفاده از Llama-3.1 و Groq برای ایجاد زنجیره‌ استدلال مشابه o1 هست.

این روش به مدل اجازه می‌ده تا فکر کنه و مسائل رو با بکارگیری مدل های بزرگتر پیشرو به صورت منطقی حل کنه. برخلاف o1، اینجا همه توکن‌های استدلال نمایش داده می‌شن.

https://github.com/bklieger-groq/g1

👍7

5.08K viewsAlister ☄️, 13:08

Tensorflow(@CVision)

Audio

چطور زنجیره‌ی تفکر(chain of thoughtیا COT) ترانسفورمرها رو برای حل مشکلات ذاتی سریالی توانمند می‌کنه

لینک مقاله:
https://arxiv.org/abs/2402.12875

پادکست تولید شده توسط notebooklm

👍7

4.32K viewsAlister ☄️, edited 03:35

Tensorflow(@CVision)

انویدیا با تمرکز بر مدل‌های پایه برای ربات‌های انسان‌نما، قصد داره ربات‌های هوشمندی رو وارد زندگی روزمره کنه که ممکنه در دهه آینده نحوه زندگی و کار ما رو به طور اساسی تغییر بده.

در این ویدئو جیم فن (یکی از محققین ارشد انویدیا) به چندین موضوع مهم مرتبط با آینده رباتیک، هوش مصنوعی و آزمایشگاه هوش تجسمی انویدیا میپردازه که به صورت خلاصه نکات کلیدی رو به صورت خلاصه در ادامه میارم:

به نقل از جنسن هوانگ، مدیر عامل انویدیا، میگه که

هر چیزی که حرکت می‌کنه، در نهایت خودکار خواهد شد.

این پیش‌بینی بر چشم‌انداز آینده ای تاکید داره که ربات‌ها، به‌ویژه ربات‌های هوشمند و انسان‌نما، در ده سال آینده به اندازه گوشی‌های هوشمند فراگیر میشن. تلاش‌های کنونی انویدیا نیز در راستای همین رونده و بر روی ایجاد یه پلتفرم محاسباتی برای ربات‌های انسان‌نما تمرکز داره

انویدیا پروژه ای به نام Groot رو راه اندازی کرده وهدف این پروژه توسعه مدل‌های هوش مصنوعی پایه برای ربات‌های انسان‌نما ست. این پروژه حول محور ایجاد "AI brain" برای ربات‌های انسان‌نما می‌چرخه و از نقاط قوت انویدیا در زمینه شبیه‌سازی و قدرت محاسباتی بهره می‌بره.

میگه یکی از چالش‌های عمده در توسعه هوش مصنوعی برای رباتیک، در دسترس نبودن داده‌های باکیفته. داده‌های موجود در مقیاس اینترنت، داده‌های واقعی ربات‌ها و داده‌های شبیه‌سازی شده هر یک دارای نقاط قوت و ضعف خاص خود هستن و کلید پیشرفت در رباتیک، استفاده موثر از این منابع داده به صورت ترکیبیه. نبود داده‌های کنترل حرکتی از منابع آنلاین پیشرفت رو محدود می‌کنه، بنابراین شبیه‌سازی به عنوان ابزاری حیاتی، برای تولید داده‌های لازم برای آموزش ربات‌ها به کار میره

همچنین در مورد شباهت‌های بین انقلاب GPT-3 در پردازش زبان طبیعی و پتانسیل یک جهش مشابه در رباتیک صحبت میکنه و معتقده که لحظه مشابه GPT-3 زمانی برای رباتیک زمانی اتفاق میفته که مدل‌های هوش مصنوعی بتونن بطور عمومی مهارت های حرکتی (motor actions) مثل باز کردن در رو در سناریوهای واقعی و مختلف رو انجام بدن. این امر نیازمند پیشرفت‌های قابل توجهی در هر دو سیستم سطح پایین (کنترل حرکتی) و سیستم سطح بالا (استدلال و برنامه‌ریزی) هوش مصنوعه

یکی از دلایلی که انویدیا روی ربات‌های انسان ‌نما تمرکز داره اینه که این ربات‌ها به بهترین شکل میتونن با دنیای موجود که برای انسان‌ها طراحی شده، تعامل کنن. از نظر اقتصادی، ربات‌های انسان نما میتونن صنایع مختلفی مانند بهداشت و درمان، مراقبت از سالمندان و تولید رو با انجام کارهایی مثل پخت و پز، تمیز کردن یا کار در کارخانه متحول کنن. با این حال، علاوه بر پیشرفت‌های فنی، عواملی مثل هزینه، ایمنی و مقررات تعیین کننده این اصله که این ربات‌ها با چه سرعتی به جریان اصلی زندگی وارد خواهند شد.

https://youtu.be/yMGGpMyW_vw?feature=shared

YouTube

Jim Fan on Nvidia’s Embodied AI Lab and Jensen Huang’s Prediction that All Robots will be Autonomous

AI researcher Jim Fan has had a charmed career. He was OpenAI’s first intern before he did his PhD at Stanford with “godmother of AI,” Fei-Fei Li. He graduated into a research scientist position at Nvidia and now leads its Embodied AI “GEAR” group. The lab’s…

❤7👍2

5.87K viewsAlister ☄️, edited 16:06

Tensorflow(@CVision)

https://github.com/zml/zml

🙏12👍3❤1

5K viewsحامد, 12:37

Tensorflow(@CVision)

👍8❤2

5.45K viewsAli B, 17:15

Tensorflow(@CVision)

Advancing the Accuracy-Efficiency Frontier with Llama-3.1-Nemotron-51B

NVIDIA just dropped Nemotron 51B - 220% faster and can handle 400% more workload than Llama 3.1 70B

https://developer.nvidia.com/blog/advancing-the-accuracy-efficiency-frontier-with-llama-3-1-nemotron-51b/

#GenerativeAI #LLMs

NVIDIA Technical Blog

Advancing the Accuracy-Efficiency Frontier with Llama-3.1-Nemotron-51B

Today, NVIDIA released a unique language model that delivers an unmatched accuracy-efficiency performance. Llama 3.1-Nemotron-51B, derived from Meta’s Llama-3.1-70B, uses a novel neural architecture…

🔥3👍2

4.7K views02:26

Tensorflow(@CVision)

Small Language Models: Survey, Measurements, and Insights

https://arxiv.org/abs/2409.15790

arXiv.org

Small Language Models: Survey, Measurements, and Insights

Small language models (SLMs), despite their widespread adoption in modern smart devices, have received significantly less academic attention compared to their large language model (LLM)...

👍6

4.04K viewsVahid, 05:21

Tensorflow(@CVision)

2:25

This media is not supported in your browser

VIEW IN TELEGRAM

آموزش گیتار با chatgpt

👍9🤯7😁3

5.57K views14:41

Tensorflow(@CVision)

جدیدترین مدل مولتی مدالی که توسط allen institute امروز منتشر شد

https://molmo.allenai.org/blog

👍6

5.19K viewsVahid, 16:36

Tensorflow(@CVision)

1:22

This media is not supported in your browser

VIEW IN TELEGRAM

متا از هوش مصنوعی متا با قابلیت تولید صدا رونمایی کرد - رقیب مدل صوتی پیشرفته OpenAI

👍5

4.5K viewsAlister ☄️, 04:47

Tensorflow(@CVision)

متا مجموعه جدیدی از مدل‌های Llama 3.2 رو برای متن (1B، 3B) و بینایی (11B، 90B) منتشر کرد.

به صورت خلاصه :

مدل‌های جدید متنی 1B و 3B با 9 تریلیون توکن آموزش دیدن

مدل‌های چندوجهی بینایی جدید 11B و 90B روی 6 میلیارد زوج تصویر و متن آموزش دیدن

طول متن قابل پردازش 128K هست

مدل‌های 1B و 3B از برخی روش‌های تقطیر مدل‌های 8B و 70B استفاده کردن

ارزیابی‌ها برای مدل‌های کوچک 1B و 3B و مدل‌های چندوجهی بینایی 11B و 90B بسیار خوبه. 1B در آزمون MMLU نمره 49.3 و 3B نمره 63.4 رو کسب کردن. مدل‌های چندوجهی بینایی در آزمون MMMU نمره 50.7 و 90B نمره 60.3 رو کسب کردن

https://huggingface.co/collections/meta-llama/llama-32-66f448ffc8c32f949b04c8cf

👍10🔥7

5.8K viewsAlister ☄️, edited 04:56

Tensorflow(@CVision)

0:19

This media is not supported in your browser

VIEW IN TELEGRAM

آموزش انتقال سبک جالب در comfyUI

https://learn.thinkdiffusion.com/transform-videos-with-ai-dancing-noodles-step-by-step-tutorial/#what-is-style-transfer-in-ai

👍11

4.26K viewsAlister ☄️, 15:41

Tensorflow(@CVision)

0:30

This media is not supported in your browser

VIEW IN TELEGRAM

رقیب جدید Sora از متا
Meta Movie Gen

https://ai.meta.com/research/movie-gen/

🔥10

5.37K viewsAlister ☄️, 16:40

Tensorflow(@CVision)

0:48

This media is not supported in your browser

VIEW IN TELEGRAM

OpenAI

یک رابط کاربری جدید به نام "Canvas" معرفی کرده که به کاربران اجازه میده در کنار چت معمولی، روی پروژه‌های نوشتن و کدنویسی کار کنن. این ابزار یه فضای کاری جداگانه در یک پنجره جدید باز میکنه که کاربران میتونن در اون متن یا کد تولید کنن و بخش‌هایی رو برای ویرایش مشخص کنن

Canvas

از روز گذشته برای کاربران ChatGPT Plus و Teams در دسترسهو هفته آینده برای کاربران Enterprise و Edu ارائه میشه.

این قابلیت شبیه به ابزارهای دیگری مانند "Artifacts" از Anthropic و "Cursor" هست که برای کمک به کدنویسی طراحی شدن. با استفاده از Canvas، کاربران میتونن خروجی مدل هوش مصنوعی رو بدون نیاز به نوشتن مجدد تمام متن یا کد ویرایش کنن

Canvas

همچنین ابزارهای جدیدی برای کدنویسی ارائه میده، مانند اضافه کردن مستندات به کد یا بررسی و پیشنهاد اصلاحات برای رفع باگ‌ها. این ابزار به زودی پس از پایان نسخه بتا برای کاربران رایگان نیز عرضه خواهد شد.

👌5👍3

6.57K viewsAlister ☄️, 17:02

2025/07/13 11:11:25
Back to Top

HTML Embed Code:

<iframe width="100%" src="https://www.bootg.com/buyppe/web?embed=1" title="Telegram Web" frameborder="0" allow="accelerometer; autoplay; clipboard-write; encrypted-media; gyroscope; picture-in-picture" allowfullscreen></iframe>