Telegram Web Link
خیلی از مدلهای Vision Language Model (VLM) را میشه برای فهمیدن ویدیو هم استفاده کرد. مثلا با Gemma 3.
این مدل با ترکیب تصاویر و متن، می‌تونه فریم‌های ویدیو رو پردازش کنه و خلاصه‌ای مفید از اتفاقات ارائه بده.
چطور کار می‌کنه؟
با استخراج فریم‌های کلیدی از ویدیو، اضافه کردن زمان‌بندی و ارسال اون‌ها به مدل همراه با یک پیام متنی، Gemma 3 می‌تونه محتوای ویدیو رو تفسیر کنه. مراحل این فرایند شامل:

- بارگذاری مدل: با استفاده از AutoProcessor و AutoModelForVision2Seq از Hugging Face، مدل رو برای پردازش داده‌های تصویری آماده می‌کنیم.

- استخراج فریم‌ها: ویدیو کاهش اندازه داده می‌شه و فریم‌های مهم در زمان‌های مشخص گرفته می‌شن.

- تولید خلاصه: مدل این فریم‌ها رو تحلیل می‌کنه و خلاصه‌ای از اتفاقات ویدیو ارائه می‌ده.

این روش برای کارهای مختلفی مثل سرچ روی ویدیو، تحلیل ویدیوهای نظارتی و خلاصه‌سازی محتوا خیلی کاربردیه.
کد را هم تو عکس میبینید.


🆔 @Ai_Tv
8👍4
شرکت Sesame AI مدل گفتاری پیشرفته CSM-1B را متن‌باز کرد! این مدل، موتور صوتی پیشرفته‌ی دستیار مایا، با ۱ میلیارد پارامتر، اکنون برای همه آزاد است.
https://github.com/SesameAILabs/csm



🆔 @Ai_Tv
👍7
این رپو یکی از بهترین منابع یادگیری برای مهندسی داده هست. در واقع علاوه تمام اجزایی که نیاز هست برای یادگیری مهندسی داده داخلش اومده. با سه ماه تمرین و ممارست هرروزه میتونید به سطح خوبی از یادیگیری برسید.
از معماری پایپلاین بگیر تا بچ پروسسینگ و استریمینگ
https://github.com/DataTalksClub/data-engineering-zoomcamp

#هوش‌_مصنوعی #علم_داده

🆔 @Ai_Tv
4
چی می‌شد اگر یک مدل زبانی ویژه ریسرچر ها وجود داشت که تنها از اطلاعات معتبر و صحیح اینترنت استفاده می‌کرد و از منابع معتبر استفاده می‌کرد و لینک مستقیم به مقالات را ارائه می‌داد؟
خوش باشید چون حالا که شده است:
https://consensus.app/search/


#هوش‌_مصنوعی #علم_داده

🆔 @Ai_Tv
4🙏4👍1
یکی از بهترین اپلیکیشن ها و کاربردهای ایجنت ها برای deep (Re)search هست. یعنی برای موضوعی نیاز دارید که یک تحقیق و ریسرچ عمیق انجام بدید. اگه دوست دارید بدونید این ایجنت چطور کار میکنه و حتا خودتون بتونید یک ورژن ازش برای خودتون پیاده سازی کنید، حتما این بلاگ را بخونید. با شکل و قدم قدم مراحل توضیح میده. البته مقالات دیگه هم هست ولی این برای اول کار راحت تره.
Link: https://www.newsletter.swirlai.com/p/building-deep-research-agent-from



#هوش‌_مصنوعی
🆔 @Ai_Tv
5
This media is not supported in your browser
VIEW IN TELEGRAM
یک مقاله جدید اومده که یک روش جدید برای depth estimation (اندازه گیری فاصله هر پیکسل از دوربین) ارائه داده. به چه درد میخوره؟ برای کارهای مختلف از جمله روباتیک یا درست کردن تصویر ۳ بعدی از روی تصویر ۲ بعدی، ماشینهای خودران، پزشکی و خیلی کارهای دیگه استفاده میشه. جالبی این روش اینه که از LiDAR به عنوان پرامپت استفاده میکنن تا عمق را خیلی دقیق تا رزولوشن 4k اندازه گیری کنن. لینک مقاله و کد و مدل:
Link: https://promptda.github.io/



#هوش‌_مصنوعی
🆔 @Ai_Tv
👍112
تا زمانی که رایگان هست حتما Gemini 2.5 Pro رو تست بکنین، مخصوصا اگه برنامه نویس هستین یا محقق.

همین token context window یک میلیونی یعنی میتونین کل یه کدبیس بزرگ، چندین مقاله طولانی، یا حتی یک کتاب کامل رو بهش بدین بدون اینکه اطلاعات اولیه رو فراموش کنه
https://aistudio.google.com/



#هوش‌_مصنوعی
🆔 @Ai_Tv
👍7
Forwarded from FaraDars_Course
فقط تا امشب 
 
💥 برای اولین بار، ۷۵⁒ تخفیف
روی تمام آموزش‌های «هوش مصنوعی و برنامه نویسی» در فرادرس 💥
 
▫️ کاربرد ChatGPT در برنامه نویسی پایتون
 
▫️ تحلیل مالی با هوش مصنوعی ChatGPT
 
▫️ چت با هوش مصنوعی ChatGPT و جمینای
 
▫️ مبانی و شروع کار با ChatGPT و Gemini
 
▫️ هوش مصنوعی برای توسعه دهندگان وردپرس
 
🎊 تمامی آموزش‌های فرادرس [کلیک کنید]
 
🎁 کد تخفیف ۷۵ درصدی: EYD75

🔄 FaraDars - فرادرس
در دانشگاه تهران در حال انجام مطالعه‌ای تخصصی درباره تحول دیجیتال و توسعه پایدار هستیم.
نظرات ارزشمند شما به عنوان متخصص، مدیر و فعال این حوزه، نقش کلیدی در توسعه دانش کاربردی مدیریت و کارآفرینی و تدوین راهکارهای عملی برای کسب‌وکارهای ایرانی خواهد داشت.

🔹 زمان تقریبی تکمیل پرسشنامه: حدود 5 دقیقه.
🔹 اطلاعات شما کاملاً محرمانه خواهد ماند.
🔹 نتایج این پژوهش در صورت تمایل برای شما ارسال خواهد شد.

لینک پرسشنامه:
https://survey.porsline.ir/s/gRk1lohf
چطور میتونیم از جدیدترین llm هایی که گوگل میده بیرون استفاده کنیم و api رایگان خوبی هم ازشون دریافت کنیم.

گوگل یه وبسایت داره که احتمالا یه سری ها بشناسن به نام ai studio که اونجا میتونید با مدل های gemini کار کنید و api بگیرید.

در پستهای بعدی بررسی می‌کنیم


#هوش_مصنوعی


🆔 @Ai_Tv
👍2
گرفتن api از ai studio کار سختی نیست ولی سختی اصلی برای billing هست و پرداخت برای همین این api برای ما ایرانی ها بیشتر برای تست و ساخت دمو هامون خوبه( پروژه های کوچیک هم خوبه)

با پلن رایگان میتونید از flash 2 روز ۱۵۰۰ ریکوست با ریت لیمیت ۱۵ در دقیقه استفاده کنید که خوبه

#هوش_مصنوعی


🆔 @Ai_Tv
👍4
اما باید یه کار دیگه هم بکنیم، گوگل api اش با سیستم openai به صورت دیفالت فرق داره و کلاینت خودشو داره، برای راحتی کار میتونیم با کمک api openai compatible اش بیایم و کد هامون رو با همون فرمت openai ببریم جلو و base url رو به گوگل تغییر بدیم مثل این کد 👆

لینک ai studio
https://aistudio.google.com/prompts/new_chat

لینک داکیومنت گوگل برای openai api compatibility
https://ai.google.dev/gemini-api/docs/openai


#هوش_مصنوعی  


🆔 @Ai_Tv
7👍2
گوگل به شکل گسترده ویژگی Talk Live about this رو توی نسخه اندرویدی Gemini منتشر کرد، این ویژگی اینجوریه که میتونید عکس یا یه فایل و حتی ویدیو یوتیوب رو به جمنای بدید بعد در موردش باهاش مکالمه صوتی داشته باشید.


#هوش_مصنوعی  


🆔 @Ai_Tv
9👍1
سرویس Bizplanr بیزنس‌پلن براتون درست می کنه.
رایگانه، کیفیتش هم خوبه

https://bizplanr.ai/
البته یه مدل ۷ دلار ماهانه هم داره با کلی فیچر


#هوش_مصنوعی  


🆔 @Ai_Tv
👍1
Forwarded from FaraDars_Course
«قواعد برنامه نویسی و کدنویسی تمیز» را حرفه‌ای بیاموزیم!!
 
💯 ۷۵ درصد تخفیف ویژه در فرادرس برای همه‌ی آموزش‌ها 💯
 
💎 در سال نو، برای یادگیری مهارت‌های جدید برنامه‌ریزی کنید و این فرصت تکرار نشدنی را از دست ندهید...
 
🔹 مبانی برنامه نویسی – الگوریتم و فلوچارت
 
🔹 کدنویسی تمیز Clean Code برای برنامه نویسی
 
🔹 کدنویسی تمیز برای بهینه سازی و خواناتر شدن کد
 
🔹 قواعد نام گذاری در برنامه نویسی - استاندارد مایکروسافت
 
🔹 اصول و مبانی برنامه نویسی - رایگان
 
🔹 معرفی کتاب کد نویس تمیز Clean Coder – رایگان
 
🔗 مشاهده سایر آموزش‌ها – [کلیک کنید]
 
🎁 کد تخفیف ۷۵ درصدی: EYD75

🔄 FaraDars - فرادرس
👍1
2025/07/13 20:53:58
Back to Top
HTML Embed Code: