خیلی از مدلهای Vision Language Model (VLM) را میشه برای فهمیدن ویدیو هم استفاده کرد. مثلا با Gemma 3.
این مدل با ترکیب تصاویر و متن، میتونه فریمهای ویدیو رو پردازش کنه و خلاصهای مفید از اتفاقات ارائه بده.
چطور کار میکنه؟
با استخراج فریمهای کلیدی از ویدیو، اضافه کردن زمانبندی و ارسال اونها به مدل همراه با یک پیام متنی، Gemma 3 میتونه محتوای ویدیو رو تفسیر کنه. مراحل این فرایند شامل:
- بارگذاری مدل: با استفاده از AutoProcessor و AutoModelForVision2Seq از Hugging Face، مدل رو برای پردازش دادههای تصویری آماده میکنیم.
- استخراج فریمها: ویدیو کاهش اندازه داده میشه و فریمهای مهم در زمانهای مشخص گرفته میشن.
- تولید خلاصه: مدل این فریمها رو تحلیل میکنه و خلاصهای از اتفاقات ویدیو ارائه میده.
این روش برای کارهای مختلفی مثل سرچ روی ویدیو، تحلیل ویدیوهای نظارتی و خلاصهسازی محتوا خیلی کاربردیه.
کد را هم تو عکس میبینید.
🆔 @Ai_Tv
این مدل با ترکیب تصاویر و متن، میتونه فریمهای ویدیو رو پردازش کنه و خلاصهای مفید از اتفاقات ارائه بده.
چطور کار میکنه؟
با استخراج فریمهای کلیدی از ویدیو، اضافه کردن زمانبندی و ارسال اونها به مدل همراه با یک پیام متنی، Gemma 3 میتونه محتوای ویدیو رو تفسیر کنه. مراحل این فرایند شامل:
- بارگذاری مدل: با استفاده از AutoProcessor و AutoModelForVision2Seq از Hugging Face، مدل رو برای پردازش دادههای تصویری آماده میکنیم.
- استخراج فریمها: ویدیو کاهش اندازه داده میشه و فریمهای مهم در زمانهای مشخص گرفته میشن.
- تولید خلاصه: مدل این فریمها رو تحلیل میکنه و خلاصهای از اتفاقات ویدیو ارائه میده.
این روش برای کارهای مختلفی مثل سرچ روی ویدیو، تحلیل ویدیوهای نظارتی و خلاصهسازی محتوا خیلی کاربردیه.
کد را هم تو عکس میبینید.
🆔 @Ai_Tv
❤8👍4
شرکت Sesame AI مدل گفتاری پیشرفته CSM-1B را متنباز کرد! این مدل، موتور صوتی پیشرفتهی دستیار مایا، با ۱ میلیارد پارامتر، اکنون برای همه آزاد است.
https://github.com/SesameAILabs/csm
🆔 @Ai_Tv
https://github.com/SesameAILabs/csm
🆔 @Ai_Tv
GitHub
GitHub - SesameAILabs/csm: A Conversational Speech Generation Model
A Conversational Speech Generation Model. Contribute to SesameAILabs/csm development by creating an account on GitHub.
👍7
آموزش Generative AI از پایه برای مبتدیان
https://youtube.com/playlist?list=PLPTV0NXA_ZSh_HfFtLf5p8hPAW8a7Tr2a&si=FBLd19vzHpYySPZm
#هوش_مصنوعی
🆔 @Ai_Tv
https://youtube.com/playlist?list=PLPTV0NXA_ZSh_HfFtLf5p8hPAW8a7Tr2a&si=FBLd19vzHpYySPZm
#هوش_مصنوعی
🆔 @Ai_Tv
YouTube
Generative AI: From Fundamentals to Deployment
This comprehensive course covers the essential concepts and techniques in Generative AI, focusing on Large Language Models (LLMs) and their practical applica...
👍4
این رپو یکی از بهترین منابع یادگیری برای مهندسی داده هست. در واقع علاوه تمام اجزایی که نیاز هست برای یادگیری مهندسی داده داخلش اومده. با سه ماه تمرین و ممارست هرروزه میتونید به سطح خوبی از یادیگیری برسید.
از معماری پایپلاین بگیر تا بچ پروسسینگ و استریمینگ
https://github.com/DataTalksClub/data-engineering-zoomcamp
#هوش_مصنوعی #علم_داده
🆔 @Ai_Tv
از معماری پایپلاین بگیر تا بچ پروسسینگ و استریمینگ
https://github.com/DataTalksClub/data-engineering-zoomcamp
#هوش_مصنوعی #علم_داده
🆔 @Ai_Tv
GitHub
GitHub - DataTalksClub/data-engineering-zoomcamp: Data Engineering Zoomcamp is a free nine-week course that covers the fundamentals…
Data Engineering Zoomcamp is a free nine-week course that covers the fundamentals of data engineering. - DataTalksClub/data-engineering-zoomcamp
❤4
چی میشد اگر یک مدل زبانی ویژه ریسرچر ها وجود داشت که تنها از اطلاعات معتبر و صحیح اینترنت استفاده میکرد و از منابع معتبر استفاده میکرد و لینک مستقیم به مقالات را ارائه میداد؟
خوش باشید چون حالا که شده است:
https://consensus.app/search/
#هوش_مصنوعی #علم_داده
🆔 @Ai_Tv
خوش باشید چون حالا که شده است:
https://consensus.app/search/
#هوش_مصنوعی #علم_داده
🆔 @Ai_Tv
consensus.app
Search - Consensus: AI Search Engine for Research
Consensus is a search engine that uses AI to find answers in scientific research.
❤4🙏4👍1
10 Lessons to Get Started Building AI Agents - AI Agents for Beginners
https://github.com/microsoft/ai-agents-for-beginners
#هوش_مصنوعی
🆔 @Ai_Tv
https://github.com/microsoft/ai-agents-for-beginners
#هوش_مصنوعی
🆔 @Ai_Tv
GitHub
GitHub - microsoft/ai-agents-for-beginners: 11 Lessons to Get Started Building AI Agents
11 Lessons to Get Started Building AI Agents. Contribute to microsoft/ai-agents-for-beginners development by creating an account on GitHub.
👍2
یکی از بهترین اپلیکیشن ها و کاربردهای ایجنت ها برای deep (Re)search هست. یعنی برای موضوعی نیاز دارید که یک تحقیق و ریسرچ عمیق انجام بدید. اگه دوست دارید بدونید این ایجنت چطور کار میکنه و حتا خودتون بتونید یک ورژن ازش برای خودتون پیاده سازی کنید، حتما این بلاگ را بخونید. با شکل و قدم قدم مراحل توضیح میده. البته مقالات دیگه هم هست ولی این برای اول کار راحت تره.
Link: https://www.newsletter.swirlai.com/p/building-deep-research-agent-from
#هوش_مصنوعی
🆔 @Ai_Tv
Link: https://www.newsletter.swirlai.com/p/building-deep-research-agent-from
#هوش_مصنوعی
🆔 @Ai_Tv
❤5
This media is not supported in your browser
VIEW IN TELEGRAM
یک مقاله جدید اومده که یک روش جدید برای depth estimation (اندازه گیری فاصله هر پیکسل از دوربین) ارائه داده. به چه درد میخوره؟ برای کارهای مختلف از جمله روباتیک یا درست کردن تصویر ۳ بعدی از روی تصویر ۲ بعدی، ماشینهای خودران، پزشکی و خیلی کارهای دیگه استفاده میشه. جالبی این روش اینه که از LiDAR به عنوان پرامپت استفاده میکنن تا عمق را خیلی دقیق تا رزولوشن 4k اندازه گیری کنن. لینک مقاله و کد و مدل:
Link: https://promptda.github.io/
#هوش_مصنوعی
🆔 @Ai_Tv
Link: https://promptda.github.io/
#هوش_مصنوعی
🆔 @Ai_Tv
👍11❤2
تا زمانی که رایگان هست حتما Gemini 2.5 Pro رو تست بکنین، مخصوصا اگه برنامه نویس هستین یا محقق.
همین token context window یک میلیونی یعنی میتونین کل یه کدبیس بزرگ، چندین مقاله طولانی، یا حتی یک کتاب کامل رو بهش بدین بدون اینکه اطلاعات اولیه رو فراموش کنه
https://aistudio.google.com/
#هوش_مصنوعی
🆔 @Ai_Tv
همین token context window یک میلیونی یعنی میتونین کل یه کدبیس بزرگ، چندین مقاله طولانی، یا حتی یک کتاب کامل رو بهش بدین بدون اینکه اطلاعات اولیه رو فراموش کنه
https://aistudio.google.com/
#هوش_مصنوعی
🆔 @Ai_Tv
Google
Google AI Studio
Google AI Studio is the fastest way to start building with Gemini, our next generation family of multimodal generative AI models.
👍7
Forwarded from FaraDars_Course
⏳ فقط تا امشب ⏳
💥 برای اولین بار، ۷۵⁒ تخفیف
روی تمام آموزشهای «هوش مصنوعی و برنامه نویسی» در فرادرس 💥
▫️ کاربرد ChatGPT در برنامه نویسی پایتون
▫️ تحلیل مالی با هوش مصنوعی ChatGPT
▫️ چت با هوش مصنوعی ChatGPT و جمینای
▫️ مبانی و شروع کار با ChatGPT و Gemini
▫️ هوش مصنوعی برای توسعه دهندگان وردپرس
🎊 تمامی آموزشهای فرادرس [کلیک کنید]
🎁 کد تخفیف ۷۵ درصدی: EYD75
🔄 FaraDars - فرادرس
💥 برای اولین بار، ۷۵⁒ تخفیف
روی تمام آموزشهای «هوش مصنوعی و برنامه نویسی» در فرادرس 💥
▫️ کاربرد ChatGPT در برنامه نویسی پایتون
▫️ تحلیل مالی با هوش مصنوعی ChatGPT
▫️ چت با هوش مصنوعی ChatGPT و جمینای
▫️ مبانی و شروع کار با ChatGPT و Gemini
▫️ هوش مصنوعی برای توسعه دهندگان وردپرس
🎊 تمامی آموزشهای فرادرس [کلیک کنید]
🎁 کد تخفیف ۷۵ درصدی: EYD75
🔄 FaraDars - فرادرس
Forwarded from رویدادهای دانشجویی و دوره های آموزشی
در دانشگاه تهران در حال انجام مطالعهای تخصصی درباره تحول دیجیتال و توسعه پایدار هستیم.
نظرات ارزشمند شما به عنوان متخصص، مدیر و فعال این حوزه، نقش کلیدی در توسعه دانش کاربردی مدیریت و کارآفرینی و تدوین راهکارهای عملی برای کسبوکارهای ایرانی خواهد داشت.
🔹 زمان تقریبی تکمیل پرسشنامه: حدود 5 دقیقه.
🔹 اطلاعات شما کاملاً محرمانه خواهد ماند.
🔹 نتایج این پژوهش در صورت تمایل برای شما ارسال خواهد شد.
لینک پرسشنامه:
https://survey.porsline.ir/s/gRk1lohf
نظرات ارزشمند شما به عنوان متخصص، مدیر و فعال این حوزه، نقش کلیدی در توسعه دانش کاربردی مدیریت و کارآفرینی و تدوین راهکارهای عملی برای کسبوکارهای ایرانی خواهد داشت.
🔹 زمان تقریبی تکمیل پرسشنامه: حدود 5 دقیقه.
🔹 اطلاعات شما کاملاً محرمانه خواهد ماند.
🔹 نتایج این پژوهش در صورت تمایل برای شما ارسال خواهد شد.
لینک پرسشنامه:
https://survey.porsline.ir/s/gRk1lohf
چطور میتونیم از جدیدترین llm هایی که گوگل میده بیرون استفاده کنیم و api رایگان خوبی هم ازشون دریافت کنیم.
گوگل یه وبسایت داره که احتمالا یه سری ها بشناسن به نام ai studio که اونجا میتونید با مدل های gemini کار کنید و api بگیرید.
در پستهای بعدی بررسی میکنیم
#هوش_مصنوعی
🆔 @Ai_Tv
گوگل یه وبسایت داره که احتمالا یه سری ها بشناسن به نام ai studio که اونجا میتونید با مدل های gemini کار کنید و api بگیرید.
در پستهای بعدی بررسی میکنیم
#هوش_مصنوعی
🆔 @Ai_Tv
👍2
گرفتن api از ai studio کار سختی نیست ولی سختی اصلی برای billing هست و پرداخت برای همین این api برای ما ایرانی ها بیشتر برای تست و ساخت دمو هامون خوبه( پروژه های کوچیک هم خوبه)
با پلن رایگان میتونید از flash 2 روز ۱۵۰۰ ریکوست با ریت لیمیت ۱۵ در دقیقه استفاده کنید که خوبه
#هوش_مصنوعی
🆔 @Ai_Tv
با پلن رایگان میتونید از flash 2 روز ۱۵۰۰ ریکوست با ریت لیمیت ۱۵ در دقیقه استفاده کنید که خوبه
#هوش_مصنوعی
🆔 @Ai_Tv
👍4
اما باید یه کار دیگه هم بکنیم، گوگل api اش با سیستم openai به صورت دیفالت فرق داره و کلاینت خودشو داره، برای راحتی کار میتونیم با کمک api openai compatible اش بیایم و کد هامون رو با همون فرمت openai ببریم جلو و base url رو به گوگل تغییر بدیم مثل این کد 👆
لینک ai studio
https://aistudio.google.com/prompts/new_chat
لینک داکیومنت گوگل برای openai api compatibility
https://ai.google.dev/gemini-api/docs/openai
#هوش_مصنوعی
🆔 @Ai_Tv
لینک ai studio
https://aistudio.google.com/prompts/new_chat
لینک داکیومنت گوگل برای openai api compatibility
https://ai.google.dev/gemini-api/docs/openai
#هوش_مصنوعی
🆔 @Ai_Tv
❤7👍2
گوگل به شکل گسترده ویژگی Talk Live about this رو توی نسخه اندرویدی Gemini منتشر کرد، این ویژگی اینجوریه که میتونید عکس یا یه فایل و حتی ویدیو یوتیوب رو به جمنای بدید بعد در موردش باهاش مکالمه صوتی داشته باشید.
#هوش_مصنوعی
🆔 @Ai_Tv
#هوش_مصنوعی
🆔 @Ai_Tv
❤9👍1
سرویس Bizplanr بیزنسپلن براتون درست می کنه.
رایگانه، کیفیتش هم خوبه
https://bizplanr.ai/
البته یه مدل ۷ دلار ماهانه هم داره با کلی فیچر
#هوش_مصنوعی
🆔 @Ai_Tv
رایگانه، کیفیتش هم خوبه
https://bizplanr.ai/
البته یه مدل ۷ دلار ماهانه هم داره با کلی فیچر
#هوش_مصنوعی
🆔 @Ai_Tv
👍1
Forwarded from FaraDars_Course
✅ «قواعد برنامه نویسی و کدنویسی تمیز» را حرفهای بیاموزیم!! ✅
💯 ۷۵ درصد تخفیف ویژه در فرادرس برای همهی آموزشها 💯
💎 در سال نو، برای یادگیری مهارتهای جدید برنامهریزی کنید و این فرصت تکرار نشدنی را از دست ندهید...
🔹 مبانی برنامه نویسی – الگوریتم و فلوچارت
🔹 کدنویسی تمیز Clean Code برای برنامه نویسی
🔹 کدنویسی تمیز برای بهینه سازی و خواناتر شدن کد
🔹 قواعد نام گذاری در برنامه نویسی - استاندارد مایکروسافت
🔹 اصول و مبانی برنامه نویسی - رایگان
🔹 معرفی کتاب کد نویس تمیز Clean Coder – رایگان
🔗 مشاهده سایر آموزشها – [کلیک کنید]
🎁 کد تخفیف ۷۵ درصدی: EYD75
🔄 FaraDars - فرادرس
💯 ۷۵ درصد تخفیف ویژه در فرادرس برای همهی آموزشها 💯
💎 در سال نو، برای یادگیری مهارتهای جدید برنامهریزی کنید و این فرصت تکرار نشدنی را از دست ندهید...
🔹 مبانی برنامه نویسی – الگوریتم و فلوچارت
🔹 کدنویسی تمیز Clean Code برای برنامه نویسی
🔹 کدنویسی تمیز برای بهینه سازی و خواناتر شدن کد
🔹 قواعد نام گذاری در برنامه نویسی - استاندارد مایکروسافت
🔹 اصول و مبانی برنامه نویسی - رایگان
🔹 معرفی کتاب کد نویس تمیز Clean Coder – رایگان
🔗 مشاهده سایر آموزشها – [کلیک کنید]
🎁 کد تخفیف ۷۵ درصدی: EYD75
🔄 FaraDars - فرادرس
👍1