مقاله زیر به معرفی مدل YOLOE میپردازد که یک مدل یکپارچه و کارآمد برای تشخیص و بخشبندی اشیاء است. این مدل قابلیت پردازش پرامپتهای متنی، پرامپتهای بصری و حالت بدون پرامپت را داراست و در سناریوهای باز عملکرد بالایی ارائه میدهد.مدلهای سنتی مانند سری YOLO با وجود کارایی و دقت بالا، به دستهبندیهای از پیش تعریفشده محدود هستند که انعطافپذیری آنها را در سناریوهای باز کاهش میدهد. روشهای اخیر برای غلبه بر این محدودیتها از پرامپتهای متنی، نشانههای بصری یا پارادایمهای بدون پرامپت استفاده میکنند، اما معمولاً بین عملکرد و کارایی به دلیل نیازهای محاسباتی بالا یا پیچیدگی در پیادهسازی مصالحه میکنند. YOLOE با ادغام مکانیزمهای مختلف پرامپت در یک مدل کارآمد، امکان مشاهدهٔ هر چیزی در زمان واقعی را فراهم میکند. برای پرامپتهای متنی، استراتژی همترازی مجدد منطقه-متن قابل بازپارامتریسازی (RepRTA) معرفی شده است که با استفاده از یک شبکهٔ کمکی سبک، جاسازیهای متنی پیشآموزشدیده را بهبود میبخشد و همترازی بصری-متنی را بدون افزایش هزینهٔ استنتاج و انتقال تقویت میکند. برای پرامپتهای بصری، رمزگذار پرامپت بصری فعالشده توسط معناشناسی (SAVPE) ارائه شده است که با استفاده از شاخههای جداگانهٔ معناشناسی و فعالسازی، جاسازیهای بصری بهبود یافته و دقت را با حداقل پیچیدگی بهبود میبخشد. در سناریوی بدون پرامپت، استراتژی مقایسهٔ تنبل منطقه-پرامپت (LRPC) معرفی شده است که با استفاده از یک واژگان بزرگ داخلی و جاسازیهای تخصصی، تمام اشیاء را شناسایی میکند و از وابستگی به مدلهای زبانی پرهزینه جلوگیری میکند.
▪️ YOLOE: Real-Time Seeing Anything
▪️ GitHub
#مقاله #ایده_جذاب #پایتون
🔸 مطالب بیشتر 👇👇
✅ @AI_DeepMind
🔸 @AI_Person
▪️ YOLOE: Real-Time Seeing Anything
▪️ GitHub
#مقاله #ایده_جذاب #پایتون
🔸 مطالب بیشتر 👇👇
✅ @AI_DeepMind
🔸 @AI_Person
👍6
This media is not supported in your browser
VIEW IN TELEGRAM
تبلیغ Perplexity با بازیگر اصلی اسکویید گیم
گوگل رو هم مسخره کرده
میگن خودش یکی از سهامدارن این استارت آپ هستش
تو این تبلیغ گوگل رو حسابی دیس کرده و اسمش رو گذاشته poogle که وقتی لی ازش سوال میپرسه خیلی بی خاصیت عمل میکنه ولی درمقابل پرپلکسیتی سوالات رو سریع جواب میده و به خصوص توی سوال نحوه پخت پیتزا میگه توش چسب نریز که اینم یه دیس سنگین دیگه واسه فاجعه ai overview گوگل هست.
گوگل رو هم مسخره کرده
میگن خودش یکی از سهامدارن این استارت آپ هستش
تو این تبلیغ گوگل رو حسابی دیس کرده و اسمش رو گذاشته poogle که وقتی لی ازش سوال میپرسه خیلی بی خاصیت عمل میکنه ولی درمقابل پرپلکسیتی سوالات رو سریع جواب میده و به خصوص توی سوال نحوه پخت پیتزا میگه توش چسب نریز که اینم یه دیس سنگین دیگه واسه فاجعه ai overview گوگل هست.
👍10❤7👎2🔥1
زردی من از تو
سرخی تو از من
غم برو شادی بیا
محنت برو روزی بیا
چهارشنبه سوری بر همگان خجسته باد
سرخی تو از من
غم برو شادی بیا
محنت برو روزی بیا
چهارشنبه سوری بر همگان خجسته باد
❤38👎7👍1
Media is too big
VIEW IN TELEGRAM
قطعه《نوروز》
بیا بیا دلبروک مو قربون تو شم دنیا دو روزه
بیا مکن شو روز مو خورشید مو صبح نوروزه
دیدی چطو مانند او یک سال برفت، سال نو اومد؟
یکسال چنو تندِ برفت که پندری همی دیروزه
آی بیا که نوروزه دنیا دو روزه
تا عالمی ، جون دلم، چشمم خو ورسوزه
بینه که قد تو کمون و پشت مو قوزه
بیا بیا دلبروک مو قربون تو شم دنیا دو روزه
بیا مکن شو روز مو خورشید مو صبح نوروزه
دیدی چطو مانند او یک سال برفت، سال نو اومد؟
یکسال چنو تندِ برفت که پندری همی دیروزه
آی بیا که نوروزه دنیا دو روزه
تا عالمی ، جون دلم، چشمم خو ورسوزه
بینه که قد تو کمون و پشت مو قوزه
❤18
سلام.. اگر در حوزه object detection کار میکنید آخرین مقاله literature review ما که شامل بررسی 260 مقاله در زمینه کاربرد context در تشخیص اشیا در هفت شاخه Object detection هست میتونه کمکتون کنه.
https://link.springer.com/article/10.1007/s10462-025-11186-x
https://link.springer.com/article/10.1007/s10462-025-11186-x
SpringerLink
Context in object detection: a systematic literature review
Artificial Intelligence Review - Context is an important factor in computer vision as it offers valuable information to clarify and analyze visual data. Utilizing the contextual information...
❤14👍5🔥1
Forwarded from Recommender system (MehriMah Amiri)
What is overfitting in machine learning?
Anonymous Quiz
15%
When a model memorizes the training data but still achieves low error on unseen test data.
13%
When a model is trained for too many epochs, making it sensitive to minor variations in the training
52%
When a model is too complex and fits the training data perfectly but struggles to adapt to new patte
19%
When a model captures noise in the training data, leading to poor generalization on new data.
👎59👍10🔥1
This media is not supported in your browser
VIEW IN TELEGRAM
نوروزتون مبارک عزیزان
با ارزوی موفقیت و تندرستی برای شما و خانواده های بزرگوارتون سال ۴۰۴ براتون سالی برای هرانچه ک میخواید رقم بخوره باشه
با ارزوی موفقیت و تندرستی برای شما و خانواده های بزرگوارتون سال ۴۰۴ براتون سالی برای هرانچه ک میخواید رقم بخوره باشه
❤20👎3
DeepMind AI Expert
نوروزتون مبارک عزیزان با ارزوی موفقیت و تندرستی برای شما و خانواده های بزرگوارتون سال ۴۰۴ براتون سالی برای هرانچه ک میخواید رقم بخوره باشه
Media is too big
VIEW IN TELEGRAM
نوروزتون مبارک ❤️ در این مدت که همراه کانال بودین سپاسگزارم. امیدوارم که سالی درخشان در زندگیتون تجربه کنید همان باشد که در خاطر دارید❤️
❤26🆒1
سلولهایی که گمان میرفت «لال» هستند، در واقع بهصورت الکتریکی با یکدیگر صحبت میکنند!
برای سالها، دانشمندان بر این باور بودند که تنها سلولهای عصبی و قلبی از پیامهای الکتریکی برای ارتباط استفاده میکنند، در حالی که سلولهای اپیتلیال – که سطح پوست، اندامها و حفرههای بدن را پوشش میدهند – صرفاً بهعنوان موانعی غیرفعال در نظر گرفته میشدند که وظیفه جذب و ترشح مواد را بر عهده دارند. اما اکنون، محققان دانشگاه ماساچوست امهرست این تصور را زیر و رو کردهاند!
محققان دانشگاه ماساچوست امهرست کشف کردهاند که سلولهای اپیتلیال با استفاده از سیگنالهای الکتریکی کند با یکدیگر ارتباط برقرار میکنند، قابلیتی که پیش از این ناشناخته بود. مطالعه آنها که در مجله PNAS منتشر شده است، نشان میدهد که این سلولها هنگام آسیب دیدن به نوعی به همسایگان خود «فریاد» میزنند و سیگنالهایی را از طریق جریانهای یون کلسیم منتقل میکنند. این کشف میتواند به پیشرفتهایی در حسگرهای بیوالکتریکی و فرایند ترمیم زخم منجر شود.
اما ماجرا به همین جا ختم نمیشود! این کشف میتواند درهای جدیدی را به روی حسگرهای بیوالکتریکی پوشیدنی، بهبود زخمها و نوآوریهای پزشکی شگفتانگیز دیگر باز کند. آیا ما در آستانه درک زبانی جدید در بدن انسان هستیم؟!
https://scitechdaily.com/scientists-detect-silent-scream-of-skin-cells-for-the-first-www.tg-me.com/
#مقاله #ایده_جذاب #زیست_شناسی #علوم_پزشکی
🔸 مطالب بیشتر 👇👇
✅ @AI_DeepMind
🔸 @AI_Person
برای سالها، دانشمندان بر این باور بودند که تنها سلولهای عصبی و قلبی از پیامهای الکتریکی برای ارتباط استفاده میکنند، در حالی که سلولهای اپیتلیال – که سطح پوست، اندامها و حفرههای بدن را پوشش میدهند – صرفاً بهعنوان موانعی غیرفعال در نظر گرفته میشدند که وظیفه جذب و ترشح مواد را بر عهده دارند. اما اکنون، محققان دانشگاه ماساچوست امهرست این تصور را زیر و رو کردهاند!
محققان دانشگاه ماساچوست امهرست کشف کردهاند که سلولهای اپیتلیال با استفاده از سیگنالهای الکتریکی کند با یکدیگر ارتباط برقرار میکنند، قابلیتی که پیش از این ناشناخته بود. مطالعه آنها که در مجله PNAS منتشر شده است، نشان میدهد که این سلولها هنگام آسیب دیدن به نوعی به همسایگان خود «فریاد» میزنند و سیگنالهایی را از طریق جریانهای یون کلسیم منتقل میکنند. این کشف میتواند به پیشرفتهایی در حسگرهای بیوالکتریکی و فرایند ترمیم زخم منجر شود.
اما ماجرا به همین جا ختم نمیشود! این کشف میتواند درهای جدیدی را به روی حسگرهای بیوالکتریکی پوشیدنی، بهبود زخمها و نوآوریهای پزشکی شگفتانگیز دیگر باز کند. آیا ما در آستانه درک زبانی جدید در بدن انسان هستیم؟!
https://scitechdaily.com/scientists-detect-silent-scream-of-skin-cells-for-the-first-www.tg-me.com/
#مقاله #ایده_جذاب #زیست_شناسی #علوم_پزشکی
🔸 مطالب بیشتر 👇👇
✅ @AI_DeepMind
🔸 @AI_Person
👍11❤5🔥3👌3
سلام دوستان اگه دنبال فیلترشکن خوب میگردین این لینک فیلترشکن رو که برای برنامهنویسان، گیمرها، دانشجویان، فعالین حوزه رمز ارز، فریلنسرها هست رو معرفی میکنم اینجا شما هم به فیلترشکنی قابل پشتیبان دسترسی دارین و هم کیفیت بسیار خوبی رو میتونین بگیرین و به هرچیزی که فیلتر هست دسترسی دارین
✅ خرید فیلترشکن
پ.ن: خدماتشون من به شدت راضیم دوستانتون رو دعوت کنید و حجم هدیه بگیرید
✅ خرید فیلترشکن
پ.ن: خدماتشون من به شدت راضیم دوستانتون رو دعوت کنید و حجم هدیه بگیرید
👎31❤3👍2
Forwarded from Alireza
🚀 Excited to Share WaterCrawl!
Looking for a robust, open-source tool for web scraping and preparing data for Large Language Models (LLMs)? Check out WaterCrawl — a powerful web application that leverages Python, Django, Scrapy, and Celery to efficiently crawl websites and extract relevant data across different languages and formats! 📊🌐
💡 What makes WaterCrawl unique?
Seamlessly scrapes websites of various types.
Transforms scraped data into LLM-ready output, perfect for natural language processing tasks.
Designed to work across multiple languages and diverse web domains.
🌟 Open Source: We're constantly improving, and contributions from the community are highly welcome! If you're excited about working with cutting-edge scraping and data extraction tools, take a look! 👇
👉 GitHub: https://github.com/watercrawl/WaterCrawl
Feel free to explore, contribute, or reach out if you're interested in collaborating. Let's build something incredible together! 💻✨
#opensource #webscraping #python #AI #LLM #data #tech
Looking for a robust, open-source tool for web scraping and preparing data for Large Language Models (LLMs)? Check out WaterCrawl — a powerful web application that leverages Python, Django, Scrapy, and Celery to efficiently crawl websites and extract relevant data across different languages and formats! 📊🌐
💡 What makes WaterCrawl unique?
Seamlessly scrapes websites of various types.
Transforms scraped data into LLM-ready output, perfect for natural language processing tasks.
Designed to work across multiple languages and diverse web domains.
🌟 Open Source: We're constantly improving, and contributions from the community are highly welcome! If you're excited about working with cutting-edge scraping and data extraction tools, take a look! 👇
👉 GitHub: https://github.com/watercrawl/WaterCrawl
Feel free to explore, contribute, or reach out if you're interested in collaborating. Let's build something incredible together! 💻✨
#opensource #webscraping #python #AI #LLM #data #tech
GitHub
GitHub - watercrawl/WaterCrawl: Transform Web Content into LLM-Ready Data
Transform Web Content into LLM-Ready Data. Contribute to watercrawl/WaterCrawl development by creating an account on GitHub.
❤1👍1🔥1👌1
Forwarded from .AI _in _Healthcare. (Zeinab Habibi)
بررسی تحول LLM در رادیولوژی: Radiology-Llama2! 🩺
✨مدل Radiology-Llama2 به عنوان یک ابزار در حوزه رادیولوژی شناخته میشد که به پزشکان کمک میکند تا گزارشهای دقیقتری تهیه کنند.
این مدل با بر دادههای پایگاه MIMIC میتواند تصاویر بالینی را به تشخیصهای پزشکی تبدیل کند
🔍از سال 2024 تا حالا: Radiology-Llama2 تواناییهایش را بهبود داده و در حال حاضر میتواند خروجیهای بسیار دقیق و قابل اعتمادی تولید کند.
🔍توجه بیشتری به ایمنی و کیفیت پاسخها شده است، بهگونهای که پزشکان به این اطلاعات بیشتر اعتماد میکنند.
💥اطلاعات بیشتر
- مقاله اول: (https://pubmed.ncbi.nlm.nih.gov/39779926/)
- مقاله دوم: (https://arxiv.org/abs/2305.09617)
#Radiology #LLM
#AIinHealthCare
#MedicalAI
✨مدل Radiology-Llama2 به عنوان یک ابزار در حوزه رادیولوژی شناخته میشد که به پزشکان کمک میکند تا گزارشهای دقیقتری تهیه کنند.
این مدل با بر دادههای پایگاه MIMIC میتواند تصاویر بالینی را به تشخیصهای پزشکی تبدیل کند
🔍از سال 2024 تا حالا: Radiology-Llama2 تواناییهایش را بهبود داده و در حال حاضر میتواند خروجیهای بسیار دقیق و قابل اعتمادی تولید کند.
🔍توجه بیشتری به ایمنی و کیفیت پاسخها شده است، بهگونهای که پزشکان به این اطلاعات بیشتر اعتماد میکنند.
💥اطلاعات بیشتر
- مقاله اول: (https://pubmed.ncbi.nlm.nih.gov/39779926/)
- مقاله دوم: (https://arxiv.org/abs/2305.09617)
#Radiology #LLM
#AIinHealthCare
#MedicalAI
👍4👌2❤1
Forwarded from @machinelearningnet (Dr Sasan Barak)
The game has just begun !
لینک پروژه :
https://github.com/deepseek-ai/Janus
این دیگه اخری درباره deepseek. بریم فاینانس خودمون 😉
لینک پروژه :
https://github.com/deepseek-ai/Janus
این دیگه اخری درباره deepseek. بریم فاینانس خودمون 😉
👍8👎1
در #مقاله زیر به بررسی عمیق لایههای میانی در مدلهای زبانی بزرگ (LLMs) میپردازد و نشان میدهد که این لایهها میتوانند نمایشهای غنیتری نسبت به لایههای نهایی ارائه دهند.
برای توضیح و کمیسازی این ویژگیهای لایههای پنهان، نویسندگان یک چارچوب یکپارچه از معیارهای کیفیت نمایش بر اساس نظریه اطلاعات، هندسه و پایداری در برابر تغییرات ورودی پیشنهاد میکنند. این چارچوب نشان میدهد که چگونه هر لایه مدل بین فشردهسازی اطلاعات و حفظ سیگنال تعادل برقرار میکند، و توضیح میدهد که چرا جاسازیهای لایههای میانی میتوانند عملکرد بهتری نسبت به لایههای نهایی داشته باشند.
از طریق آزمایشهای گسترده بر روی ۳۲ وظیفه جاسازی متن و مقایسه در میان معماریهای مختلف مدل (ترانسفورمرها، مدلهای فضای حالت) و حوزهها (زبان، بینایی)، نشان داده شده است که لایههای میانی بهطور مداوم ویژگیهای قویتری ارائه میدهند.
▪️ Layer by Layer: Uncovering Hidden Representations in Language Models
#مقاله #ایده_جذاب
🔸 مطالب بیشتر 👇👇
✅ @AI_DeepMind
🔸 @AI_Person
برای توضیح و کمیسازی این ویژگیهای لایههای پنهان، نویسندگان یک چارچوب یکپارچه از معیارهای کیفیت نمایش بر اساس نظریه اطلاعات، هندسه و پایداری در برابر تغییرات ورودی پیشنهاد میکنند. این چارچوب نشان میدهد که چگونه هر لایه مدل بین فشردهسازی اطلاعات و حفظ سیگنال تعادل برقرار میکند، و توضیح میدهد که چرا جاسازیهای لایههای میانی میتوانند عملکرد بهتری نسبت به لایههای نهایی داشته باشند.
از طریق آزمایشهای گسترده بر روی ۳۲ وظیفه جاسازی متن و مقایسه در میان معماریهای مختلف مدل (ترانسفورمرها، مدلهای فضای حالت) و حوزهها (زبان، بینایی)، نشان داده شده است که لایههای میانی بهطور مداوم ویژگیهای قویتری ارائه میدهند.
▪️ Layer by Layer: Uncovering Hidden Representations in Language Models
#مقاله #ایده_جذاب
🔸 مطالب بیشتر 👇👇
✅ @AI_DeepMind
🔸 @AI_Person
👍7🔥1