#Quick
راجب مقاله
همونطور که برخی از دوستان هم اشاره کردند (بله من هم تکنیک رو دیدم)
اما صادقانه یک مقدار به این روش مشکوک هستم؛
منتظرم ۱-۲ مدل
دوستان خیلی دقت کنید؛ دنیای امروز
سعی کنید
راجب مقاله
Infini-attention
صحبتی نکردمهمونطور که برخی از دوستان هم اشاره کردند (بله من هم تکنیک رو دیدم)
اما صادقانه یک مقدار به این روش مشکوک هستم؛
منتظرم ۱-۲ مدل
LLM
باهاش منتشر بشه و بتونیم کیفیت و سرعت و سایز مدل رو مورد بررسی قرار بدیم و بعد راجبش صحبت کنیم.دوستان خیلی دقت کنید؛ دنیای امروز
LLM
ها شامل مجموعهای از حواس پرتی و ابزارهایی هست که سر و ته نداره اگر به این مسیر کشیده بشید که دنبال همه این موارد برید قطعا تمومی نخواهد داشت و فقط burn out
میشید.سعی کنید
concept
یاد بگیرید فارق از ابزار.👍23❤7
دستاوردهای یادگیری عمیق(InTec)
آپدیت برای بخش ۷ : Deep learning چون خیلی از دوستان پیام دادند و دنبال دوره ویدئویی هستند برای شروع : Standford university: Prof. Manning, deep learning for nlp NYU (new york university): Yan Lucan & Alfered canziani. Deep learning course این ۲ تا…
من قبلا این دوتا دوره رو معرفی کردم
خیلی از دوستانی هم که این دوتا رو خوندند و البته با پیاده سازی و دیتاست و ... روشون تمرین کردند الان توی پروژهها و شرکتهای بزرگی درحال کار هستند
همین دورهها هر ساله آپدیت میشه و مطالب جدید هم بهش اضافه میشه.
اما چون خیلی درمورد
این لینک رو هم اضافه میکنیم که نهایتا میشه :
Link
البته قبلا معرفی کرده بودم اما الان بنظرم باید به این لیست اضافه میشد دیگه.
الکی نرید پول دوره و .. بدید ما والا با همینا و چندتا کتاب یادگرفتیم باقی کسایی هم که میشناسیم هیمنطوری کار یاد گرفتند و توی شرکتهای خوبی هم دارند کار میکنند.
خیلی از دوستانی هم که این دوتا رو خوندند و البته با پیاده سازی و دیتاست و ... روشون تمرین کردند الان توی پروژهها و شرکتهای بزرگی درحال کار هستند
همین دورهها هر ساله آپدیت میشه و مطالب جدید هم بهش اضافه میشه.
اما چون خیلی درمورد
LLM, Agent, Transformer , ...
سوال شده که دوره و کتاب معرفی کنم این لینک رو هم اضافه میکنیم که نهایتا میشه :
1) Standford university: Prof. Manning, deep learning for nlp
2) NYU (new york university): Yan Lucan & Alfered canziani. Deep learning course
3) Stanford University: Transformers United
Link
البته قبلا معرفی کرده بودم اما الان بنظرم باید به این لیست اضافه میشد دیگه.
الکی نرید پول دوره و .. بدید ما والا با همینا و چندتا کتاب یادگرفتیم باقی کسایی هم که میشناسیم هیمنطوری کار یاد گرفتند و توی شرکتهای خوبی هم دارند کار میکنند.
YouTube
Stanford CS25 - Transformers United
Stanford CS25: Transformers United Since their introduction in 2017, transformers have revolutionized Natural Language Processing (NLP). Now, transformers ar...
❤25👍8
دستاوردهای یادگیری عمیق(InTec) pinned «من قبلا این دوتا دوره رو معرفی کردم خیلی از دوستانی هم که این دوتا رو خوندند و البته با پیاده سازی و دیتاست و ... روشون تمرین کردند الان توی پروژهها و شرکتهای بزرگی درحال کار هستند همین دورهها هر ساله آپدیت میشه و مطالب جدید هم بهش اضافه میشه. اما چون…»
#موقت
دوستان برای معرفی کتاب؛ اگر خواستید کانال
@pyhints
رو
و اگر خواستید کتابهایی که تا حالا معرفی شده رو ببینید؛ فقط کافیه روی
رو روی اون کانال باز کنید و توی بخش
دوستان برای معرفی کتاب؛ اگر خواستید کانال
@pyhints
رو
boost
کنید تا کتابهای هوش مصنوعی که مناسب هستند رو هم اونجا استوری کنم ازین به بعد.و اگر خواستید کتابهایی که تا حالا معرفی شده رو ببینید؛ فقط کافیه روی
Channel Info
رو روی اون کانال باز کنید و توی بخش
Posts
تمامی کتابها رو ببینید (تا بحال پایتون بوده اما ازین به بعد هوش مصنوعی هم اضافه میکنم)👍22❤4
دستاوردهای یادگیری عمیق(InTec)
https://huggingface.co/microsoft
یک نسخه با
خوبی این مدل سبک و سریع بودنش هست.
۱- زبان پشتیبانی فقط انگلیسی هست؛ با کمی اذیت کردن زبانهای دیگه رو هم جواب میده
۲- دیتاهاش از
۳- تیم ماکروسافت ادعا کرده توی بعضی از بنچمارکها از
۳-۱: تست بیشتر گرفتم؛ استدلال کردن رو خیلی خوب انجام میده و میفهمه به شرطی ازش سخت سوال نکنید (یک مقدار کوئری رو شاید لازم باشه براش ساده کنید) اما همچنان شدیدا با کد مشکل داره
۴- توانایی پاسخگویی به کدهای کمی پیچیده یا بحثهای پیچیده رو نداره و کاملا گیج میشه (اما درک خوبی از مسائلی که خیلی سخت نباشند داره؛ سطح متوسط)
سرعت بسیار بالایی داره و برای
داکیومنت
یک نسخه با
context length 128K
هم داده که خب ابتدا اون رو تست خواهم کرد.خوبی این مدل سبک و سریع بودنش هست.
۱- زبان پشتیبانی فقط انگلیسی هست؛ با کمی اذیت کردن زبانهای دیگه رو هم جواب میده
۲- دیتاهاش از
OpenAI
اومده؛ Jailbreak
ها رو روش تست کردم و خودش رو مدل تولید شده توسط OpenAI=CloseAI
میدونه۳- تیم ماکروسافت ادعا کرده توی بعضی از بنچمارکها از
Llama3 - Mixtral
عملکرد بهتر یا نزدیکی داره (همچین چیزی رو نمیبینم حداقل نه توی کد)۳-۱: تست بیشتر گرفتم؛ استدلال کردن رو خیلی خوب انجام میده و میفهمه به شرطی ازش سخت سوال نکنید (یک مقدار کوئری رو شاید لازم باشه براش ساده کنید) اما همچنان شدیدا با کد مشکل داره
۴- توانایی پاسخگویی به کدهای کمی پیچیده یا بحثهای پیچیده رو نداره و کاملا گیج میشه (اما درک خوبی از مسائلی که خیلی سخت نباشند داره؛ سطح متوسط)
سرعت بسیار بالایی داره و برای
code completion
و کدهای ساده بسیار عملکرد خوبی داره داکیومنت
Django 5.0 , FastAPI
رو بهش متصل میکنم ببینم عملکردش بهتر میشه یا نه؛ چون توی مقاله به این موضوع اشاره کردند.huggingface.co
microsoft (Microsoft)
Org profile for Microsoft on Hugging Face, the AI community building the future.
👍14❤2
نمیدونم چقدر با Agent ها توی دنیای Llm کار کردید یا آشنایی دارید؛ اما اگر سمت پروداکشن باهاش کار کرده باشید ضعف های زیادی داره Devin رو یادتون هست ؟
روزی که ویدئو اومد توی گروه گپ و گفت گفتم که دروغ هست (بخاطر تجربیاتی که توی کارهای شرکت بابتش داشتم) بعدم که متوجه شدیم واقعی هست.
اما امروز میخوام شمارو به یک تحقیق (مقاله؛ کد؛ دیتا و …) معرفی کنم که اجازه بنچمارک زدن روی Agent ها فارغ از سیستم عامل رو میده
OSWorld Github
وقتی سیستمی برای ارزیابی عملکرد Agent ها باشه؛ اتفاقات قشنگ بعد از اون شروع میشود.
ازین به بعد منتظر خبرای خوبی میشه بود.
حتما گیت و مقاله رو بخونید.
روزی که ویدئو اومد توی گروه گپ و گفت گفتم که دروغ هست (بخاطر تجربیاتی که توی کارهای شرکت بابتش داشتم) بعدم که متوجه شدیم واقعی هست.
اما امروز میخوام شمارو به یک تحقیق (مقاله؛ کد؛ دیتا و …) معرفی کنم که اجازه بنچمارک زدن روی Agent ها فارغ از سیستم عامل رو میده
OSWorld Github
وقتی سیستمی برای ارزیابی عملکرد Agent ها باشه؛ اتفاقات قشنگ بعد از اون شروع میشود.
ازین به بعد منتظر خبرای خوبی میشه بود.
حتما گیت و مقاله رو بخونید.
GitHub
GitHub - xlang-ai/OSWorld: [NeurIPS 2024] OSWorld: Benchmarking Multimodal Agents for Open-Ended Tasks in Real Computer Environments
[NeurIPS 2024] OSWorld: Benchmarking Multimodal Agents for Open-Ended Tasks in Real Computer Environments - xlang-ai/OSWorld
👍17❤5
CloseAI (OpenAI)
خبر از دردسترس قرار گرفتن مدل
gpt2-chatbot
داده؛ من مسئول نامگذاری نبودم.خارج از بحث عملکرد و ...
چندنفر چندین عکس از قدیم گذاشتند که توی اونها
CloseAI
اعلام کرده مدلهای سبکتر این نسخه 1.3B - 8B , ..
. نسخههای opensource
, openweight
خواهند داشت.هرچند شدیدا شک دارم ولی خب.
👍13❤1
دستاوردهای یادگیری عمیق(InTec)
من قبلا این دوتا دوره رو معرفی کردم خیلی از دوستانی هم که این دوتا رو خوندند و البته با پیاده سازی و دیتاست و ... روشون تمرین کردند الان توی پروژهها و شرکتهای بزرگی درحال کار هستند همین دورهها هر ساله آپدیت میشه و مطالب جدید هم بهش اضافه میشه. اما چون…
بالاخره دوره Deep Generative Models های استنفورد هم آپدیت شد.
واقعا نباید بهونه آورد بهترین منابع یادگیری دنیا در دسترس نسل جدید هست :
Stanford CS236: Deep Generative Models (2023)
پس با اضافه شدن این دوره محموع دورهها شد :
واقعا نباید بهونه آورد بهترین منابع یادگیری دنیا در دسترس نسل جدید هست :
Stanford CS236: Deep Generative Models (2023)
پس با اضافه شدن این دوره محموع دورهها شد :
1) Standford university: Prof. Manning, deep learning for nlp
2) NYU (new york university): Yan Lucan & Alfered canziani. Deep learning course
3) Standord university: Deep Generative Models
4) Stanford University: Transformers United
👍26❤16
دستاوردهای یادگیری عمیق(InTec)
بالاخره دوره Deep Generative Models های استنفورد هم آپدیت شد. واقعا نباید بهونه آورد بهترین منابع یادگیری دنیا در دسترس نسل جدید هست : Stanford CS236: Deep Generative Models (2023) پس با اضافه شدن این دوره محموع دورهها شد : 1) Standford university: Prof.…
تو مسیری که رفتید اون دوره رو چک کنید
به کانال یوتیوب خودمون هم سر بزنید :
http://youtube.com/@pyhints
ساده شروع کردیم و هدف اینه که بعد از دورههای اول از بچههایی که توی صنعت کار میکنند (دوستان خودم) دعوت کنم دوره ضبط کنیم؛ کاملا ساده و بدون چیزی و رایگان قرار بگیره.
تنها مزیتی که نسبت به باقی دورهها خواهد داشت.
برای هر دوره قبل از آپلود حداقل ۲ متخصص تایید مناسب بودن دوره برای بیزینس رو خواهند داد.
بازم میگم همه چیز هم توی کانالهای تلگرام و هم یوتیوب (که ۱۰ روزه راه افتاده) کاملا رایگان خواهد بود و خواهد ماند.
به کانال یوتیوب خودمون هم سر بزنید :
http://youtube.com/@pyhints
ساده شروع کردیم و هدف اینه که بعد از دورههای اول از بچههایی که توی صنعت کار میکنند (دوستان خودم) دعوت کنم دوره ضبط کنیم؛ کاملا ساده و بدون چیزی و رایگان قرار بگیره.
تنها مزیتی که نسبت به باقی دورهها خواهد داشت.
برای هر دوره قبل از آپلود حداقل ۲ متخصص تایید مناسب بودن دوره برای بیزینس رو خواهند داد.
بازم میگم همه چیز هم توی کانالهای تلگرام و هم یوتیوب (که ۱۰ روزه راه افتاده) کاملا رایگان خواهد بود و خواهد ماند.
❤64👍4
دنیای هوش مصنوعی واقعا عجیب شده؛ چندروز صبر کردم تا اطمینان حاصل کنم بعد این پست رو بذارم.
من اکانت شبکههای اجتماعی دیگه رو ندارم اما برای تست
البته بطور خاص
گفتم با یک ایمیل فیک میرم هروقت هم کارم تموم شد دیلیت میکنم.
همه چیز خوب پیشرفت تا اینکه بهم گفت یک تصویر تمام رخ بده (قدی بکارش نمیاد 😁)
منم چون اکانت فیک بود؛ روی سیستم یک مدل آوردم بالا و عکس تولید کردم بعد از چندتا پرامپت یک خروجی خیلی خوب گرفتم؛ یک مقدار یقهی لباسش مشکل داشت که چون دوربین ۴۵ درجه بود و پس زمینه طبیعت blur شده بود چیزی معلوم نبود.
۲۴ ساعت طول کشید تایید شد.
کلا کاری که میخواستم رو فراموش کردم و گفتم بذار ببینم تا کجا میشه سیستمها و یا افراد رو گول زد.
بله توی مرحله بعدی سعی کردم یک مدرک مثل پاسپورت یا ... براش درست کنم.
چندتا مدرک اصلی توی اینترنت پیدا کردم (تصویر خوب ولی بخشهای دیتاهاشون رو سیاه کرده بودند هرکدوم یک بخشی رو)
و مقایسه کردم با مدارک ۳ سال اخیر اون کشور؛ و دیدم تصویرها آپدیت هستند.
از یک سیستم هوش مصنوعی دیگه (پرامپت میگیره و بخشهایی از تصویر رو درست میکنه؛ بیشتر برای ساخت پوستر هست و به خوبی میتونه اسم و اطلاعات بنویسه) خواستم تصویر مدرک رو برام درست کنه.
اول بکگراند عکس چهره و ... رو حذف کردم و بر اساس چهره قبلی عکس تمام رخ و رسمی درست کردم.
بعد با فونت دیفالت اسم و سن و اطلاعات دیگهای که داده بودم رو درست کردم؛ با اینکه فونت دقیقا فونت رسمی مدارک نبود اما تایید شد.
همین تایید شد من رو نگران میکنه؛ من مجرم نیستم و فقط خواستم یک سیستم ارزیابی رو تست کنم و برای اینکار هزینه و ... هم نکردم
فرض کنید یک مجرم با هزینه و ترین کردن مدلی برای اینکار چه کارهایی که نمیتونه بکنه.
واقعا نیاز داریم که هرچه زودتر قانون گذاری درست برای هوش مصنوعی انجام بشه.
راستی من اون اکانت رو هم حذف کردم.
من اکانت شبکههای اجتماعی دیگه رو ندارم اما برای تست
meta.ai
البته بطور خاص
image generation
مجبور شدم اکانت facebook
بسازم.گفتم با یک ایمیل فیک میرم هروقت هم کارم تموم شد دیلیت میکنم.
همه چیز خوب پیشرفت تا اینکه بهم گفت یک تصویر تمام رخ بده (قدی بکارش نمیاد 😁)
منم چون اکانت فیک بود؛ روی سیستم یک مدل آوردم بالا و عکس تولید کردم بعد از چندتا پرامپت یک خروجی خیلی خوب گرفتم؛ یک مقدار یقهی لباسش مشکل داشت که چون دوربین ۴۵ درجه بود و پس زمینه طبیعت blur شده بود چیزی معلوم نبود.
۲۴ ساعت طول کشید تایید شد.
کلا کاری که میخواستم رو فراموش کردم و گفتم بذار ببینم تا کجا میشه سیستمها و یا افراد رو گول زد.
بله توی مرحله بعدی سعی کردم یک مدرک مثل پاسپورت یا ... براش درست کنم.
چندتا مدرک اصلی توی اینترنت پیدا کردم (تصویر خوب ولی بخشهای دیتاهاشون رو سیاه کرده بودند هرکدوم یک بخشی رو)
و مقایسه کردم با مدارک ۳ سال اخیر اون کشور؛ و دیدم تصویرها آپدیت هستند.
از یک سیستم هوش مصنوعی دیگه (پرامپت میگیره و بخشهایی از تصویر رو درست میکنه؛ بیشتر برای ساخت پوستر هست و به خوبی میتونه اسم و اطلاعات بنویسه) خواستم تصویر مدرک رو برام درست کنه.
اول بکگراند عکس چهره و ... رو حذف کردم و بر اساس چهره قبلی عکس تمام رخ و رسمی درست کردم.
بعد با فونت دیفالت اسم و سن و اطلاعات دیگهای که داده بودم رو درست کردم؛ با اینکه فونت دقیقا فونت رسمی مدارک نبود اما تایید شد.
همین تایید شد من رو نگران میکنه؛ من مجرم نیستم و فقط خواستم یک سیستم ارزیابی رو تست کنم و برای اینکار هزینه و ... هم نکردم
فرض کنید یک مجرم با هزینه و ترین کردن مدلی برای اینکار چه کارهایی که نمیتونه بکنه.
واقعا نیاز داریم که هرچه زودتر قانون گذاری درست برای هوش مصنوعی انجام بشه.
راستی من اون اکانت رو هم حذف کردم.
👍69❤8
تصویر اون اکانت (چون برای یکی از دوستان فرستاده بودم هنوز روی سیستم بود)
https://www.tg-me.com/pytens/1447
https://www.tg-me.com/pytens/1447
👍13❤1
یکی از دوستان اشاره کرده که تبلیغاتی از دورههای ایرانی کانالهای دیگه پایین پستهای کانال میاد.
همین اول بگم؛
اما تبلیغات تلگرام، دست ما نیست.
تلاش کردم خاموش کنم این موارد رو ولی تلگرام میگه باید 50 لول Boost داشته باشیم تا اجازه غیرفعال کردن بده بهمون
پس صرف اینکه تبلیغات تلگرام رو پایین هرکدوم از کانال های ما دید، فکر نکنید که ما تایید کردیم اون دوره رو
دورههای تایید شده :
https://www.tg-me.com/pytens/1444
این پست برای مدتی، بعنوان پست آخر دائماً ارسال خواهد شد. (تا کانالها هدف تبلیغات نباشند)
پ.ن :
کانال یوتیوب با حمایت شما، به آموزشهای رایگان و البته مناسب بیزینس در زمینههای مختلف ادامه خواهد داد قطعا.
http://youtube.com/@pyhints
همین اول بگم؛
هیچکدوم از دورههای فارسی پولی مورد تأیید ما نیست
و تقریباً هیچکدوم هم مناسب بیزینس نیست، دورهای نیست که شمارو وارد بازار کار کنه.
اما تبلیغات تلگرام، دست ما نیست.
تلاش کردم خاموش کنم این موارد رو ولی تلگرام میگه باید 50 لول Boost داشته باشیم تا اجازه غیرفعال کردن بده بهمون
پس صرف اینکه تبلیغات تلگرام رو پایین هرکدوم از کانال های ما دید، فکر نکنید که ما تایید کردیم اون دوره رو
دورههای تایید شده :
https://www.tg-me.com/pytens/1444
این پست برای مدتی، بعنوان پست آخر دائماً ارسال خواهد شد. (تا کانالها هدف تبلیغات نباشند)
پ.ن :
کانال یوتیوب با حمایت شما، به آموزشهای رایگان و البته مناسب بیزینس در زمینههای مختلف ادامه خواهد داد قطعا.
http://youtube.com/@pyhints
Telegram
دستاوردهای یادگیری عمیق(InTec)
بالاخره دوره Deep Generative Models های استنفورد هم آپدیت شد.
واقعا نباید بهونه آورد بهترین منابع یادگیری دنیا در دسترس نسل جدید هست :
Stanford CS236: Deep Generative Models (2023)
پس با اضافه شدن این دوره محموع دورهها شد :
1) Standford university: Prof.…
واقعا نباید بهونه آورد بهترین منابع یادگیری دنیا در دسترس نسل جدید هست :
Stanford CS236: Deep Generative Models (2023)
پس با اضافه شدن این دوره محموع دورهها شد :
1) Standford university: Prof.…
👍30❤12
دستاوردهای یادگیری عمیق(InTec) pinned «بالاخره دوره Deep Generative Models های استنفورد هم آپدیت شد. واقعا نباید بهونه آورد بهترین منابع یادگیری دنیا در دسترس نسل جدید هست : Stanford CS236: Deep Generative Models (2023) پس با اضافه شدن این دوره محموع دورهها شد : 1) Standford university: Prof.…»
مقاله جدید مایکروسافت منتشر شده این مقاله درمورد
هست که چندی پیش
اما توی مقاله جدید ماکروسافت ادعا کرده که یک تیکنیک به اسم
رو ارائه میده و این اتفاق رو شدنی میکنه.
با اینکه کد یا سمپلی ارائه نداده انقدر این دستاورد مهم هست که جاهای متفاوتی ازش استفاده شده (غیر رسمی)
خلاصه که اگر دارید در این زمینه تحصیل و کار میکنید حتما باید این مقاله رو بخونید.
VoT Prompting
اهمیت این تکنیک توی ساخت agent ها هست.
اما برای اینکه متوجه تفاوت و عملکرد بشید به این گیتهاب میتونید سر بزنید؛ یکی از پیادهسازیهای غیر رسمی که بعد از استفاده از این تکنیک داره معروف میشه.
Github
The Mind's Eye
هست که چندی پیش
yaan lecun
توی یک مصاحبه که همراه با دیگر بزرگانی در این حوزه بود اعلام کرد که بعید میدونه LLM
با natural language
به تنهایی بتونند بهش برسند.اما توی مقاله جدید ماکروسافت ادعا کرده که یک تیکنیک به اسم
Visual-of-Thought (VoT) prompting
رو ارائه میده و این اتفاق رو شدنی میکنه.
با اینکه کد یا سمپلی ارائه نداده انقدر این دستاورد مهم هست که جاهای متفاوتی ازش استفاده شده (غیر رسمی)
خلاصه که اگر دارید در این زمینه تحصیل و کار میکنید حتما باید این مقاله رو بخونید.
VoT Prompting
اهمیت این تکنیک توی ساخت agent ها هست.
اما برای اینکه متوجه تفاوت و عملکرد بشید به این گیتهاب میتونید سر بزنید؛ یکی از پیادهسازیهای غیر رسمی که بعد از استفاده از این تکنیک داره معروف میشه.
Github
arXiv.org
Mind's Eye of LLMs: Visualization-of-Thought Elicits Spatial...
Large language models (LLMs) have exhibited impressive performance in language comprehension and various reasoning tasks. However, their abilities in spatial reasoning, a crucial aspect of human...
❤17👍5
تو دنیایی که RHEL 💻 میره سراغ Close-Source
و Nvidia🟢 درایور میره سمت Open-Source (سری RTX2000 به بعد)
دیگه هیچی منو قافلگیرم نمیکنه.
واقعا عجیب شده؛ ولی توی دعوای Nvidia و Linus Torvalds معلوم شد کی برنده شد دیگه 😂
همون که گفت :
F..K you Nvidia ...🐧 🐧
و Nvidia
دیگه هیچی منو قافلگیرم نمیکنه.
واقعا عجیب شده؛ ولی توی دعوای Nvidia و Linus Torvalds معلوم شد کی برنده شد دیگه 😂
همون که گفت :
F..K you Nvidia ...
Please open Telegram to view this post
VIEW IN TELEGRAM
👍31❤3
حالا که همه دارند از
صحبت میکنند من چندتا از مدلهای مهم که زیر این حجم مارکتینگ ممکنه از دست داده باشید رو نام ببرم که به تازگی
بخصوص روی تسکهای مربوط به کد زدن؛ بسیار عملکرد خوبی داره طبق بنچمارکها عملکرد بهتری نسبت به
هم مدل
هم مدل خودش رو منتشر کرده که تعداد پارامترهاش زیاد بود و نتونستم تست کنم.
CloseAi GPT-4o
صحبت میکنند من چندتا از مدلهای مهم که زیر این حجم مارکتینگ ممکنه از دست داده باشید رو نام ببرم که به تازگی
release
شدهYi-1.5
بخصوص روی تسکهای مربوط به کد زدن؛ بسیار عملکرد خوبی داره طبق بنچمارکها عملکرد بهتری نسبت به
llama3
داره که شخصا توی تست هم این موضوع رو دیدم.Falcon2.0
هم مدل
11B
اش رو منتشر کرد که خروجی خوبی داره و مثل متا درحالی که مدل اصلی رو داره توسعه میده قرار هست مدلهای کوچکتر رو release
کنند.IBM
هم مدل خودش رو منتشر کرده که تعداد پارامترهاش زیاد بود و نتونستم تست کنم.
👍24❤4
نکته بعدی
حتما نگاهی به
هم داشته باشیم.
پتانسیل خوبی داره (اگر لازم شد راجبش خواهم نوشت)
حتما نگاهی به
Kolmogorov-Arnold Networks
هم داشته باشیم.
پتانسیل خوبی داره (اگر لازم شد راجبش خواهم نوشت)
👍23❤5
قابلیت سوال و جواب در مورد ویدئو توی
نسخه جدید واقعا فوقالعاده هست؛ فرض کنید قابلیت
اضافه کنم دقتش بسیار بسیار بالاس
Gemini 1.5 pro
نسخه جدید واقعا فوقالعاده هست؛ فرض کنید قابلیت
2m Token
کانتکس رو به این اضافه کنید چه کارهایی که نمیشه کرد.اضافه کنم دقتش بسیار بسیار بالاس
👍26❤4
اگر
شخصا چون سرکار بودم نتونستم کامل ببینم اما تمامی بخشهای مهم رو دیدم و خوندم.
پیشنهاد میکنم حتما نگاهی بهش داشته باشید؛ ایدههای بسیار جذابی به ذهن میزنه.
قطعا همه هم میدونید طرفدار ماکروسافت نبودم (تا چندسال قبل و ورودش به دنیای
اما اینکه خبری از اپل نیست یک مقدار مشکوک هست.
و البته لینوکس هم که درگیر بررسی قوانین مدلهای هوش مصنوعی رایگان و
اگر نمیدونستید باید بگم که بله توزیعهای بسیاری توی لینوکس دارند به این سمت حرکت میکنند که
Google I/O
امسال رو دیدید احتمالا به این نتیجه رسیدید که وقتتون رو هدر دادید شخصا همچین چیزی رو پیشبینی میکردم برای امسال؛ اما مراسم Microsoft
یک چیز دیگهای بود (۹ ساعت برای بخش اول)شخصا چون سرکار بودم نتونستم کامل ببینم اما تمامی بخشهای مهم رو دیدم و خوندم.
پیشنهاد میکنم حتما نگاهی بهش داشته باشید؛ ایدههای بسیار جذابی به ذهن میزنه.
قطعا همه هم میدونید طرفدار ماکروسافت نبودم (تا چندسال قبل و ورودش به دنیای
open source
)اما اینکه خبری از اپل نیست یک مقدار مشکوک هست.
و البته لینوکس هم که درگیر بررسی قوانین مدلهای هوش مصنوعی رایگان و
open source
هست + استفاده از Rust
در کرنل و ....اگر نمیدونستید باید بگم که بله توزیعهای بسیاری توی لینوکس دارند به این سمت حرکت میکنند که
LLM
رو داخل خودشون داشته باشند.👍45❤11