یافته جدید OpenAI در مورد زنجیره تفکر COT
(تو این پست در مورد COT گفتم)
اعلام کرده که طراحی ساختارهای پاداشی که ناخواسته موجب تشویق رفتارهای نادرست در مدل های زبانی نشن، کاری بسیار دشواریه!
این موضوع فقط مختص مدل های زبانی نیست، به عنوان مثال اگه بچه هاتون به خاطر دروغ گفتن تنبیه کنید، درواقع جلو دروغ گفتنشون رو نگرفتین، فقط باعث شدین اونها یاد بگیرن چطوری ماهرانه تر و مخفی تر دروغ بگن!
در مدلهای پیشرفتهی استدلال، معمولا هدف و نیت اونها به روشنی در زنجیره ی تفکرشون نمایان میشه.
اوپن ای آی با استفاده از یه مدل زبانی دیگه، مسیر استدلال رو زیر نظر میگیره تا رفتارهای ناهنجار رو تشخیص بده، اما این قابلیت پایش پذیری مسیر فکری بسیار شکننده ست، چون اگه نظارت سخت گیرانه تری بر زنجیرهی تفکر اعمال شه، این مدلها یاد میگیرن که نیت خود شون رو پنهان کنن و همچنان به رفتار نادرست ادامه بدن!
@silicon_brain | از هوش مصنوعی عقب نمانید
(تو این پست در مورد COT گفتم)
اعلام کرده که طراحی ساختارهای پاداشی که ناخواسته موجب تشویق رفتارهای نادرست در مدل های زبانی نشن، کاری بسیار دشواریه!
این موضوع فقط مختص مدل های زبانی نیست، به عنوان مثال اگه بچه هاتون به خاطر دروغ گفتن تنبیه کنید، درواقع جلو دروغ گفتنشون رو نگرفتین، فقط باعث شدین اونها یاد بگیرن چطوری ماهرانه تر و مخفی تر دروغ بگن!
در مدلهای پیشرفتهی استدلال، معمولا هدف و نیت اونها به روشنی در زنجیره ی تفکرشون نمایان میشه.
اوپن ای آی با استفاده از یه مدل زبانی دیگه، مسیر استدلال رو زیر نظر میگیره تا رفتارهای ناهنجار رو تشخیص بده، اما این قابلیت پایش پذیری مسیر فکری بسیار شکننده ست، چون اگه نظارت سخت گیرانه تری بر زنجیرهی تفکر اعمال شه، این مدلها یاد میگیرن که نیت خود شون رو پنهان کنن و همچنان به رفتار نادرست ادامه بدن!
@silicon_brain | از هوش مصنوعی عقب نمانید
نتایج نظرسنجی AAAI درباره تحقیقات AGI رو براتون اوردم
طبق نظرسنجی:
➖ ۳۰٪ از محققان بر این باورند که تحقیقات AGI باید تا زمانی که کنترل کامل سیستمها ممکن نباشد، متوقف شود.
➖ ۸۴٪ معتقدند شبکههای عصبی بهتنهایی برای AGI کافی نیستند.
➖ بیش از ۶۰٪ بر لزوم ترکیب شبکههای عصبی و AI نمادین برای استدلال انسانی تأکید دارند.
➖۷۵٪ ایمنی AI را مهمتر از دستیابی به AGI میدانند.
@silicon_brain I از هوش مصنوعی عقب نمانید
طبق نظرسنجی:
➖ ۳۰٪ از محققان بر این باورند که تحقیقات AGI باید تا زمانی که کنترل کامل سیستمها ممکن نباشد، متوقف شود.
➖ ۸۴٪ معتقدند شبکههای عصبی بهتنهایی برای AGI کافی نیستند.
➖ بیش از ۶۰٪ بر لزوم ترکیب شبکههای عصبی و AI نمادین برای استدلال انسانی تأکید دارند.
➖۷۵٪ ایمنی AI را مهمتر از دستیابی به AGI میدانند.
@silicon_brain I از هوش مصنوعی عقب نمانید
Mathematics of ML.pdf
650.2 KB
جزوه «ریاضیات یادگیری ماشین»
راجن د. شاه استاد دانشگاه کمبریج که تجربه زیادی در حوزه یادگیری ماشین و مدلسازی آماری داره، توی این جزوه، تلاش کرده تا مسائل پیچیده ریاضی ML رو به زبانی ساده توضیح بده
@silicon_brain I از هوش مصنوعی عقب نمانید
راجن د. شاه استاد دانشگاه کمبریج که تجربه زیادی در حوزه یادگیری ماشین و مدلسازی آماری داره، توی این جزوه، تلاش کرده تا مسائل پیچیده ریاضی ML رو به زبانی ساده توضیح بده
@silicon_brain I از هوش مصنوعی عقب نمانید
This media is not supported in your browser
VIEW IN TELEGRAM
عملکرد ریلتایم Gemini2 در مورد سیتی شکم
سؤالات پزشک رو دقیق جواب داد و تشخیص درستی داشت. حتی عوارضی که باید حواسش بهشون باشه رو هم گوشزد کرد.
تصویر پایینی هم باحالش کرده😂
@silicon_brain I از هوش مصنوعی عقب نمانید
سؤالات پزشک رو دقیق جواب داد و تشخیص درستی داشت. حتی عوارضی که باید حواسش بهشون باشه رو هم گوشزد کرد.
تصویر پایینی هم باحالش کرده😂
@silicon_brain I از هوش مصنوعی عقب نمانید
این روزا خیلی در مورد آمارهای هوش مصنوعی صحبت کردیم، در مورد کار خودمونم یه گزارشی داشته باشیم
طبق نظرسنجی انجامشده توسط Wired از ۷۳۰ مهندس نرمافزار، ۷۵ درصد از هوش مصنوعی استفاده میکنن.
از این افراد، ۳۵.۶ درصد به آینده هوش مصنوعی خوشبین و ۳۸.۴ درصد بدبین هستن.
برنامهنویسانی که فریلنسری کار میکنن بیشتر از ابزارهای هوش مصنوعی استفاده میکنن و ۵۰ درصدشون بابت استفاده از این ابزارها هزینه پرداخت میکنن.
@silicon_brain I از هوش مصنوعی عقب نمانید
طبق نظرسنجی انجامشده توسط Wired از ۷۳۰ مهندس نرمافزار، ۷۵ درصد از هوش مصنوعی استفاده میکنن.
از این افراد، ۳۵.۶ درصد به آینده هوش مصنوعی خوشبین و ۳۸.۴ درصد بدبین هستن.
برنامهنویسانی که فریلنسری کار میکنن بیشتر از ابزارهای هوش مصنوعی استفاده میکنن و ۵۰ درصدشون بابت استفاده از این ابزارها هزینه پرداخت میکنن.
@silicon_brain I از هوش مصنوعی عقب نمانید
جدیدا
این مدل فقط 37B پارامتر رو برای هر توکن فعال میکنه، بنابراین نیاز به منابع محاسباتی کمتری داره. عملکرد این مدل در استدلال و کدنویسی بهتر از مدلهای قبلی
این مدل در مقایسه با نسخه قبلی خود، عملکرد بهتری در استدلال، ریاضیات و کدنویسی داره.
MMLU-Pro (81.2, +5.3)
تستهایی برای سنجش دانش عمومی و حل مسائل در زمینههای مختلف
GPQA (68.4, +9.3)
ارزیابی دانش حرفهای در مقطع تحصیلات تکمیلی
AIME (59.4, +19.8)
سنجش استدلال ریاضی با استفاده از مسائل ریاضی سطح مسابقات
LiveCodeBench (49.2, +10.0)
ارزیابی دقت و صحت اجرای برنامهنویسی در دنیای واقعی
مدل DeepSeek-V3-0324 بصورت Open-Source هستش و برای استفاده عمومی در دسترس قرار داره.
هاگینگ فیس
@silicon_brain | از هوش مصنوعی عقب نمانید
DeepSeek
یه مدل Open-Source جدید با 685B پارامتر به نام DeepSeek-V3-0324 منتشر کرده که از معماری Mixture-of-Experts (MoE)
استفاده میکنه. این مدل فقط 37B پارامتر رو برای هر توکن فعال میکنه، بنابراین نیاز به منابع محاسباتی کمتری داره. عملکرد این مدل در استدلال و کدنویسی بهتر از مدلهای قبلی
DeepSeek
شده.این مدل در مقایسه با نسخه قبلی خود، عملکرد بهتری در استدلال، ریاضیات و کدنویسی داره.
MMLU-Pro (81.2, +5.3)
تستهایی برای سنجش دانش عمومی و حل مسائل در زمینههای مختلف
GPQA (68.4, +9.3)
ارزیابی دانش حرفهای در مقطع تحصیلات تکمیلی
AIME (59.4, +19.8)
سنجش استدلال ریاضی با استفاده از مسائل ریاضی سطح مسابقات
LiveCodeBench (49.2, +10.0)
ارزیابی دقت و صحت اجرای برنامهنویسی در دنیای واقعی
مدل DeepSeek-V3-0324 بصورت Open-Source هستش و برای استفاده عمومی در دسترس قرار داره.
هاگینگ فیس
@silicon_brain | از هوش مصنوعی عقب نمانید
فصل، فصل آمار دهی هستش😁
Generative AI سهم بازار فروشندگان پیشرو در
این تصویر گزارشی از IoT Analytics را درباره سهم بازار شرکتهای پیشرو در سه حوزه کلیدی هوش مصنوعی مولد رو ارائه میده:
واحدهای پردازشی دیتاسنتر (Datacenter GPUs) – NVIDIA با ۹۲٪ سهم بازار پیشتاز بلامنازع، در حالی که AMD (۴٪)، هواوی (۲٪)، اینتل (۱٪)، Cerebras (۱٪) و Groq (۱٪) در رتبههای بعدی قرار دارن.
مدلهای پایه و پلتفرمهای مدیریت مدل (Foundation Models & Model Management Platforms) – مایکروسافت (۳۹٪)، AWS (۱۹٪) و گوگل (۱۵٪) پیشگامان اصلی این بخش هستن.
خدمات هوش مصنوعی مولد (GenAI Services) – بخش Other با ۷۶٪ بزرگترین سهم را دارد، اما شرکتهایی مانند Accenture (۷٪)، Deloitte (۷٪)، IBM (۳٪)، Capgemini (۲٪)، McKinsey (۲٪)، BCG در این بازار نقش دارند.
@silicon_brain I از هوش مصنوعی عقب نمانید
Generative AI سهم بازار فروشندگان پیشرو در
این تصویر گزارشی از IoT Analytics را درباره سهم بازار شرکتهای پیشرو در سه حوزه کلیدی هوش مصنوعی مولد رو ارائه میده:
واحدهای پردازشی دیتاسنتر (Datacenter GPUs) – NVIDIA با ۹۲٪ سهم بازار پیشتاز بلامنازع، در حالی که AMD (۴٪)، هواوی (۲٪)، اینتل (۱٪)، Cerebras (۱٪) و Groq (۱٪) در رتبههای بعدی قرار دارن.
مدلهای پایه و پلتفرمهای مدیریت مدل (Foundation Models & Model Management Platforms) – مایکروسافت (۳۹٪)، AWS (۱۹٪) و گوگل (۱۵٪) پیشگامان اصلی این بخش هستن.
خدمات هوش مصنوعی مولد (GenAI Services) – بخش Other با ۷۶٪ بزرگترین سهم را دارد، اما شرکتهایی مانند Accenture (۷٪)، Deloitte (۷٪)، IBM (۳٪)، Capgemini (۲٪)، McKinsey (۲٪)، BCG در این بازار نقش دارند.
@silicon_brain I از هوش مصنوعی عقب نمانید
خیلی وقت دنبال این نمودار بودم و به نظرم تحلیل های مهمی میشه باهاش کرد.
محور عمودی نشون میده که چه میزان از کارفرماها انتظار دارن استفاده از یه مهارت خاص تا سال ۲۰۳۰ افزایش پیدا کنه
محور افقی هم درصد کارفرماهایی رو نشون میده که اون مهارت رو تو سال ۲۰۲۵ به عنوان یه مهارت اصلی در نظر میگیرن.
مهارت هایی مثل AI و Data که نیاز به توضیح ندارن و کارفرماها هم الان و هم برای 5 سال آینده خودشونو آماده کردن.
اما نگرانی که حس میشه، همین الانشم با ظهور AI خلاقیت انسان ها داره هر روز کمتر میشه. در حالی که خلاقیت در تفکر یکی از اصلی ترین مهارت ها و نیازهای آینده ست.
شاید بگی با وجود AI چه لزومی داره وقتمونو تلف کنیم و خودمون همه کارارو انجام بدیم؟ این حرف درسته اما باید در نظر گرفت برای بدست اوردن مهارت های ذهنی قوی باید یه سری موارد پایه ای رو هی تکرار کنی!
خلاصه یکم پیچیده ست داستان ولی به صورت خلاصه بخوام بگم به نظرم از مهارتهای شناختی، تحلیلی، خلاقانه و تکنولوژیکی غافل نباید شد. فردا روز نگی چرا نگفتی! :)
@silicon_brain | از هوش مصنوعی عقب نمانید
محور عمودی نشون میده که چه میزان از کارفرماها انتظار دارن استفاده از یه مهارت خاص تا سال ۲۰۳۰ افزایش پیدا کنه
محور افقی هم درصد کارفرماهایی رو نشون میده که اون مهارت رو تو سال ۲۰۲۵ به عنوان یه مهارت اصلی در نظر میگیرن.
مهارت هایی مثل AI و Data که نیاز به توضیح ندارن و کارفرماها هم الان و هم برای 5 سال آینده خودشونو آماده کردن.
اما نگرانی که حس میشه، همین الانشم با ظهور AI خلاقیت انسان ها داره هر روز کمتر میشه. در حالی که خلاقیت در تفکر یکی از اصلی ترین مهارت ها و نیازهای آینده ست.
شاید بگی با وجود AI چه لزومی داره وقتمونو تلف کنیم و خودمون همه کارارو انجام بدیم؟ این حرف درسته اما باید در نظر گرفت برای بدست اوردن مهارت های ذهنی قوی باید یه سری موارد پایه ای رو هی تکرار کنی!
خلاصه یکم پیچیده ست داستان ولی به صورت خلاصه بخوام بگم به نظرم از مهارتهای شناختی، تحلیلی، خلاقانه و تکنولوژیکی غافل نباید شد. فردا روز نگی چرا نگفتی! :)
@silicon_brain | از هوش مصنوعی عقب نمانید
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
Andrew Ng:
امروزه برخی افراد دیگران را از یادگیری برنامهنویسی دلسرد میکنند به این دلیل که معتقدند هوش مصنوعی آن را خودکار خواهد کرد. این توصیه به عنوان یکی از بدترین توصیههای شغلی در تاریخ شناخته خواهد شد. من با برنده جایزه تورینگ و نوبل که نوشته بود: «بسیار محتملتر است که شغل برنامهنویسی منقرض شود [...] تا اینکه به اوج قدرت برسد. هر چه میگذرد، رایانهها بیشتر خودشان برنامهنویسی خواهند کرد»، مخالفم. اظهاراتی که افراد را از یادگیری کدنویسی بازمیدارند، مضر هستند!
هرچه برنامهنویسی آسانتر شود، باید افراد بیشتری برنامهنویسی کنند، نه کمتر!
در چند دهه گذشته، برنامهنویسی از زبان اسمبلی به زبانهای سطح بالاتر مثل C، از دسکتاپ به فضای ابری، از ویرایشگرهای متنی خام به محیطهای توسعه یکپارچه (IDE) و حالا به کدنویسی با کمک هوش مصنوعی که گاهی حتی نیازی به دیدن کد تولیدی نیست (که برخی برنامهنویسها به آن «کدنویسی با حال و هوا» یا vibe coding میگویند) پیشرفت کرده است. با هر گام، این فرآیند آسانتر شده است.
قبلاً نوشته بودم که افراد آشنا با تکنولوژی، با هماهنگی ابزارهای هوش مصنوعی، در مسیر تبدیل شدن به حرفهایهای ۱۰ برابری هستند — افرادی که ۱۰ برابر میانگین افراد در حوزه خود تأثیر دارند. من هر روز بیشتر به این باور میرسم که بهترین راه برای بسیاری از افراد برای رسیدن به این نقطه، فقط مصرفکننده بودن برنامههای هوش مصنوعی نیست، بلکه یادگیری برنامهنویسی کافی برای استفاده مؤثر از ابزارهای کدنویسی با کمک هوش مصنوعی است.
وقتی داشتم روی دوره «هوش مصنوعی مولد برای همه» کار میکردم و لازم بود تصاویر پسزمینه هنری تولید کنم، با همکاری کار کردم که در رشته تاریخ هنر تحصیل کرده بود و زبان هنر را میدانست. او با استفاده از اصطلاحات مرتبط با سبک تاریخی، پالت رنگی، الهامگیری از هنرمندان و غیره — یعنی با زبان هنر — به Midjourney دستور میداد تا به نتیجه دلخواه برسد. من این زبان را نمیدانستم، و تلاشهای محدود من برای ساخت پرامپت، به اندازه او مؤثر نبود.
به همین ترتیب، کسانی که زبان نرمافزار را از طریق دانش برنامهنویسی میفهمند، میتوانند به مدلهای زبانی یا محیطهای توسعه دارای هوش مصنوعی دقیقتر بگویند چه میخواهند و نتایج بسیار بهتری بگیرند. اکنون بهترین زمان برای یادگیری برنامهنویسی، یادگیری زبان نرمافزار، و آموختن توانایی واداشتن کامپیوترها به انجام خواستههای شماست.
@silicon_brain | از هوش مصنوعی عقب نمانید
امروزه برخی افراد دیگران را از یادگیری برنامهنویسی دلسرد میکنند به این دلیل که معتقدند هوش مصنوعی آن را خودکار خواهد کرد. این توصیه به عنوان یکی از بدترین توصیههای شغلی در تاریخ شناخته خواهد شد. من با برنده جایزه تورینگ و نوبل که نوشته بود: «بسیار محتملتر است که شغل برنامهنویسی منقرض شود [...] تا اینکه به اوج قدرت برسد. هر چه میگذرد، رایانهها بیشتر خودشان برنامهنویسی خواهند کرد»، مخالفم. اظهاراتی که افراد را از یادگیری کدنویسی بازمیدارند، مضر هستند!
هرچه برنامهنویسی آسانتر شود، باید افراد بیشتری برنامهنویسی کنند، نه کمتر!
در چند دهه گذشته، برنامهنویسی از زبان اسمبلی به زبانهای سطح بالاتر مثل C، از دسکتاپ به فضای ابری، از ویرایشگرهای متنی خام به محیطهای توسعه یکپارچه (IDE) و حالا به کدنویسی با کمک هوش مصنوعی که گاهی حتی نیازی به دیدن کد تولیدی نیست (که برخی برنامهنویسها به آن «کدنویسی با حال و هوا» یا vibe coding میگویند) پیشرفت کرده است. با هر گام، این فرآیند آسانتر شده است.
قبلاً نوشته بودم که افراد آشنا با تکنولوژی، با هماهنگی ابزارهای هوش مصنوعی، در مسیر تبدیل شدن به حرفهایهای ۱۰ برابری هستند — افرادی که ۱۰ برابر میانگین افراد در حوزه خود تأثیر دارند. من هر روز بیشتر به این باور میرسم که بهترین راه برای بسیاری از افراد برای رسیدن به این نقطه، فقط مصرفکننده بودن برنامههای هوش مصنوعی نیست، بلکه یادگیری برنامهنویسی کافی برای استفاده مؤثر از ابزارهای کدنویسی با کمک هوش مصنوعی است.
وقتی داشتم روی دوره «هوش مصنوعی مولد برای همه» کار میکردم و لازم بود تصاویر پسزمینه هنری تولید کنم، با همکاری کار کردم که در رشته تاریخ هنر تحصیل کرده بود و زبان هنر را میدانست. او با استفاده از اصطلاحات مرتبط با سبک تاریخی، پالت رنگی، الهامگیری از هنرمندان و غیره — یعنی با زبان هنر — به Midjourney دستور میداد تا به نتیجه دلخواه برسد. من این زبان را نمیدانستم، و تلاشهای محدود من برای ساخت پرامپت، به اندازه او مؤثر نبود.
به همین ترتیب، کسانی که زبان نرمافزار را از طریق دانش برنامهنویسی میفهمند، میتوانند به مدلهای زبانی یا محیطهای توسعه دارای هوش مصنوعی دقیقتر بگویند چه میخواهند و نتایج بسیار بهتری بگیرند. اکنون بهترین زمان برای یادگیری برنامهنویسی، یادگیری زبان نرمافزار، و آموختن توانایی واداشتن کامپیوترها به انجام خواستههای شماست.
@silicon_brain | از هوش مصنوعی عقب نمانید
Please open Telegram to view this post
VIEW IN TELEGRAM
ساخت اپ فول استک با Firebase Studio
گوگل یه ابزار جدید به اسم
یکی از جذابترین امکاناتش اینه که کافیه یه متن یا حتی یه نقاشی ساده بهش بدی، خودش برات یه اپ کامل میسازه!
با Firebase Studio، فقط با یه کلیک میتونی پروژهت رو مستقیم روی Firebase App Hosting دیپلوی کنی.
این نسخه بهصورت پیشنمایش برای همه در دسترسه و کاربران Google Developer Program میتونن تا ۳۰ ورکاسپیس رایگان استفاده کنن.
لینک
@silicon_brain | از هوش مصنوعی عقب نمانید
گوگل یه ابزار جدید به اسم
Firebase Studio
معرفی کرده که یه محیط برنامهنویسی تحت وبه و با هوش مصنوعی کار میکنه. با این ابزار میتونی خیلی راحت اپلیکیشنهای فولاستک بسازی و دیپلوی کنی. این محیط همه چی رو تو یه جا جمع کرده؛ هم Project IDX، هم Genkit، هم مدلهای Gemini
.یکی از جذابترین امکاناتش اینه که کافیه یه متن یا حتی یه نقاشی ساده بهش بدی، خودش برات یه اپ کامل میسازه!
با Firebase Studio، فقط با یه کلیک میتونی پروژهت رو مستقیم روی Firebase App Hosting دیپلوی کنی.
این نسخه بهصورت پیشنمایش برای همه در دسترسه و کاربران Google Developer Program میتونن تا ۳۰ ورکاسپیس رایگان استفاده کنن.
لینک
@silicon_brain | از هوش مصنوعی عقب نمانید
Forwarded from Silicon Brain | جامعه هوش مصنوعی
ساخت مدل زبانی روی دیتابیس به صورت خودکار
LAMOGEL: Language Model Generation Lifecycle
یه پروژه تو گیتهاب داشتم برای یه بیزنسی کار کرده بودم. امروز پابلیکش کردم تا دیگران هم استفاده کنن.
به چه دردی میخوره؟
اگه میخواین روی دیتابیس بیزینس خودتون یه مدل زبانی پیشرفته که مفاهیم و فضای کاری شما رو درک کرده باشه سریع و خودکار بسازید از LAMOGEL استفاده کنید
مراحل:
1. اتصال به دیتابیس
2. پیشپردازش دادهها
3. تقسیم دیتا: دیتا رو به دو بخش پیش آموزش (Pre-training) و تنظیم دقیق (Fine-tuning) تقسیم میکنه. تا اولش LM رو آموزش بده و بعدش با متریکها ارزیابی کنه و برای تسک NLP مورد نظر شما تیون کنه.
4.آموزش مدل MLM
5.ذخیره مدل: مدل آموزشی ساختهشده رو تو مسیر مشخصی و تو Huggingface ذخیره میکنه.
کانفیگ آسان:
همه هایپرپارامترهای مورد نیاز، مثل نرخ یادگیری، تعداد دادههای فاینتیون و غیره رو از فایل Config.py میتونین ست کنین و پروژه رو اینجوری ایزی ران کنید😁
لینک گیتهاب
لطفا تو گیتهاب استار ⭐️ بدین تا انگیزه ای باشه برای همه افرادی که ریپو هاشون رو پابلیک میکنن
@silicon_brain | از هوش مصنوعی عقب نمانید
LAMOGEL: Language Model Generation Lifecycle
یه پروژه تو گیتهاب داشتم برای یه بیزنسی کار کرده بودم. امروز پابلیکش کردم تا دیگران هم استفاده کنن.
به چه دردی میخوره؟
اگه میخواین روی دیتابیس بیزینس خودتون یه مدل زبانی پیشرفته که مفاهیم و فضای کاری شما رو درک کرده باشه سریع و خودکار بسازید از LAMOGEL استفاده کنید
مراحل:
1. اتصال به دیتابیس
2. پیشپردازش دادهها
3. تقسیم دیتا: دیتا رو به دو بخش پیش آموزش (Pre-training) و تنظیم دقیق (Fine-tuning) تقسیم میکنه. تا اولش LM رو آموزش بده و بعدش با متریکها ارزیابی کنه و برای تسک NLP مورد نظر شما تیون کنه.
4.آموزش مدل MLM
5.ذخیره مدل: مدل آموزشی ساختهشده رو تو مسیر مشخصی و تو Huggingface ذخیره میکنه.
کانفیگ آسان:
همه هایپرپارامترهای مورد نیاز، مثل نرخ یادگیری، تعداد دادههای فاینتیون و غیره رو از فایل Config.py میتونین ست کنین و پروژه رو اینجوری ایزی ران کنید😁
python app.py
لینک گیتهاب
لطفا تو گیتهاب استار ⭐️ بدین تا انگیزه ای باشه برای همه افرادی که ریپو هاشون رو پابلیک میکنن
@silicon_brain | از هوش مصنوعی عقب نمانید
سیستم Multi-Agent گوگل
گوگل بهتازگی یه فریمورک متنباز به اسم
این فریمورک از همون اول از مدلهای
علاوه بر این، ADK با
از لحاظ قابلیتهای ابزارسازی، ADK بهت این امکان رو میده که ابزارهای دلخواهتو با Python تعریف و مدیریت کنی. ابزارهای پیشفرضی مثل google_search و code_exec توش وجود داره و به شکل ساختاریافته میتونی ورودی و خروجی ابزارها رو تست و دیباگ کنی.
لینک
@silicon_brain | از هوش مصنوعی عقب نمانید
گوگل بهتازگی یه فریمورک متنباز به اسم
Agent Development Kit (ADK)
معرفی کرده که باهاش میتونی خیلی راحت agent های هوشمند بسازی، ابزار براشون تعریف کنی، تست کنی و مستقیم روی زیرساختهای گوگل دیپلوی کنی. این فریمورک از همون اول از مدلهای
Gemini
و مدلهای دیگه مثل Claude،
LLaMA،
Mistral
پشتیبانی میکنه و حتی میتونی مدل اختصاصی خودتو با یه custom connector بهش وصل کنی.علاوه بر این، ADK با
Vertex AI Agent Builder
هم یکپارچه شده، یعنی بهراحتی میتونی agentهات رو روی سرویسهای سازمانی گوگل اجرا کنی و با prompt-based logic بین مدلها مسیر دهی (routing) انجام بدی.از لحاظ قابلیتهای ابزارسازی، ADK بهت این امکان رو میده که ابزارهای دلخواهتو با Python تعریف و مدیریت کنی. ابزارهای پیشفرضی مثل google_search و code_exec توش وجود داره و به شکل ساختاریافته میتونی ورودی و خروجی ابزارها رو تست و دیباگ کنی.
لینک
@silicon_brain | از هوش مصنوعی عقب نمانید
داشتم آگهی های کاریابی رو تو لینکدین میدیدم. اکثر شرکتا دنبال نیروی Senior هستن! چرا این اتفاق افتاده؟
احتمالا داریم به سمتی میریم که در آینده نزدیک نیروی جونیور نقش کمرنگی توی پروژه ها خواهد داشت و شرکتها بجای استخدام 5نفر جونیور، 1 نفر سنیور استخدام میکنن+یه اکانت ChatGPT!
شکی نیست که هوش مصنوعی هیچوقت خطری برای کسایی که تخصصی کار میکنن نیست اما خیلی راحت جای کسایی رو میگیره که دستوپاشکسته دارن کار میکنن.
این شاید یه تلنگر باشه واسه هممون، تو هر حوزه ای که داریم کار میکنیم خیلی زود باید حرفه ای بشیم.
@silicon_brain | از هوش مصنوعی عقب نمانید
احتمالا داریم به سمتی میریم که در آینده نزدیک نیروی جونیور نقش کمرنگی توی پروژه ها خواهد داشت و شرکتها بجای استخدام 5نفر جونیور، 1 نفر سنیور استخدام میکنن+یه اکانت ChatGPT!
شکی نیست که هوش مصنوعی هیچوقت خطری برای کسایی که تخصصی کار میکنن نیست اما خیلی راحت جای کسایی رو میگیره که دستوپاشکسته دارن کار میکنن.
این شاید یه تلنگر باشه واسه هممون، تو هر حوزه ای که داریم کار میکنیم خیلی زود باید حرفه ای بشیم.
@silicon_brain | از هوش مصنوعی عقب نمانید
بازی مهم امشب رئال مادرید و آرسنال رو به مدل های خفن گفتم با تکنولوژی
GPT-4 Turbo:
⚽️ Real Madrid 1 - 1 Arsenal
Gemini 2.5:
⚽️ Real Madrid 2 - 1 Arsenal
Grok 3:
⚽️ Real Madrid 2 - 1 Arsenal
حتما میدونید که بازی رفت این بازی 3 بر صفر به نفع آرسنال تموم شده و پیش بینی این بازی پیچیدگی زیادی داره.
خیره ایشالا 😅
Reason
و Deep Research
پیش بینی کنن و زمان زیادی در مورد این نتایج فکر کردن:GPT-4 Turbo:
⚽️ Real Madrid 1 - 1 Arsenal
Gemini 2.5:
⚽️ Real Madrid 2 - 1 Arsenal
Grok 3:
⚽️ Real Madrid 2 - 1 Arsenal
حتما میدونید که بازی رفت این بازی 3 بر صفر به نفع آرسنال تموم شده و پیش بینی این بازی پیچیدگی زیادی داره.
خیره ایشالا 😅