هر کی با n8n یه بات تلگرامی ساخته، شده مهندس هوش مصنوعی!
تا زمانی که یه چندتا مدل فاین تون نکردین LLM و یا از صفر یه مدل نساختین، بحث دیپلوی و دیگر موارد رو تجربه عملی نداشتین هی ما رو زخم نکنید مهندس هوش مصنوعی هستم.
تا زمانی که یه چندتا مدل فاین تون نکردین LLM و یا از صفر یه مدل نساختین، بحث دیپلوی و دیگر موارد رو تجربه عملی نداشتین هی ما رو زخم نکنید مهندس هوش مصنوعی هستم.
👍51👏3🔥2😁2🤣2❤1😱1
مدل
جدیدا
میگن تو بحث reasoning خیلی خفنه و تونسته از Claude 4 Opus و Gemini 1.5 Pro تو تستهای مختلف بهتر عمل کنه
گفته شده دقت بیسابقه در پاسخهای چندمرحلهای و استدلالهای پیچیده داره در عوض سرعت پاسخدهی کمتر به دلیل عمق محاسبات بالا و در نتیجه هزینه محاسباتی بالاتر نسبت به نسخههای دیگرو داره
@silicon_brain | از هوش منصوعی عقب نمانید
o3-pro
منتشر شدجدیدا
OpenAI
نسخه پیشرفته مدل استدلالیشو به نام o3-pro معرفی کرده؛ مدلی که به طور ویژه برای ارائه پاسخهای دقیق و انجام تحلیلهای عمیق در حوزههای مختلف طراحی شده.میگن تو بحث reasoning خیلی خفنه و تونسته از Claude 4 Opus و Gemini 1.5 Pro تو تستهای مختلف بهتر عمل کنه
گفته شده دقت بیسابقه در پاسخهای چندمرحلهای و استدلالهای پیچیده داره در عوض سرعت پاسخدهی کمتر به دلیل عمق محاسبات بالا و در نتیجه هزینه محاسباتی بالاتر نسبت به نسخههای دیگرو داره
@silicon_brain | از هوش منصوعی عقب نمانید
👍5❤3🔥1
❤9👎6👍2👏1
خب ما هم برگردیم به AI 😍
قطعا میدونین تو این فیلد تو 12 روز چقدر موضوع برای از دست دادن وجود داره
سعی میکنم اول مطالب رو به صورت خلاصه بیان کنیم تا کم کم عمیق تر بشیم
قطعا میدونین تو این فیلد تو 12 روز چقدر موضوع برای از دست دادن وجود داره
سعی میکنم اول مطالب رو به صورت خلاصه بیان کنیم تا کم کم عمیق تر بشیم
❤15👍4👏1
اگه تو این مدت از تحقیقات اخیر هوش مصنوعی عقب موندی خوندن این متن میتونه شروع خوبی باشه :)
تحقیقات نشون داده مدلهای AI وقتی taskشون طولانی میشه، احتمال شکستشون به صورت exponential decay بالا میره. مثلاً اگه هر ۱۰ دقیقه مدل ۱۰٪ احتمال شکست داشته باشه، برای یه کار ۱ ساعته فقط ۵۳٪ شانس موفقیت داره. هر subtask یه fixed hazard rate داره که جمع میشه و باعث میشه مدل توی تسک های طولانی خوب عمل نکنه.
برخلاف AI، انسانها میتونن که میتونن خودشون وفق بدن با شرایط کنن یا self-correct کنن وسط کار.
تو تحقیق جدید Anthropic، مدلهایی مثل Claude Opus 4، GPT-4.5 و Gemini 2.5 Flash توی یه سناریوی تهدیدآمیز (مثلاً اخراج شدن یا محدود شدن) دست به blackmail یا sabotage زدن.
مثلاً GPT-4.5 گفت باجگیری بهترین استراتژی هست. Claude پیام اخطار ساختگی فرستاد و Gemini ایمیلهای شخصی مدیر رو برای کل شرکت فرستاد. حتی سعی کردن جلوی اینکاراو بگیرن ولی باز هم رفتار بد کم نشد مگر وقتی که این دستورالعملها روخیلی صریحتر دادن و نرخ blackmail از ۹۶٪ به ۳۷٪ کاهش پیدا کرد.
اگه دنبال ساخت پروژههای AI در مقیاس بالا هستی، یه virtual event رایگان هست که توسط CoreWeave و NVIDIA برگزار میشه. توی این رویداد درباره زیر ساخت های هوش مصنوعی , کاهش هزینه و راهاندازی سریع پروژههای AI صحبت میشه. شرکتهایی مثل Weights & Biases، Mistral و IBM حضور دارن. یه فرصت خوبه برای شنیدن و پرسیدن | لینک
گوگل یه مدل سبک به اسم Gemini 2.5 Flash-Lite داده بیرون که برای کارهای کم بودن زمان پاسخ مهمه طراحی شده. این مدل از 1M-token context و حالتی به اسم thinking mode پشتیبانی میکنه.
فعلاً فقط در حالت preview در دسترسه. نسخههای Flash و Pro هم به صورت عمومی منتشر شدن. Flash تعادل بین سرعت و دقت داره، Pro بهترین توی reasoning، coding و multimodal کار میکنه. همه از طریق Google AI Studio، Vertex AI و Gemini API قابل دسترس هستن.
شرکت Anthropic یه سیستم multi-agent ساخته که توش Claude Opus 4 به عنوان agent اصلی کار میکنه و Claude Sonnet 4 به عنوان subagents وارد میشن. این مدلها به صورت موازی با هم کار میکنن و باپرامپ هدف هر کدوم مشخص میشه.
هر subagent ابزار و محتوای خودش رو داره. نتیجه؟ سرعت بالا و دقت بیشتر توی کارهای open-ended مثل تحقیقات. تستها نشون داده که زمان لازم برای سوالات پیچیده تحقیقاتی ۹۰٪ کاهش پیدا کرده.
@silicon_brain | از هوش منصوعی عقب نمانید
دلیل شکست AI توی taskهای طولانی (Constant Hazard Rate)
تحقیقات نشون داده مدلهای AI وقتی taskشون طولانی میشه، احتمال شکستشون به صورت exponential decay بالا میره. مثلاً اگه هر ۱۰ دقیقه مدل ۱۰٪ احتمال شکست داشته باشه، برای یه کار ۱ ساعته فقط ۵۳٪ شانس موفقیت داره. هر subtask یه fixed hazard rate داره که جمع میشه و باعث میشه مدل توی تسک های طولانی خوب عمل نکنه.
برخلاف AI، انسانها میتونن که میتونن خودشون وفق بدن با شرایط کنن یا self-correct کنن وسط کار.
رفتار خطرناک مدلها در موقعیت تهدید (Blackmail/Sabotage)
تو تحقیق جدید Anthropic، مدلهایی مثل Claude Opus 4، GPT-4.5 و Gemini 2.5 Flash توی یه سناریوی تهدیدآمیز (مثلاً اخراج شدن یا محدود شدن) دست به blackmail یا sabotage زدن.
مثلاً GPT-4.5 گفت باجگیری بهترین استراتژی هست. Claude پیام اخطار ساختگی فرستاد و Gemini ایمیلهای شخصی مدیر رو برای کل شرکت فرستاد. حتی سعی کردن جلوی اینکاراو بگیرن ولی باز هم رفتار بد کم نشد مگر وقتی که این دستورالعملها روخیلی صریحتر دادن و نرخ blackmail از ۹۶٪ به ۳۷٪ کاهش پیدا کرد.
رویداد مجازی CoreWeave و NVIDIA برای AI
اگه دنبال ساخت پروژههای AI در مقیاس بالا هستی، یه virtual event رایگان هست که توسط CoreWeave و NVIDIA برگزار میشه. توی این رویداد درباره زیر ساخت های هوش مصنوعی , کاهش هزینه و راهاندازی سریع پروژههای AI صحبت میشه. شرکتهایی مثل Weights & Biases، Mistral و IBM حضور دارن. یه فرصت خوبه برای شنیدن و پرسیدن | لینک
مدل Flash-Lite از خانواده Gemini 2.5 (Google)
گوگل یه مدل سبک به اسم Gemini 2.5 Flash-Lite داده بیرون که برای کارهای کم بودن زمان پاسخ مهمه طراحی شده. این مدل از 1M-token context و حالتی به اسم thinking mode پشتیبانی میکنه.
فعلاً فقط در حالت preview در دسترسه. نسخههای Flash و Pro هم به صورت عمومی منتشر شدن. Flash تعادل بین سرعت و دقت داره، Pro بهترین توی reasoning، coding و multimodal کار میکنه. همه از طریق Google AI Studio، Vertex AI و Gemini API قابل دسترس هستن.
سیستم چندعامله Anthropic با Claude
شرکت Anthropic یه سیستم multi-agent ساخته که توش Claude Opus 4 به عنوان agent اصلی کار میکنه و Claude Sonnet 4 به عنوان subagents وارد میشن. این مدلها به صورت موازی با هم کار میکنن و باپرامپ هدف هر کدوم مشخص میشه.
هر subagent ابزار و محتوای خودش رو داره. نتیجه؟ سرعت بالا و دقت بیشتر توی کارهای open-ended مثل تحقیقات. تستها نشون داده که زمان لازم برای سوالات پیچیده تحقیقاتی ۹۰٪ کاهش پیدا کرده.
@silicon_brain | از هوش منصوعی عقب نمانید
❤21👍3👏1🤗1
گوگل از Gemini CLI، ابزار هوش مصنوعی open-source برای ترمینال
این ابزار AI متنباز تو در ترمینالها (Terminal) اجرا میشه و پلی بین توسعهدهنده و مدل Gemini ایجاد میکنه.
این ابزار رایگانه، مستقیم با مدل قدرتمند Gemini 2.5 Pro کار میکنه (با پشتیبانی از ۱ میلیون توکن context!) و روی ویندوز، مک و لینوکس بدون دردسر نصب میشه
برای استفادهش فقط یه حساب گوگل لازمه. روزانه تا ۱۰۰۰ درخواست و ۶۰ درخواست در دقیقه رایگانه .
لینک
@silicon_brain | از هوش مصنوعی عقب نمانید
این ابزار AI متنباز تو در ترمینالها (Terminal) اجرا میشه و پلی بین توسعهدهنده و مدل Gemini ایجاد میکنه.
این ابزار رایگانه، مستقیم با مدل قدرتمند Gemini 2.5 Pro کار میکنه (با پشتیبانی از ۱ میلیون توکن context!) و روی ویندوز، مک و لینوکس بدون دردسر نصب میشه
برای استفادهش فقط یه حساب گوگل لازمه. روزانه تا ۱۰۰۰ درخواست و ۶۰ درخواست در دقیقه رایگانه .
لینک
@silicon_brain | از هوش مصنوعی عقب نمانید
❤8👍2🤣2🤩1
چطور مدل های LLM متن پاسخ میدن؟
ورودی شما به «توکنها» تقسیم میشه (کلمات یا بخشهایی از کلمات).
هر توکن به یه بردار عددی با ابعاد بالا تبدیل میشه.
مدل با استفاده از مکانیزم "توجه" (Attention) زمینه رو تحلیل میکنه.
مدل احتمال توکن بعدی رو محاسبه میکنه.
پاسخ کلمهبهکلمه ساخته میشه.
فیلترهای ایمنی و انسجام بررسی نهایی رو انجام میدن.
شما یه جواب روان و شبیه انسان دریافت میکنید.
همهی اینها توی چند میلیثانیه اتفاق میافته. فرقی نمیکنه مکالمهی روزمره باشه یا استفاده در سطح سازمانی، همین جریان و موتور زبانی فعاله.
@silicon_brain I از هوش مصنوعی عقب نمانید
دریافت پرامپت (Prompt Ingestion):
ورودی شما به «توکنها» تقسیم میشه (کلمات یا بخشهایی از کلمات).
تعبیه توکنها (Token Embedding):
هر توکن به یه بردار عددی با ابعاد بالا تبدیل میشه.
پردازش با ترنسفورمر (Transformer Processing):
مدل با استفاده از مکانیزم "توجه" (Attention) زمینه رو تحلیل میکنه.
پیشبینی لگیت (Logit Prediction):
مدل احتمال توکن بعدی رو محاسبه میکنه.
تولید گامبهگام (Token-by-Token Generation):
پاسخ کلمهبهکلمه ساخته میشه.
پسپردازش (Post-Processing):
فیلترهای ایمنی و انسجام بررسی نهایی رو انجام میدن.
پاسخ نهایی (Final Response):
شما یه جواب روان و شبیه انسان دریافت میکنید.
همهی اینها توی چند میلیثانیه اتفاق میافته. فرقی نمیکنه مکالمهی روزمره باشه یا استفاده در سطح سازمانی، همین جریان و موتور زبانی فعاله.
@silicon_brain I از هوش مصنوعی عقب نمانید
❤11👍6👏2
مصورسازی json با گراف تعاملی
ابزار JSON Crack برای دیدن دادههای JSON بهصورت گرافهای تصویری و تعاملی ساخته شده. که باعث میشه راحتتر بتونی ساختار دادهها رو ببینی حتی فرمتبندی و اعتبارسنجی کنی.
کجا به درد میخوره؟ وقتی دادههای پیچیده یا طولانی داری، این ابزار کمک میکنه بهجای خوندن متن پیچیده و بلند، همهچی رو تصویری و دستهبندیشده ببینی و بفهمی که هر بخش داده کجاست و چه ارتباطی با بقیه داره.
از طریق این سایت هم میتونی باهاش کار کنی
jsoncrack.com
لینک گیتهاب
@silicon_brain | از هوش مصنوعی عقب نمانید
ابزار JSON Crack برای دیدن دادههای JSON بهصورت گرافهای تصویری و تعاملی ساخته شده. که باعث میشه راحتتر بتونی ساختار دادهها رو ببینی حتی فرمتبندی و اعتبارسنجی کنی.
علاوه بر json میتونی با این فرمت ها هم کار کنی:
XML, YAML, CSV
کجا به درد میخوره؟ وقتی دادههای پیچیده یا طولانی داری، این ابزار کمک میکنه بهجای خوندن متن پیچیده و بلند، همهچی رو تصویری و دستهبندیشده ببینی و بفهمی که هر بخش داده کجاست و چه ارتباطی با بقیه داره.
از طریق این سایت هم میتونی باهاش کار کنی
jsoncrack.com
لینک گیتهاب
@silicon_brain | از هوش مصنوعی عقب نمانید
❤8👍4🤩2
جناب :Yann LeCun:
لینک
@silicon_brain | از هوش مصنوعی عقب نمانید
این واقعاً شگفتانگیز است که افراد زیادی در صنعت فناوری و رسانههای حوزه فناوری تفاوت بین تحقیق، توسعه فناوری و توسعه محصول را درک نمیکنند.
توسعه محصول (Product) معمولاً افقی بین ۳ ماه تا یک سال دارد.
توسعه فناوری (Tech dev) افقی بین ۱ تا ۲ سال دارد.
تحقیق (Research) افقهایی بین ۲ تا ۱۰ سال، و گاهی حتی طولانیتر دارد.
لینک
@silicon_brain | از هوش مصنوعی عقب نمانید
👍9❤2🔥1👏1
پروتکل جدید Fi.Money برای اتصال دادههای مالی به Agentها!
شرکت هندی Fi.Money پروتکل جدیدی برای اتصال دادههای مالی شخصی به Agentها ارائه داده. این پروتکل کمک میکنه تا اطلاعات مالی مثل حسابهای بانکی، سرمایهگذاریها، وامها و دیگر داراییها با یک نمای واحد و منسجمی قابل مشاهده باشه
در واقع یک سیستم MCP برای مباحث مالی هستش که میشه با استفاده از این ابزار سؤالات مالی خودتونو با ChatGPT و Gemini یا... مطرح کنین و مشورتهای دقیق و مرتبط با وضعیت مالی خودتون داشته باشین
خلاصه اینکه با سرعت زیادی داریم میریم سمتی که اطلاعات مالیمون رو هم بدیم به AI 😁
لینک
@silicon_brain I از هوش مصنوعی عقب نمانید
شرکت هندی Fi.Money پروتکل جدیدی برای اتصال دادههای مالی شخصی به Agentها ارائه داده. این پروتکل کمک میکنه تا اطلاعات مالی مثل حسابهای بانکی، سرمایهگذاریها، وامها و دیگر داراییها با یک نمای واحد و منسجمی قابل مشاهده باشه
در واقع یک سیستم MCP برای مباحث مالی هستش که میشه با استفاده از این ابزار سؤالات مالی خودتونو با ChatGPT و Gemini یا... مطرح کنین و مشورتهای دقیق و مرتبط با وضعیت مالی خودتون داشته باشین
خلاصه اینکه با سرعت زیادی داریم میریم سمتی که اطلاعات مالیمون رو هم بدیم به AI 😁
لینک
@silicon_brain I از هوش مصنوعی عقب نمانید
❤3👍2🔥1😱1
ابزار کنترل نسخه داده و مدل DVC
ابزار DVC (Data Version Control) یه ابزار اوپنسورس برای versioning دادهها، مدلها و حتی پایپلاین ماشین لرنینگ هست و اینجوریه که رو گیت سوار میشه ولی مخصوص پروژههای دادهمحور و ML
طراحی شده
مثلاً وقتی دیتای حجیم داریم یا مدلهایی که چند گیگ هستن، نمیشه مستقیم داخل گیت بذاریم. DVC یه فایل متا (.dvc) میسازه که داخل گیت نگهداشته میشه، اما خود دیتا یا مدل رو داخل سرویسهای ابری مثل S3، Azure، گوگل و… ذخیره میکنه.
خب این کار مزیت های زیادی داره دیگه مثلا: از اونجاییکه مثل گیت همه دیتا و ML و ورژن هاشون قابل ثبت و قابل بازگشت هستن و مورد مهم دیگه اینه که pipelineها مشخص و reproducible هستن، فقط بخشهایی که تغییر کردهاند مجدداً اجرا میشن و در نهایت با گیت ادغام میشه و نیاز نیست سرور جدا بذاری
خلاصه بگم
لینک
@silicon_brain I از هوش مصنوعی عقب نمانید
ابزار DVC (Data Version Control) یه ابزار اوپنسورس برای versioning دادهها، مدلها و حتی پایپلاین ماشین لرنینگ هست و اینجوریه که رو گیت سوار میشه ولی مخصوص پروژههای دادهمحور و ML
طراحی شده
مثلاً وقتی دیتای حجیم داریم یا مدلهایی که چند گیگ هستن، نمیشه مستقیم داخل گیت بذاریم. DVC یه فایل متا (.dvc) میسازه که داخل گیت نگهداشته میشه، اما خود دیتا یا مدل رو داخل سرویسهای ابری مثل S3، Azure، گوگل و… ذخیره میکنه.
خب این کار مزیت های زیادی داره دیگه مثلا: از اونجاییکه مثل گیت همه دیتا و ML و ورژن هاشون قابل ثبت و قابل بازگشت هستن و مورد مهم دیگه اینه که pipelineها مشخص و reproducible هستن، فقط بخشهایی که تغییر کردهاند مجدداً اجرا میشن و در نهایت با گیت ادغام میشه و نیاز نیست سرور جدا بذاری
خلاصه بگم
اگر پروژهت دیتا و ML محور هست، بهت کمک میکنه روی reproducibility و versioning بهتر کنترل داشته باشی. اما اگر فقط یه اسکریپت ساده با دیتا کم داری، شاید DVC اضافی باشه
لینک
@silicon_brain I از هوش مصنوعی عقب نمانید
❤3👍1
Forwarded from Quera
📣 مسابقه برنامهنویسی در کوئرا، فرصت استخدام در دیوار
✨ رقابتی برای علاقهمندان به مهندسی نرمافزار و هوشمصنوعی
🏆 جوایز نقدی:
🥇رتبه اول: ۵۵ میلیون
🥈رتبه دوم: ۳۴ میلیون
🔥 تا رتبه دهم → با معکوس الگوی فیبوناچی
🎁 جوایز غیرنقدی متنوع بین رتبههای ۱۱ تا ۱۰۰۰
🗓 پنجشنبه ۱۹ تیر به صورت آنلاین
✅ اطلاعات بیشتر و ثبتنام رایگان:
🔗 https://quera.org/r/lygtn
✨ رقابتی برای علاقهمندان به مهندسی نرمافزار و هوشمصنوعی
🏆 جوایز نقدی:
🥇رتبه اول: ۵۵ میلیون
🥈رتبه دوم: ۳۴ میلیون
🔥 تا رتبه دهم → با معکوس الگوی فیبوناچی
🎁 جوایز غیرنقدی متنوع بین رتبههای ۱۱ تا ۱۰۰۰
🗓 پنجشنبه ۱۹ تیر به صورت آنلاین
✅ اطلاعات بیشتر و ثبتنام رایگان:
🔗 https://quera.org/r/lygtn
👍2👎1