دیتاست کامل کانال «دِوتوییتر»
بالاخره کل تاریخچه پیامهای کانال دِوتوییتر به صورت JSON منتشر شد!
این دیتاست شامل تمام پیامها از ابتدای شکلگیری کانال در سال ۱۳۹۹ تا الان هست.
مناسب برای:
- تمرین دیتاساینس و NLP روی محتوای فارسی برنامهنویسی
- تحلیل روند تکنولوژیها در جامعه توسعهدهندگان ایرانی
- استخراج منابع آموزشی و لینکهای مفید
- تحلیل واکنشها و محبوبیت محتوا
لینک دسترسی:
github.com/devtwitter/devtwitter-data
یادتون نره ستاره بدین :))
@DevTwitter
بالاخره کل تاریخچه پیامهای کانال دِوتوییتر به صورت JSON منتشر شد!
این دیتاست شامل تمام پیامها از ابتدای شکلگیری کانال در سال ۱۳۹۹ تا الان هست.
مناسب برای:
- تمرین دیتاساینس و NLP روی محتوای فارسی برنامهنویسی
- تحلیل روند تکنولوژیها در جامعه توسعهدهندگان ایرانی
- استخراج منابع آموزشی و لینکهای مفید
- تحلیل واکنشها و محبوبیت محتوا
لینک دسترسی:
github.com/devtwitter/devtwitter-data
یادتون نره ستاره بدین :))
@DevTwitter
توی vs code حالا میتونید از ollama و مدل های لوکال خودتون تو copilot استفاده کنین
کافیه Command Palette (F1) رو باز کنین و از بخش Configure Models فعال کنین
@DevTwitter | <Shojaei/>
کافیه Command Palette (F1) رو باز کنین و از بخش Configure Models فعال کنین
@DevTwitter | <Shojaei/>
یه تم ادمین جدید و باحال برای جنگو که با نصب خیلی ساده میتونید پنل ادمین جنگو رو زیباتر کنید! این تم با فریمورک DaisyUI ساخته شده و بهراحتی ظاهر پنل رو مدرن و ریسپانسیو میکنه.
https://github.com/hypy13/django-daisy
@DevTwitter | <hossein/>
https://github.com/hypy13/django-daisy
@DevTwitter | <hossein/>
یه پکیج پایتون جمعوجور نوشتم که باهاش میتونید خیلی راحت حالت maintenance رو روی اپ FastAPI تون فعال/غیرفعال کنید.
ساده راهاندازی میشه، منعطفه، میتونید بعضی اندپوینتها exclude یا فورس کنید و ریسپانسهای سفارشی برگردونید.
گیتهاب:
https://github.com/msamsami/fastapi-maintenance
@DevTwitter | <Mehdi/>
ساده راهاندازی میشه، منعطفه، میتونید بعضی اندپوینتها exclude یا فورس کنید و ریسپانسهای سفارشی برگردونید.
گیتهاب:
https://github.com/msamsami/fastapi-maintenance
@DevTwitter | <Mehdi/>
کلمه پر کاربر Bottleneck به چه معنیه؟
تصور کن یه بطری آب داری (bottle)، و میخوای خیلی سریع آب داخلش رو خالی کنی.
اما چون دهانهی بطری باریکه (neck)، سرعت خالی شدن آب کم میشه.
این قسمت باریک شده که جلوی سرعت رو میگیره، میگن bottleneck
تو برنامهنویسی:
یعنی بخشی از برنامه که باعث کند شدن کل عملکرد میشه.
مهم نیست بقیهی سیستم چقدر سریع باشن، تا وقتی bottleneck وجود داره، کار کل سیستم لنگ میمونه.
با Instrumentation میفهمی Bottleneck کجاست
مثلاً با Tracing:
میبینی یه درخواست API کل سیستم رو سریع رد میکنه، ولی توی مرحلهی `FindUser()`، یهو ۸ ثانیه مکث میکنه → Bottleneck همینه!
یا با Metrics:
نمودار نشون میده که وقتی درخواستها زیاد میشن، مصرف CPU میره بالا، اما فقط برای یه سرویس خاص.
چرا باید Bottleneck رو پیدا کنی؟
چون بهت میگه:
کجا باید بهینهسازی کنی
کدوم سرویس باید scale بشه
چه منابعی داری هدر میدی
@DevTwitter | <Alireza Feizi/>
تصور کن یه بطری آب داری (bottle)، و میخوای خیلی سریع آب داخلش رو خالی کنی.
اما چون دهانهی بطری باریکه (neck)، سرعت خالی شدن آب کم میشه.
این قسمت باریک شده که جلوی سرعت رو میگیره، میگن bottleneck
تو برنامهنویسی:
یعنی بخشی از برنامه که باعث کند شدن کل عملکرد میشه.
مهم نیست بقیهی سیستم چقدر سریع باشن، تا وقتی bottleneck وجود داره، کار کل سیستم لنگ میمونه.
با Instrumentation میفهمی Bottleneck کجاست
مثلاً با Tracing:
میبینی یه درخواست API کل سیستم رو سریع رد میکنه، ولی توی مرحلهی `FindUser()`، یهو ۸ ثانیه مکث میکنه → Bottleneck همینه!
یا با Metrics:
نمودار نشون میده که وقتی درخواستها زیاد میشن، مصرف CPU میره بالا، اما فقط برای یه سرویس خاص.
چرا باید Bottleneck رو پیدا کنی؟
چون بهت میگه:
کجا باید بهینهسازی کنی
کدوم سرویس باید scale بشه
چه منابعی داری هدر میدی
@DevTwitter | <Alireza Feizi/>
تو سایت زیر مجموعه از مقالات با تمرکز بر دیتاساینس لیست شده که بهتون کمک میکنه کد پایتون رو بهینهتر و بهتر و سریعتر بنویسید، از دستش ندید!
https://pythonspeed.com/datascience/
@DevTwitter | <Reza Jafari/>
https://pythonspeed.com/datascience/
@DevTwitter | <Reza Jafari/>
این مخزن گیتهاب شامل بیش از ۱۵۷ پرامپت متنوع و کاربردی برای ChatGPT و مدلهای مشابهه که تو زمینههای مختلف کمکت میکنه،از جمله:
- برنامهنویسی و رفع اشکال
- تولید محتوا و نوشتن مقاله
- آموزش و یادگیری مفاهیم پیچیده
https://github.com/f/awesome-chatgpt-prompts
@DevTwitter | <OmiD/>
- برنامهنویسی و رفع اشکال
- تولید محتوا و نوشتن مقاله
- آموزش و یادگیری مفاهیم پیچیده
https://github.com/f/awesome-chatgpt-prompts
@DevTwitter | <OmiD/>
در دنیای امروز، سرعت و کارایی در توسعه اپلیکیشنها از اهمیت بالایی برخوردار است. یکی از ابزارهایی که به طرز چشمگیری میتواند عملکرد اپلیکیشنها را بهبود دهد، Redis است.
اما چرا استفاده از Redis در لاراول اهمیت دارد؟
ردیس یک سیستم کش (Caching) بسیار سریع است که به ذخیرهسازی دادهها در حافظه (RAM) پرداخته و سرعت دسترسی به آنها را به طرز چشمگیری افزایش میدهد. این ویژگی بهویژه در پروژههایی که نیاز به پردازش دادههای سنگین دارند، بسیار مفید است.
مزایای استفاده از Redis در لاراول:
افزایش سرعت:
ردیس با ذخیره دادهها در حافظه و جلوگیری از دسترسی مکرر به پایگاه داده، سرعت اپلیکیشن را بهطور قابل توجهی افزایش میدهد.
کاهش بار پایگاه داده:
با کش کردن نتایج کوئریها یا دادههای ثابت، Redis بار زیادی را از روی پایگاه داده برداشته و عملکرد کلی سیستم را بهبود میبخشد.
مقیاسپذیری بالا:
ردیس به راحتی میتواند با سیستمهای بزرگ و پیچیده کنار بیاید و در مواقع نیاز به مقیاسپذیری، بهطور خودکار عملکرد خود را حفظ میکند.
پشتیبانی از دادههای پیچیده:
ردیس از دادههای پیچیده مانند Listها، Setها، Hashها و Sorted Setها پشتیبانی میکند، که در مقایسه با کشهای سنتی ویژگی منحصر به فردی است.
پشتیبانی از کشهای چند سطحی:
ردیس امکان ساخت کشهایی با اولویتهای مختلف را فراهم میکند و میتواند دادهها را بهطور هوشمند ذخیره و بازیابی کند.
@DevTwitter | <Parham Mahmoodi/>
اما چرا استفاده از Redis در لاراول اهمیت دارد؟
ردیس یک سیستم کش (Caching) بسیار سریع است که به ذخیرهسازی دادهها در حافظه (RAM) پرداخته و سرعت دسترسی به آنها را به طرز چشمگیری افزایش میدهد. این ویژگی بهویژه در پروژههایی که نیاز به پردازش دادههای سنگین دارند، بسیار مفید است.
مزایای استفاده از Redis در لاراول:
افزایش سرعت:
ردیس با ذخیره دادهها در حافظه و جلوگیری از دسترسی مکرر به پایگاه داده، سرعت اپلیکیشن را بهطور قابل توجهی افزایش میدهد.
کاهش بار پایگاه داده:
با کش کردن نتایج کوئریها یا دادههای ثابت، Redis بار زیادی را از روی پایگاه داده برداشته و عملکرد کلی سیستم را بهبود میبخشد.
مقیاسپذیری بالا:
ردیس به راحتی میتواند با سیستمهای بزرگ و پیچیده کنار بیاید و در مواقع نیاز به مقیاسپذیری، بهطور خودکار عملکرد خود را حفظ میکند.
پشتیبانی از دادههای پیچیده:
ردیس از دادههای پیچیده مانند Listها، Setها، Hashها و Sorted Setها پشتیبانی میکند، که در مقایسه با کشهای سنتی ویژگی منحصر به فردی است.
پشتیبانی از کشهای چند سطحی:
ردیس امکان ساخت کشهایی با اولویتهای مختلف را فراهم میکند و میتواند دادهها را بهطور هوشمند ذخیره و بازیابی کند.
@DevTwitter | <Parham Mahmoodi/>
This media is not supported in your browser
VIEW IN TELEGRAM
کمپانی HuggingFace یک دوره جدید گذاشته برای یادگیری MCP، که پروتکلی هست که توسط کمپانی Anthropic معرفی شده و مدلهای AI مثل LLM ها را به یک سری قابلیت، مثل ابزارهای مختلف وصل میکنه.
لینک:
https://huggingface.co/learn/mcp-course/unit0/introduction
@DevTwitter | <Mehdi Allahyari/>
لینک:
https://huggingface.co/learn/mcp-course/unit0/introduction
@DevTwitter | <Mehdi Allahyari/>
جدی فکر نمیکردم این ردیسی که از codecrafters شروع کردم رو تموم کنم. روز اولی که نوشتم حتی بلد نبودم هش مپ بنویسم الان کلی C یاد گرفتم و چیزای دیگه.
و اینکه ۶۰ ۷۰ ساعت متمرکز کار کردم رو میتونم ببینم چون همه ویدیوهاش هست.
https://www.youtube.com/playlist?list=PL41E3XFK25FcJQRyg06xoYFu-m6GB7Tj-
@DevTwitter | <Shaygan/>
و اینکه ۶۰ ۷۰ ساعت متمرکز کار کردم رو میتونم ببینم چون همه ویدیوهاش هست.
https://www.youtube.com/playlist?list=PL41E3XFK25FcJQRyg06xoYFu-m6GB7Tj-
@DevTwitter | <Shaygan/>
Media is too big
VIEW IN TELEGRAM
یک پروژه جالبی به اسم BrowserBee رو در گیتهاب دیدم که دولوپرش هم پارسا غفاری بود.
حرکتی که ایشون زدن شبیه مرورگر Dia هست (در وضعیت فعلی البته), یک دستیار هوش مصنوعی کنار صفحه ایجاد میشه و میتونید با تجربه ای نزدیک به این مرورگر باهاش کار کنید.
پیشنهاد میدم حتما یکبار تستش کنید.
https://github.com/parsaghaffari/browserbee
@DevTwitter | <Sanguine(Ali)™/>
حرکتی که ایشون زدن شبیه مرورگر Dia هست (در وضعیت فعلی البته), یک دستیار هوش مصنوعی کنار صفحه ایجاد میشه و میتونید با تجربه ای نزدیک به این مرورگر باهاش کار کنید.
پیشنهاد میدم حتما یکبار تستش کنید.
https://github.com/parsaghaffari/browserbee
@DevTwitter | <Sanguine(Ali)™/>
برای علاقهمندان به سئوی تکنیکال، یه ابزار فوق العاده اومده که نباید از دستش بدید!
با این افزونه میتونید:
جاوااسکریپت، CSS، تصاویر و کوکیها رو با یه کلیک خاموش کنید و سایت رو زیر ذره بین ببرید.
خودتون رو جای Googlebot یا Bingbot بذارید و ببینید رباتهای جست وجو چی تو سایتتون میبینن!
سرعت سایت رو با شبیهسازی اینترنت کُند (مثل 3G) تست کنید تا مطمئن شید کاربرا غر نمیزنن!
و کلی قابلیت باحال دیگه که کار تحلیل فنی سایت رو مثل آب خوردن میکنه!
https://chromewebstore.google.com/detail/seo-toggle-an-seo-testing/nhphhpnngoiieahbkcohbhcjddfpnmke
@DevTwitter | <Mehrnaz Aflatoon/>
با این افزونه میتونید:
جاوااسکریپت، CSS، تصاویر و کوکیها رو با یه کلیک خاموش کنید و سایت رو زیر ذره بین ببرید.
خودتون رو جای Googlebot یا Bingbot بذارید و ببینید رباتهای جست وجو چی تو سایتتون میبینن!
سرعت سایت رو با شبیهسازی اینترنت کُند (مثل 3G) تست کنید تا مطمئن شید کاربرا غر نمیزنن!
و کلی قابلیت باحال دیگه که کار تحلیل فنی سایت رو مثل آب خوردن میکنه!
https://chromewebstore.google.com/detail/seo-toggle-an-seo-testing/nhphhpnngoiieahbkcohbhcjddfpnmke
@DevTwitter | <Mehrnaz Aflatoon/>
ویدیوی جدیدمون در یوتیوب آپلود شد. این ویدیو در مورد scrape کردن وب سایتها برای استخراج اطلاعات مورد نظر هست. و use case مورد نظر این بود که هوش مصنوعی چطور میتواند فرایند پیدا کردن شرکتهای مناسب برای خرید یا همکاری تجاری را سادهتر کند.
هدف اینه (با الهام از استراتژی نیل پاتل) که ببینیم چطور با استفاده از AI Agent ها، میتونیم فرایند جمعآوری اطلاعات شرکتها از منابع مختلف رو بررسی و سادهسازی کنیم.
ویدیوی جالبی ست!
Youtube: https://youtube.com/watch?v=DFEb0dyvt5E
@DevTwitter | <Mehdi Allahyari/>
هدف اینه (با الهام از استراتژی نیل پاتل) که ببینیم چطور با استفاده از AI Agent ها، میتونیم فرایند جمعآوری اطلاعات شرکتها از منابع مختلف رو بررسی و سادهسازی کنیم.
ویدیوی جالبی ست!
Youtube: https://youtube.com/watch?v=DFEb0dyvt5E
@DevTwitter | <Mehdi Allahyari/>
This media is not supported in your browser
VIEW IN TELEGRAM
همین الان یه سایت خیییلی خفن و عجیب پیدا کردم که منو نداره، فرم نداره و حتی دکمه هم نداره!
https://bruno-simon.com/
تو این سایت پورتفولیو، فقط یه ماشین هست!
یه جاده.
و یه دنیای سه بعدی عجیب !!
پروژهها؟ کنار جاده پارکن.
دکمهها؟ تابلوهای راهنما شدن.
و توی کل سایت؟ فقط با ماشین گاز میدی و کشف میکنی...
این یه سایت و پورتفولیو نیست.
یه بازیه.
یه تجربست.
یه یادآوریه که UX میتونه خنده بیاره، تعامل ایجاد کنه، و بره تو حافظه بلندمدت مغز.
دیدنش وااقعا واجبه. چون یه بار دیگه یادمون میندازه که وبسایت چقدر میتونه خلاقانه باشه
@DevTwitter | <Maryam Moazemi/>
https://bruno-simon.com/
تو این سایت پورتفولیو، فقط یه ماشین هست!
یه جاده.
و یه دنیای سه بعدی عجیب !!
پروژهها؟ کنار جاده پارکن.
دکمهها؟ تابلوهای راهنما شدن.
و توی کل سایت؟ فقط با ماشین گاز میدی و کشف میکنی...
این یه سایت و پورتفولیو نیست.
یه بازیه.
یه تجربست.
یه یادآوریه که UX میتونه خنده بیاره، تعامل ایجاد کنه، و بره تو حافظه بلندمدت مغز.
دیدنش وااقعا واجبه. چون یه بار دیگه یادمون میندازه که وبسایت چقدر میتونه خلاقانه باشه
@DevTwitter | <Maryam Moazemi/>
#میم_شبانگاهی
حداقل سیستم مورد نیاز برای Windows 11 :
* 1 GHz or faster with 2+ core
* 4 GB RAM
* 64+ GB disk space
* TPM 2 must
حداقل سیستم مورد نیاز برای لینوکس :
برق
@DevTwitter | <MehrdadLinux/>
حداقل سیستم مورد نیاز برای Windows 11 :
* 1 GHz or faster with 2+ core
* 4 GB RAM
* 64+ GB disk space
* TPM 2 must
حداقل سیستم مورد نیاز برای لینوکس :
برق
@DevTwitter | <MehrdadLinux/>
تقریباً همهی تیمهای ML این مشکل رو دارن:
۱- مدلی واسه خودت آموزش بدی/ (fine tune کنی) یا ۲- از API یه مدل بزرگ استفاده کنی؟
و خوب خیلی ها هم نه داده دارن، نه وقت، نه بودجه!
اما یک راه حل سومی هم هست: میتونی یه مدل دقیق در حد GPT بسازی — با کمتر از ۳ دلار هزینه.
این راه جدید بهترینهای هر دو رو با هم ترکیب میکنه: از یه مدل اپن سورس برای تولید دادهی مصنوعی (synthetic) استفاده کن، بعد یه مدل کوچیک، سریع و ارزونتر رو با اون آموزش بده. چون:
- اکثر پروژههای واقعی دادهی آماده ندارن.
- مدلهایی مثل GPT-4 خیلی خوبن ولی هزینهبر، کند و نیاز به فرستادن اطلاعات حساس به یه شرکت دیگه دارن.
- حالا با دادهی مصنوعی باکیفیت از مدلهای اوپنسورس (مثل Mixtral)، دیگه لازم نیست بری سراغ لیبل زدن دستی.
مدل بزرگ ("معلم") دادهها رو برات برچسب میزنه، بعدش یه مدل کوچیکتر ("دانشآموز") رو باهاش آموزش میدی.
مثال: مطالعهی موردی: تحلیل احساسات (sentiment analysis) اخبار مالی
- دقت: GPT-4 و RoBERTa هر دو ۹۴٪
هزینه:
- GPT-4: $3061
- RoBERTa: $2.70
زمان پاسخ:
- GPT-4 چند ثانیه
- RoBERTa = ۰.۱۳ ثانیه
مصرف کربن:
- GPT-4 = ~۱۰۰۰ kg
- RoBERTa = ۰.۱۲ kg
اگه میخواهید کامل بدونید این بلاگ را حتما بخونید.
Blog: https://huggingface.co/blog/synthetic-data-save-costs
@DevTwitter | <Mehdi Allahyari/>
۱- مدلی واسه خودت آموزش بدی/ (fine tune کنی) یا ۲- از API یه مدل بزرگ استفاده کنی؟
و خوب خیلی ها هم نه داده دارن، نه وقت، نه بودجه!
اما یک راه حل سومی هم هست: میتونی یه مدل دقیق در حد GPT بسازی — با کمتر از ۳ دلار هزینه.
این راه جدید بهترینهای هر دو رو با هم ترکیب میکنه: از یه مدل اپن سورس برای تولید دادهی مصنوعی (synthetic) استفاده کن، بعد یه مدل کوچیک، سریع و ارزونتر رو با اون آموزش بده. چون:
- اکثر پروژههای واقعی دادهی آماده ندارن.
- مدلهایی مثل GPT-4 خیلی خوبن ولی هزینهبر، کند و نیاز به فرستادن اطلاعات حساس به یه شرکت دیگه دارن.
- حالا با دادهی مصنوعی باکیفیت از مدلهای اوپنسورس (مثل Mixtral)، دیگه لازم نیست بری سراغ لیبل زدن دستی.
مدل بزرگ ("معلم") دادهها رو برات برچسب میزنه، بعدش یه مدل کوچیکتر ("دانشآموز") رو باهاش آموزش میدی.
مثال: مطالعهی موردی: تحلیل احساسات (sentiment analysis) اخبار مالی
- دقت: GPT-4 و RoBERTa هر دو ۹۴٪
هزینه:
- GPT-4: $3061
- RoBERTa: $2.70
زمان پاسخ:
- GPT-4 چند ثانیه
- RoBERTa = ۰.۱۳ ثانیه
مصرف کربن:
- GPT-4 = ~۱۰۰۰ kg
- RoBERTa = ۰.۱۲ kg
اگه میخواهید کامل بدونید این بلاگ را حتما بخونید.
Blog: https://huggingface.co/blog/synthetic-data-save-costs
@DevTwitter | <Mehdi Allahyari/>
بچه ها، MicrosoftBuild شروع شده و کلی ورکشاپ و ایونت های خفن و رایگان داره...
از دستش ندین...
https://build.microsoft.com/en-US/home
@DevTwitter | <Sam92/>
از دستش ندین...
https://build.microsoft.com/en-US/home
@DevTwitter | <Sam92/>