This media is not supported in your browser
VIEW IN TELEGRAM
"We are not going to get to human level AI by just scaling up MLMs. This is just not going to happen. There's no way. Okay, absolutely no way. And whatever you can hear from some of my uh more adventurous colleagues, it's not going to happen within the next two years.
▪️ Yann LeCun: We Won't Reach AGI By Scaling Up LLMS
#پادکست
🔸 مطالب بیشتر 👇👇
✅ @AI_DeepMind
🔸 @AI_Person
▪️ Yann LeCun: We Won't Reach AGI By Scaling Up LLMS
#پادکست
🔸 مطالب بیشتر 👇👇
✅ @AI_DeepMind
🔸 @AI_Person
محققان الگوریتم خودآموز قدرتمندی به نام Absolute Zero را ساختهاند که به هیچ داده انسانی نیاز ندارد. این الگوریتم وظایف خود را میسازد، آنها را با استفاده از روشهای استدلال مختلف حل میکند و از طریق خودبازی درست مانند آموزش از صفر به خودش پیشرفت میکند.
این الگوریتم که Absolute Zero Reasoner (AZR) نام دارد، در #کدنویسی و #ریاضی نمرات بالایی کسب کرد و حتی مدلهایی را که با کمک متخصصان آموزش دیده بودند، شکست داد. این الگوریتم تغییر بزرگی را در Al نشان میدهد از نیاز به انسان برای یادگیری، به رشد کامل به تنهایی چگونه شدنی هست!
▪️ Absolute Zero: Reinforced Self-play Reasoning with Zero Data
#مقاله #ایده_جذاب #یادگیری_تقویتی #مدل_استدلالی #هوش_مصنوعی
🔸 مطالب بیشتر 👇👇
✅ @AI_DeepMind
🔸 @AI_Person
این الگوریتم که Absolute Zero Reasoner (AZR) نام دارد، در #کدنویسی و #ریاضی نمرات بالایی کسب کرد و حتی مدلهایی را که با کمک متخصصان آموزش دیده بودند، شکست داد. این الگوریتم تغییر بزرگی را در Al نشان میدهد از نیاز به انسان برای یادگیری، به رشد کامل به تنهایی چگونه شدنی هست!
▪️ Absolute Zero: Reinforced Self-play Reasoning with Zero Data
#مقاله #ایده_جذاب #یادگیری_تقویتی #مدل_استدلالی #هوش_مصنوعی
🔸 مطالب بیشتر 👇👇
✅ @AI_DeepMind
🔸 @AI_Person
DeepMind AI Expert
الهه حسین نژاد کجاست؟ روز چهارم خرداد ماه 1404، الهه حسین نژاد مانند هر روز، پس از پایان ساعت کاری اش از محل کار خود در میدان آزادی تهران راهی خانه شد. مقصد او اسلامشهر بود. خانواده میگویند در آخرین تماس تلفنی، الهه اعلام کرده بود که در مسیر بازگشت است.…
به فرزندان خودتون امنیت یاد بدیم تو خیابون که میرین امنیت داشته باشید. برای دیگران تز روشنفکری که خودتون فقط قبولش دارید رو نزنید تو ماشین می شینید بر ای کنار دستیتون امن باشید تو مترو میرید به دیگران حریم امنیت بدیم تو فضای مجازی به دیگران حریم امنیت بدیم و خیلی چیزایی که ارامش و امنیت روحی و روانی دیگران روبهم نریزیم و برای دیگران پناه باشیم
خورشیدِ این خطه
تاول مینشاند بر پوستِ آفتابگردانها
میسوزیم
خیره به دودِ قلیانِ قلهی این دیار
پُک میزند پیر و میخندد
به گریستنِ جوانیِ ما
بادکنکها مگر برای تزیینِ آغاز نبودند؟
چگونه پس به میوههایی بدل شدند
که جنازهات رشدشان داد؟
باد مگر با عطرِ گیسو نسبت نداشت؟
حال چرا تنها
بوی جنازهی یک طوفان را میآورد؟
این مرز
امتدادِ خونِ رفتهایست
آرش!
تیری که رها کردی عاقبت
بر قلب کسی فرود آمد
علیرضا قاسمیان
برای الهه حسین نژاد 🖤
خورشیدِ این خطه
تاول مینشاند بر پوستِ آفتابگردانها
میسوزیم
خیره به دودِ قلیانِ قلهی این دیار
پُک میزند پیر و میخندد
به گریستنِ جوانیِ ما
بادکنکها مگر برای تزیینِ آغاز نبودند؟
چگونه پس به میوههایی بدل شدند
که جنازهات رشدشان داد؟
باد مگر با عطرِ گیسو نسبت نداشت؟
حال چرا تنها
بوی جنازهی یک طوفان را میآورد؟
این مرز
امتدادِ خونِ رفتهایست
آرش!
تیری که رها کردی عاقبت
بر قلب کسی فرود آمد
علیرضا قاسمیان
برای الهه حسین نژاد 🖤
Forwarded from Ali's Notes
تویت جالب اندرو کارپاسی درمورد
LLMs and code generation
https://x.com/karpathy/status/1930305209747812559
@css_nlp
LLMs and code generation
https://x.com/karpathy/status/1930305209747812559
You could see it as there being two modes in creation. Borrowing GAN terminology:
1) generation and
2) discrimination.
e.g. painting - you make a brush stroke (1) and then you look for a while to see if you improved the painting (2). these two stages are interspersed in pretty much all creative work.
Second point. Discrimination can be computationally very hard.
- images are by far the easiest. e.g. image generator teams can create giant grids of results to decide if one image is better than the other. thank you to the giant GPU in your brain built for processing images very fast.
- text is much harder. it is skimmable, but you have to read, it is semantic, discrete and precise so you also have to reason (esp in e.g. code).
- audio is maybe even harder still imo, because it force a time axis so it's not even skimmable. you're forced to spend serial compute and can't parallelize it at all.
You could say that in coding LLMs have collapsed (1) to ~instant, but have done very little to address (2). A person still has to stare at the results and discriminate if they are good. This is my major criticism of LLM coding in that they casually spit out *way* too much code per query at arbitrary complexity, pretending there is no stage 2. Getting that much code is bad and scary. Instead, the LLM has to actively work with you to break down problems into little incremental steps, each more easily verifiable. It has to anticipate the computational work of (2) and reduce it as much as possible. It has to really care.
This leads me to probably the biggest misunderstanding non-coders have about coding. They think that coding is about writing the code (1). It's not. It's about staring at the code (2). Click Me Load More it all into your working memory. Pacing back and forth. Thinking through all the edge cases. If you catch me at a random point while I'm "programming", I'm probably just staring at the screen and, if interrupted, really mad because it is so computationally strenuous. If we only get much faster 1, but we don't also reduce 2 (which is most of the time!), then clearly the overall speed of coding won't improve (see Amdahl's law).
@css_nlp
This media is not supported in your browser
VIEW IN TELEGRAM
موقعی که سوار ماشین میشین چه اسنپ چه تپسی و مشابه پشت صندلی شاگرد نشینید
#کتاب #علم_داده #یادگیری_ماشین
▪️ Data Science and Machine Learning
🔸 مطالب بیشتر 👇👇
✅ @AI_DeepMind
🔸 @AI_Person
▪️ Data Science and Machine Learning
🔸 مطالب بیشتر 👇👇
✅ @AI_DeepMind
🔸 @AI_Person
Finetune Qwen3, Llama 4, Gemma 3, Phi-4 & Mistral 2x faster with 80% less VRAM!
▪️ Finetune for Free
#منابع #مقاله
🔸 مطالب بیشتر 👇👇
✅ @AI_DeepMind
🔸 @AI_Person
▪️ Finetune for Free
#منابع #مقاله
🔸 مطالب بیشتر 👇👇
✅ @AI_DeepMind
🔸 @AI_Person
dots.llm1 is a large-scale MoE system activating 14B out of 142B parameters, matching state-of-the-art performance such as Qwen2.5-72B after pretraining on 11.2T high-quality, non-synthetic tokens, with open-sourced checkpoints every trillion tokens to support research into LLM learning dynamics.
https://huggingface.co/rednote-hilab/dots.llm1.inst
https://huggingface.co/rednote-hilab/dots.llm1.inst
DeepMind AI Expert
Finetune Qwen3, Llama 4, Gemma 3, Phi-4 & Mistral 2x faster with 80% less VRAM! ▪️ Finetune for Free #منابع #مقاله 🔸 مطالب بیشتر 👇👇 ✅ @AI_DeepMind 🔸 @AI_Person
Finetune DeepSeek-R1-0528-Qwen3 with GRPO using our free notebook!
Our new reward function increases multilingual (or custom domain) response rates by 40%+.
https://colab.research.google.com/github/unslothai/notebooks/blob/main/nb/DeepSeek_R1_0528_Qwen3_(8B)_GRPO.ipynb
#منابع #مقاله
🔸 مطالب بیشتر 👇👇
✅ @AI_DeepMind
🔸 @AI_Person
Our new reward function increases multilingual (or custom domain) response rates by 40%+.
https://colab.research.google.com/github/unslothai/notebooks/blob/main/nb/DeepSeek_R1_0528_Qwen3_(8B)_GRPO.ipynb
#منابع #مقاله
🔸 مطالب بیشتر 👇👇
✅ @AI_DeepMind
🔸 @AI_Person
Reinforcement Learning from Human Feedback.pdf
4.8 MB
Reinforcement Learning from Human Feedback
#مقاله #بازخورد_انسانی_یادگیری_تقویتی #یادگیری_تقویتی #کتاب #منابع
🔸 مطالب بیشتر 👇👇
✅ @AI_DeepMind
🔸 @AI_Person
#مقاله #بازخورد_انسانی_یادگیری_تقویتی #یادگیری_تقویتی #کتاب #منابع
🔸 مطالب بیشتر 👇👇
✅ @AI_DeepMind
🔸 @AI_Person
کورس کلاسی #نظریه_بازی دانشگاه Yale
▪️ Game Theory with Ben Polak
#منابع #الگوریتمها #هوش_مصنوعی #فیلم
🔸 مطالب بیشتر 👇👇
✅ @AI_DeepMind
🔸 @AI_Person
▪️ Game Theory with Ben Polak
#منابع #الگوریتمها #هوش_مصنوعی #فیلم
🔸 مطالب بیشتر 👇👇
✅ @AI_DeepMind
🔸 @AI_Person
Nadarim Az To Behtar
Alireza Talischi @RozMusic.com
یک "دوست" دارم!... چه خوش آن که انسان روحی جسته باشد تا در میان آشوب طوفان بتواند در دامن آن بخزد. پناهگاهی نرم و اطمینان بخش که درآن به انتظار آرامش ضربان قلب تپنده خویش نفسی برآورد!دیگر تنها نباشد، ناگزیرنباشد که باچشمان پیوسته باز و سوخته ازبیدارخوابی همواره مسلح باشد، تاسرانجام خستگیاش تسلیم دشمن شود! رفیق عزیزی داشته، سراسرهستی خود رابه دست وی سپرده باشد. همچنان که او نیز همه هستی خود را به دست او سپرده است. سرانجام طعم آسایش بچشد. خودبه خواب رود و او بیدار بماند. خودبیدار باشدو او بخوابد. ازلذت حمایت ازآن کس که مانند کودکی خردسال خودرابه او تفویض کرده است، برخوردارشود. بزرگترین شادی رادر آن بیابد که خود او را به اختیار وی گذارد. احساس کند که رازدارش اوست و اختیاردارش اوست. پیروفرسوده وخسته از کشیدن بارِ آن همه سالهای زندگی، بار دیگر جوان و شاداب در پیکر دوست زاده شود. از جهان نوگشته با چشمان او بهرهمند گردد. چیزهای زیبای گذران رابا حواس او در آغوش کشد، با قلب او از رخشندگی پر شکوه زیستن کام برگیرد...حتی با او رنج ببرد...آه!... حتی رنج، اگر دوستان با هم باشند، شادی است.
#روز_جهانی_رفیق_صمیمی_مبارک❤️
#روز_جهانی_رفیق_صمیمی_مبارک❤️
MiMo-VL Technical Report
https://huggingface.co/papers/2506.03569
انتشار مدل جدید
🔸 مطالب بیشتر 👇👇
✅ @AI_DeepMind
https://huggingface.co/papers/2506.03569
انتشار مدل جدید
🔸 مطالب بیشتر 👇👇
✅ @AI_DeepMind