Telegram Web Link
ByteScale: Efficient Scaling of LLM Training with a 2048K Context Length on More Than 12,000 GPUs

📚 'Read

@datascienceiot
CS229 Lecture Notes
Andrew Ng and Tengyu Ma


📚 Читать

@datascienceiot
Attention from Beginners Point of View

📚 Reed

@datascienceiot
A SURVEY ON POST-TRAINING OF LARGE LANGUAGE MODELS

📚 Read

@datascienceiot
Исследование рынка аналитиков от агентства NEWHR

Респондентами стали 1293 аналитика разных грейдов: от джунов до руководителей.

— Более 35% опрошенных назвали Авито лучшей компанией для работы.
— Более 70% в 2024 году стали получать больше.
— 60% хоть раз сменили работу за последние 2 года.

С результатами исследования NEWHR можно ознакомиться по ссылке.

@datascienceiot
Controlling Latent Diffusion Using Latent CLIP

📚 Read

@datascienceiot
Everything You Always Wanted To Know About Mathematics*

📓 book

@datascienceiot
Introduction to Graph Neural Networks: A Starting Point for Machine Learning Engineers

📓 Paper

@datascienceiot
Password Security Design

📚 Reed

@datascienceiot
🔥 The Project Gutenberg EBook of First Course in the Theory of Equations,

Этой классической книге по математике 100 лет.

📚 Book

@programming_books_it
Three Types of Intelligence Explosion

📚 Article

@datascienceiot
STAT 248 - Analysis of Time Series
Full Lecture Notes


📚 Book

@datascienceiot
Graph Theory and Additive Combinatorics
Exploring Structure and Randomness

📚 Книга

@datascienceiot
Version 2 of our survey on 𝐌𝐞𝐜𝐡𝐚𝐧𝐢𝐬𝐭𝐢𝐜 𝐈𝐧𝐭𝐞𝐫𝐩𝐫𝐞𝐭𝐚𝐛𝐢𝐥𝐢𝐭𝐲, ext.

📚Paper

@datascienceiot
2025/07/06 06:41:10
Back to Top
HTML Embed Code: