Forwarded from Alan的小纸箱
板栗的白咕咕
Photo
Your outie enables Swift 6 Language Mode for old projects.
Your outie forks and upgrades dependencies to be concurrency-error-free instead of spamming
#SwiftDev@Laoself
Your outie forks and upgrades dependencies to be concurrency-error-free instead of spamming
@preconcurrency
on imports.#SwiftDev@Laoself
Forwarded from Anyway.Now
Arial 的祸害
最近 JJ 去了一次澳门,参观了大赛车博物馆。看到不少岁数比自己还大很多的赛车,作为一个赛车游戏爱好者一开始还很兴奋,直到……在一部标着 70 年代的车上看到了 Arial 字体(诞生在八十年代),一下子兴致全无,于是想到了这篇同样也已经很老的文章
最近 JJ 去了一次澳门,参观了大赛车博物馆。看到不少岁数比自己还大很多的赛车,作为一个赛车游戏爱好者一开始还很兴奋,直到……在一部标着 70 年代的车上看到了 Arial 字体(诞生在八十年代),一下子兴致全无,于是想到了这篇同样也已经很老的文章
🤣13👍1
Forwarded from Garyの梦呓
DeepScaleR-1.5B-Preview
DeepscaleR-1.5b 是在 DeepSeekR1-distilled-Qwen1.5b 上仅使用 3800 A100h(~$4500) 进行 RL 微调的 LLM
该模型在 AIME 2024 上获得了 43.1%@1 的准确性,较基底(28.8%)提高 14%,在 1.5B 参数下超过了 o1-preview
(Arena Math 中 R1>Gemini 2 Thinking>o1p>Gemini 2 Pro)
Open sourced dataset, code, training logs and models
Github: Github.com/agentica-project/deepscaler
Inference GGUF
#AI
DeepscaleR-1.5b 是在 DeepSeekR1-distilled-Qwen1.5b 上仅使用 3800 A100h(~$4500) 进行 RL 微调的 LLM
该模型在 AIME 2024 上获得了 43.1%@1 的准确性,较基底(28.8%)提高 14%,在 1.5B 参数下超过了 o1-preview
(Arena Math 中 R1>Gemini 2 Thinking>o1p>Gemini 2 Pro)
Open sourced dataset, code, training logs and models
Github: Github.com/agentica-project/deepscaler
Inference GGUF
#AI