记录学习心得,分享技术实践Building the future of Coding Agent @ ByteDance
清华毕业,现从事 Coding Agent 开发。关注 LLM 训练系统、Agent 架构、RL 强化学习在语言模型中的应用。
信仰第一性原理,崇尚优雅代码。坚信「The Grind」——通过刻意练习积累核心竞争力。
2026-03-07
从1900年巴舍利耶的随机游走理论到DeepSeek梁文锋的AGI之路,一部关于数学、博弈与人性的探索史
2026-03-06
从算法原理到工程实践,深入解析 verl、slime、AReaL 三大工业界 LLM RL 训练框架