Buffer
首页 博客 简历
← 博客

标签: LLM

2 篇文章

  • AgentBench 全景解析:LLM Agent 评估框架的深度对比与实践指南

    2026-03-07

    深入解析主流 Agent 评估框架:AgentBench、SWE-bench、WebShop、ALFWorld、VisualAgentBench。从第一性原理理解 Agent 评估的本质,掌握选型方法论。

    LLM评估框架
  • Agent RL 框架深度对比:从算法原理到工程实践

    2026-03-06

    从算法原理到工程实践,深入解析 verl、slime、AReaL 三大工业界 LLM RL 训练框架

    RLLLM

© 2026 Buffer. Built with Astro.