第二十期讨论班海报本次讨论为第 20 期。讲者路宇轩围绕大语言模型与数学 Agent 的最新进展展开报告。报告回顾 AI 发展的关键节点(深度学习、Transformer、ChatGPT、工具调用式 Agent),介绍 Cursor、Claude Code、Codex 等编程工具的工作流思想与 Agent、Skill、MCP、Workflow 概念;在数学方向上讨论自动形式化、Lean 证明辅助、Google DeepMind 与 OpenAI 的数学推理进展,以及 QED、Rethlas 等面向数学研究的 Agent 系统;最后结合图论与组合数学中的反例搜索、图不变量计算、极值问题实验和形式化验证,讨论如何构建适合本方向的研究助手。
本次讨论班围绕大语言模型与数学 Agent 的最新进展展开。报告首先回顾 AI 发展的几个关键节点,包括深度学习、Transformer、ChatGPT 以及工具调用式 Agent 的兴起;随后介绍 Cursor、Claude Code、Codex 等新一代编程工具背后的工作流思想,并解释 Agent、Skill、MCP 与 Workflow 等概念。
在数学方向上,报告重点讨论了自动形式化、Lean 证明辅助、Google DeepMind 与 OpenAI 的数学推理进展,以及 QED、Rethlas 等面向数学研究的 Agent 系统。最后结合图论与组合数学中的反例搜索、图不变量计算、极值问题实验和形式化验证,讨论如何开始构建适合本方向的研究助手。
