活动回顾丨数学研讨会：强化学习，奥秘无限 :四川大学匹兹堡学院

为激发学生对数学的兴趣，打破学科界限，拓宽思维视野，四川大学匹兹堡学院同辈导师项目（Peer Advisors）推出数学研讨会系列活动。10月31日晚7:00-8:30，PA于江安校区南区S205成功举办了以“Agentic Reinforcement Learning：强化学习驱动智能体自我进化”为主题的数学研讨会，由2022级计算机科学与技术专业学生王俊桥主讲。副教授杨铮、助理教授吴英杰出席了本次活动，并在研讨过程中与王俊桥同学进行了专业交流。

在上海 AI Lab 进行实习的王俊桥同学从一个幽默的“厕所问题”出发，生动地引出了强化学习（Reinforcement Learning, RL）的核心思想——智能体通过与环境交互、不断试错以最大化奖励。随后，他带领同学们深入探讨了强化学习的数学基础，详细推导了 Bellman 方程，并通过状态价值函数和矩阵形式的可视化讲解，让复杂的理论变得直观可感。最后，他结合自己在上海 AI Lab 等机构的科研经历，鼓励同学们以“Work Hard, Play Hard”的精神探索科研之路。

在 Q&A 环节结束之后，主持人虞朝嘉对本次研讨会内容进行了总结，并预告了之后数学研讨会的方向以及未来可能邀请的嘉宾。

数学研讨会将持续以“学科融合”为核心理念开展系列活动，通过跨越数学、计算机与人工智能等领域的对话，探索知识的边界与智能的本质。本期讲座既回顾了强化学习的数学基础与算法演进，又展望了智能体时代的崭新图景。未来的每一期研讨会，都将延续这种以真实问题为导向、以学术思辨为引擎的精神，通过连接理论与实践、融合科学与工程，激发学生的创新潜能，拓宽数学的应用边界，让数学不再停留于纸上公式，而成为理解世界与塑造智能的钥匙。

我们将继续邀请来自学界与业界的优秀研究者，分享AI、数学与工程的前沿成果。

理论与教育

活动回顾丨数学研讨会：强化学习，奥秘无限