新闻与通知

当前位置: 网站首页 - 新闻与通知

活动回顾丨数学研讨会:强化学习,奥秘无限

发布时间: 2025年11月18日 | 查看数: 29

为激发学生对数学的兴趣,打破学科界限,拓宽思维视野,四川大学匹兹堡学院同辈导师项目(Peer Advisors)推出数学研讨会系列活动。10月31日晚7:00-8:30,PA于江安校区南区S205成功举办了以“Agentic Reinforcement Learning: 强化学习驱动智能体自我进化”为主题的数学研讨会,由2022级计算机科学与技术专业学生王俊桥主讲。副教授杨铮、助理教授吴英杰出席了本次活动,并在研讨过程中与王俊桥同学进行了专业交流。

在上海 AI Lab 进行实习的王俊桥同学从一个幽默的“厕所问题”出发,生动地引出了强化学习(Reinforcement Learning, RL)的核心思想——智能体通过与环境交互、不断试错以最大化奖励。随后,他带领同学们深入探讨了强化学习的数学基础,详细推导了 Bellman 方程,并通过状态价值函数和矩阵形式的可视化讲解,让复杂的理论变得直观可感。最后,他结合自己在上海 AI Lab 等机构的科研经历,鼓励同学们以“Work Hard, Play Hard”的精神探索科研之路。

在 Q&A 环节结束之后,主持人虞朝嘉对本次研讨会内容进行了总结,并预告了之后数学研讨会的方向以及未来可能邀请的嘉宾。

数学研讨会将持续以“学科融合”为核心理念开展系列活动,通过跨越数学、计算机与人工智能等领域的对话,探索知识的边界与智能的本质。本期讲座既回顾了强化学习的数学基础与算法演进,又展望了智能体时代的崭新图景。未来的每一期研讨会,都将延续这种以真实问题为导向、以学术思辨为引擎的精神,通过连接理论与实践、融合科学与工程,激发学生的创新潜能,拓宽数学的应用边界,让数学不再停留于纸上公式,而成为理解世界与塑造智能的钥匙。

我们将继续邀请来自学界与业界的优秀研究者,分享AI、数学与工程的前沿成果。