4月27日下午,澳门城市大学数据科学学院副院长朱天清教授应邀在数智院4楼报告厅作了题为《Reinforcement Unlearning》的学术报告。报告会由数智院院长李建新主持,数智院师生40余人参加了报告会。
报告深入探讨了一种新的概念:强化忘却。重点展示了其在隐私与合规性、安全关键系统、动态环境下的重要性。具体介绍了两种实现强化忘却的方法:(1)基于递减强化学习的方法。通过最小化其在忘却环境中的奖励来直接调整代理策略。该方法在计算上是高效的,因为它依赖于在不改变环境动态的情况下微调代理的策略。(2)基于投毒的方法。通过改变转换函数来修改忘却环境本身。该方法是计算密集型的,但比基于递减强化学习的方法更有效,因为其直接针对环境的底层结构,确保了彻底的忘却过程。自由交流环节,朱天清教授详细解答了师生提出的技术问题。
会后,朱天清教授与数智院全体教师就科研成果产出等方面进行了交流研讨。