Week 03 - 03 - COMPSCI 712 L9 The Alignment Problem_slides视图:倍速:
第 1 / 23 页

这一页讲的是课程 COMPSCI 712 的第九讲,主题为 The Alignment Problem,即对齐问题。

第 2 / 23 页

这一页讲的是 Techno-optimism(技术乐观主义),强调人工智能的潜力。主要观点包括:AI 被视为解决问题的通用工具,以及其对人类能力的巨大扩展。

第 3 / 23 页

这一页讲的是 Techno-optimism(技术乐观主义)。主要内容包括 AI 在医疗等领域的潜力、AI 的减速可能导致生命损失,以及技术发展的伦理责任。

第 4 / 23 页

这一页讲的是人工智能风险声明,强调应将减轻 AI 导致的灭绝风险作为全球优先事项,与大规模社会风险如疫情和核战争并列。

第 5 / 23 页

这一页讲的是超级智能 (Superintelligence) 的概念及其潜在影响。主要讨论 AI 追求工具性目标时的复杂性,以及这些目标可能与人类或地球福祉的不一致性。

第 6 / 23 页

这一页讲的是 TESCREAL 这一术语及其构成,包括七种思想理念,并提到其批评者和支持者。

第 7 / 23 页

这一页讲的是TESCREAL框架中的Transhumanism和Extropianism。Transhumanism强调通过技术提升人类能力,突破生物限制;Extropianism则追求增加智能、信息和活力等特性。

第 8 / 23 页

这一页讲的是TESCREAL框架中的Transhumanism(超人类主义)及其相关理念,包括Singularitarianism(奇点主义)和Cosmism(宇宙主义)。

第 9 / 23 页

这一页讲的是 TESCREAL 中的 Rationalism(理性主义),强调理性训练的重要性。

第 10 / 23 页

这一页讲的是 TESCREAL 的理念,重点是 Effective Altruism(有效利他主义)。主要讨论如何通过关注重要问题和高效干预来最大化善举的影响。

第 11 / 23 页

这一页讲的是 TESCREAL 的概念与其中的 Effective Altruism 和 Longtermism。重点在于长远主义对未来的道德责任。

第 12 / 23 页

这一页讲的是 AI 成功的定义和目标转变。关键点包括智能的定义、机器目标与人类目标的关系,以及强调机器行为的益处。

第 13 / 23 页

这一页讲的是人类兼容人工智能的三个原则,包括机器目标、偏好不确定性和人类行为信息源。

第 14 / 23 页

这一页讲的是机器人如何找到价值观而不是简单复制人类行为。重点包括避免不良行为和理解人类生活的多样性。

第 15 / 23 页

这一页讲的是人工智能在理解和执行人类价值中的挑战。重点包括价值定义的复杂性、可能出现的误解,以及安全AI的重要性。

第 16 / 23 页

这一页讲的是逆强化学习 (Inverse reinforcement learning),通过观察其他智能体的行为来学习价值函数,并与传统强化学习进行对比。

第 17 / 23 页

这一页讲的是协作逆强化学习 (Cooperative Inverse Reinforcement Learning)。主要内容包括人类与机器人之间的两人博弈,以及最优解的性质。

第 18 / 23 页

这一页讲的是关机问题(Off-Switch Problem)及不确定目标的重要性。重点包括:AI在确定目标下的行为,以及在不确定目标下的行为。

第 19 / 23 页

这一页讲的是人工智能发展的周期性,包括三次高潮(Boom)和两次低谷(Winter)。

第 20 / 23 页

这一页讲的是关于通用人工智能(AGI)的发展前景。重点提到 Elon Musk 预测超人类 AI 明年可能出现,以及 Bill Gates 对 GPT-5 性能提升的保守看法。

第 21 / 23 页

这一页讲的是 AGI 的发展前景及其资金需求。重点提到 OpenAI CEO Sam Altman 寻求 7 万亿美元资金开发 AI 芯片,并列举了相关经济数据对比。

第 22 / 23 页

这一页讲的是大型语言模型(LLMs)训练的风险,包括环境和经济成本、数据多样性问题、静态数据的局限性,以及编码的偏见问题。

第 23 / 23 页

这一页讲的是奥克兰大学(University of Auckland)的视觉展示,突出了文化与城市景观的结合。