Week 03 - 03 - COMPSCI 712 L9 The Alignment Problem_slides

Week 03 - 03 - COMPSCI 712 L9 The Alignment Problem_slides视图:倍速:

第 1 / 23 页

这一页讲的是课程 COMPSCI 712 的第九讲，主题为 The Alignment Problem，即对齐问题。

第 2 / 23 页

这一页讲的是 Techno-optimism（技术乐观主义），强调人工智能的潜力。主要观点包括：AI 被视为解决问题的通用工具，以及其对人类能力的巨大扩展。

第 3 / 23 页

这一页讲的是 Techno-optimism（技术乐观主义）。主要内容包括 AI 在医疗等领域的潜力、AI 的减速可能导致生命损失，以及技术发展的伦理责任。

第 4 / 23 页

这一页讲的是人工智能风险声明，强调应将减轻 AI 导致的灭绝风险作为全球优先事项，与大规模社会风险如疫情和核战争并列。

第 5 / 23 页

这一页讲的是超级智能 (Superintelligence) 的概念及其潜在影响。主要讨论 AI 追求工具性目标时的复杂性，以及这些目标可能与人类或地球福祉的不一致性。

第 6 / 23 页

这一页讲的是 TESCREAL 这一术语及其构成，包括七种思想理念，并提到其批评者和支持者。

第 7 / 23 页

这一页讲的是TESCREAL框架中的Transhumanism和Extropianism。Transhumanism强调通过技术提升人类能力，突破生物限制；Extropianism则追求增加智能、信息和活力等特性。

第 8 / 23 页

这一页讲的是TESCREAL框架中的Transhumanism(超人类主义)及其相关理念，包括Singularitarianism(奇点主义)和Cosmism(宇宙主义)。

第 9 / 23 页

这一页讲的是 TESCREAL 中的 Rationalism（理性主义），强调理性训练的重要性。

第 10 / 23 页

这一页讲的是 TESCREAL 的理念，重点是 Effective Altruism（有效利他主义）。主要讨论如何通过关注重要问题和高效干预来最大化善举的影响。

第 11 / 23 页

这一页讲的是 TESCREAL 的概念与其中的 Effective Altruism 和 Longtermism。重点在于长远主义对未来的道德责任。

第 12 / 23 页

这一页讲的是 AI 成功的定义和目标转变。关键点包括智能的定义、机器目标与人类目标的关系，以及强调机器行为的益处。

第 13 / 23 页

这一页讲的是人类兼容人工智能的三个原则，包括机器目标、偏好不确定性和人类行为信息源。

第 14 / 23 页

这一页讲的是机器人如何找到价值观而不是简单复制人类行为。重点包括避免不良行为和理解人类生活的多样性。

第 15 / 23 页

这一页讲的是人工智能在理解和执行人类价值中的挑战。重点包括价值定义的复杂性、可能出现的误解，以及安全AI的重要性。

第 16 / 23 页

这一页讲的是逆强化学习 (Inverse reinforcement learning)，通过观察其他智能体的行为来学习价值函数，并与传统强化学习进行对比。

第 17 / 23 页

这一页讲的是协作逆强化学习 (Cooperative Inverse Reinforcement Learning)。主要内容包括人类与机器人之间的两人博弈，以及最优解的性质。

第 18 / 23 页

这一页讲的是关机问题（Off-Switch Problem）及不确定目标的重要性。重点包括：AI在确定目标下的行为，以及在不确定目标下的行为。

第 19 / 23 页

这一页讲的是人工智能发展的周期性，包括三次高潮（Boom）和两次低谷（Winter）。

第 20 / 23 页

这一页讲的是关于通用人工智能（AGI）的发展前景。重点提到 Elon Musk 预测超人类 AI 明年可能出现，以及 Bill Gates 对 GPT-5 性能提升的保守看法。

第 21 / 23 页

这一页讲的是 AGI 的发展前景及其资金需求。重点提到 OpenAI CEO Sam Altman 寻求 7 万亿美元资金开发 AI 芯片，并列举了相关经济数据对比。

第 22 / 23 页

这一页讲的是大型语言模型（LLMs）训练的风险，包括环境和经济成本、数据多样性问题、静态数据的局限性，以及编码的偏见问题。

第 23 / 23 页

这一页讲的是奥克兰大学（University of Auckland）的视觉展示，突出了文化与城市景观的结合。