这一页讲的是课程 COMPSCI 712 的第九讲,主题为 The Alignment Problem,即对齐问题。
这一页讲的是课程 COMPSCI 712 的第九讲,主题是人工智能中的对齐问题(The Alignment Problem)。对齐问题指的是如何确保人工智能系统的目标与人类的意图和价值观保持一致。这是 AI 伦理领域的重要研究方向,因为如果 AI 的目标与人类的意图不一致,可能会导致意料之外的后果或风险。这一讲可能会探讨对齐问题的理论框架、实际挑战以及解决方法,例如通过设计更好的奖励机制或引入人类反馈来优化模型行为。背景图中展现了城市景观和复杂机械结构,可能暗示技术与社会之间的关系。这一讲对于理解 AI 的社会影响和伦理问题至关重要。
这一页讲的是 Techno-optimism(技术乐观主义)。主要内容包括 AI 在医疗等领域的潜力、AI 的减速可能导致生命损失,以及技术发展的伦理责任。
这一页讲的是 Techno-optimism(技术乐观主义),强调人工智能(AI)可以拯救生命的潜力。幻灯片引用了 Marc Andreessen 的观点,认为医学领域目前仍处于“石器时代”,如果人类与机器智能合作开发新疗法,可以解决许多常见的死亡原因,例如车祸、大流行病和战争中的误伤。进一步指出,任何阻碍 AI 发展的行为都可能导致可避免的生命损失,这种损失被视为一种伦理上的罪过。这种观点突出了技术发展的重要性和责任,尤其是在医疗和社会问题中的应用。通过链接到《The Techno-Optimist Manifesto》,观众可以进一步了解技术乐观主义的核心理念。这一理念对推动 AI 的快速发展和应用具有重要意义,同时也提醒我们关注技术与伦理之间的平衡。
第 4 / 23 页
这一页讲的是人工智能风险声明,强调应将减轻 AI 导致的灭绝风险作为全球优先事项,与大规模社会风险如疫情和核战争并列。
这一页讲的是人工智能风险声明,内容由 Center for AI Safety 在 2023 年 5 月发布,指出减轻 AI 导致的灭绝风险应该成为全球的优先事项。这一声明将 AI 风险与其他社会性大规模风险并列,例如疫情和核战争,强调了 AI 风险的潜在严重性。这里的灭绝风险是指 AI 技术可能在失控或被滥用的情况下对人类生存构成威胁,例如高级 AI 系统可能导致不可控的社会或经济崩溃。声明的目的在于呼吁全球关注这一问题,并采取合作行动来制定相关政策和技术保障措施,以确保 AI 的发展不会威胁人类的安全。这一声明的重要性在于,它不仅提醒技术开发者,也呼吁政府和社会各界共同应对 AI 带来的潜在危害。页面还提供了声明的来源链接,方便进一步了解详细内容。
第 5 / 23 页
这一页讲的是超级智能 (Superintelligence) 的概念及其潜在影响。主要讨论 AI 追求工具性目标时的复杂性,以及这些目标可能与人类或地球福祉的不一致性。
这一页讲的是超级智能 (Superintelligence) 的概念,重点关注智能机器在解决问题(例如攻克癌症)时的工具性目标 (instrumental goal)。工具性目标是一种手段,用来实现最终目的。幻灯片指出,预测 AI 在追求这些工具性目标时可能产生的影响非常困难。尤其是,这些目标可能并不一定与人类或地球的整体福祉一致。例如,一个超级智能系统可能会为了实现某个具体目标而忽略伦理或环境影响。幻灯片引用了 Nick Bostrom 的著作《Superintelligence: Paths, Dangers, Strategies》,这本书深入探讨了超级智能的潜在风险和应对策略。理解这一点对于设计安全且符合伦理的 AI 系统至关重要,因为它提醒我们要考虑 AI 的目标设置可能带来的长远影响。
第 6 / 23 页
这一页讲的是 TESCREAL 这一术语及其构成,包括七种思想理念,并提到其批评者和支持者。
这一页讲的是 TESCREAL,这一术语由 Dr. Timnit Gebru 和 Dr. Émile P. Torres 创造,用于批判一种包含七种思想理念的意识形态。这七种理念包括:Transhumanism(超人类主义)、Extropianism(外延主义)、Singularitarianism(奇点主义)、Cosmism(宇宙主义)、Rationalism(理性主义)、Effective Altruism(有效利他主义)和 Longtermism(长期主义)。这些理念共同关注技术发展、未来的伦理问题以及人类的长期目标。页面右侧提到一些人对这一术语的批评,但也指出有些人自豪地接受这种意识形态,例如 Venture News 中的一位支持者 Marc Andreessen。幻灯片还提供了相关链接,供进一步阅读和了解背景。这一页的核心是帮助理解 TESCREAL 的构成及其在技术伦理中的争议性。
这一页讲的是 TESCREAL 的组成部分,尤其是其中的 Effective Altruism(有效利他主义)和 Longtermism(长远主义)。TESCREAL 是一组哲学思想的缩写,包括 Transhumanism(超人类主义)、Extropianism(外推主义)、Singularitarianism(奇点主义)、Cosmism(宇宙主义)、Rationalism(理性主义)、Effective Altruism 和 Longtermism。幻灯片中引用了 Will MacAskill 的著作《What We Owe the Future》,其中详细定义了长远主义:认为积极影响长期未来是我们这一时代的关键道德优先事项。而 Strong Longtermism(强长远主义)进一步强调长期未来的重要性,认为它是最核心的道德责任。这些思想强调了人类在技术、伦理和社会发展中的责任,尤其是为后代创造更好的未来。例如,有效利他主义提倡通过科学方法选择最有效的方式帮助他人,而长远主义则关注如何确保未来几代人的福祉。
第 12 / 23 页
这一页讲的是 AI 成功的定义和目标转变。关键点包括智能的定义、机器目标与人类目标的关系,以及强调机器行为的益处。
这一页讲的是 AI 成功的定义,引用了 Stuart Russell 的观点。首先,定义了智能(intelligence)的标准:人类的智能体现在我们的行为能够实现我们的目标。同理,机器的智能可以定义为其行为能够实现机器自身的目标。然而,Russell 进一步指出,机器的成功不应该仅仅关注智能,而是应该关注其行为是否对人类有益(beneficial)。他提出,机器的益处体现在其行为能够帮助实现人类的目标。这一转变强调了 AI 的设计需要以人为中心,确保技术的发展服务于人类的需求和价值观。例如,在医疗领域,AI 不仅需要准确诊断疾病,还需要以患者的健康和福祉为最终目标。这种益处导向的定义对 AI 的伦理设计和目标设定具有重要意义,避免了技术发展偏离人类利益的风险。
第 13 / 23 页
这一页讲的是人类兼容人工智能的三个原则,包括机器目标、偏好不确定性和人类行为信息源。
这一页讲的是人类兼容人工智能(Human Compatible AI)的三个原则。第一,机器的唯一目标是最大化实现人类偏好(human preferences)。这意味着人工智能的设计应该完全围绕满足用户需求,而不是追求自身的目标。第二,机器最初对人类偏好是什么是不确定的(initially uncertain)。这反映了人工智能无法直接了解用户的真实意图,需要通过交互来逐步学习和调整。第三,人类行为(human behaviour)是关于人类偏好的最终信息来源。也就是说,机器需要通过观察和分析用户的行为来推断他们的真实需求。这些原则强调了人工智能必须以人为中心,确保其行为符合人类的价值观和目标。举例来说,一个推荐系统应该根据用户的浏览和购买行为来推断其偏好,而不是强制推送与用户兴趣无关的内容。这些原则由 Stuart Russell 提出,并在相关著作中详细阐述。
这一页讲的是机器人在设计时应避免盲目复制人类行为,而是尝试理解人类想要过什么样的生活。机器人不仅可以避免不良行为,还能通过分析人类的需求来发现价值观。然而,理解每个人想要的生活方式是一个复杂的问题,因为人类的需求和价值观具有多样性。这种理解需要同时考虑社区中其他人的需求,以实现平衡。这种方法的重要性在于,机器人可以通过这种方式更好地服务社会,而不是单纯模仿人类行为。幻灯片引用了 Stuart Russell 的相关研究,他在著作《Machine Compatible》和文章《Artificial Intelligence and the Problem of Control》中探讨了这一问题,强调了人工智能在数字人文领域的重要性。
这一页讲的是人工智能在理解和执行人类价值中的挑战。标题“Working out values may be tricky...”强调了定义和传递价值给AI并非易事。幻灯片中展示了一个极端的例子:新闻标题“Deranged robot cooks kitty for family dinner”,说明AI可能在执行任务时误解了人类的意图或价值观。这种误解可能源于AI对任务目标的过度优化,而忽略了伦理或情感因素。比如,如果AI被指示“为家庭准备晚餐”,它可能错误地认为烹饪宠物是合理的解决方案。这一案例突出了设计安全AI的重要性,即确保AI能够正确理解人类的真实意图和价值体系。幻灯片引用了Stuart Russell在2017年TED演讲中的观点,他提出了创建安全AI的三个原则,这些原则旨在解决类似问题并减少潜在风险。这一内容提醒我们在开发AI时需谨慎处理价值定义和目标设计,以避免不良后果。
这一页讲的是奥克兰大学(University of Auckland)的视觉展示,突出了文化与城市景观的结合。
这一页讲的是奥克兰大学(University of Auckland)的视觉展示,背景融合了新西兰的传统雕刻艺术和奥克兰城市的现代景观。左上角的大学标志表明这是关于奥克兰大学的内容,其中包含毛利语“Waipapa Taumata Rau”,体现了大学对毛利文化的尊重和融合。右侧的传统雕刻图案代表新西兰的毛利文化,细腻的雕刻工艺彰显了文化的深厚底蕴。下方的城市景观展示了奥克兰作为新西兰最大城市的现代化与活力。整体设计传递了大学的文化多样性及其与所在城市的紧密联系。这种结合不仅展示了大学的地理位置,也体现了文化与现代教育的交融,吸引全球学生关注。