Week 04 - 02 - COMPSCI 712 L11 Discrimination and Bias 1_slides视图:倍速:
第 1 / 34 页

这一页讲的是 COMPSCI 712 课程的第十一讲,主题为 AI 中的歧视与偏见(第一部分)。

第 2 / 34 页

这一页讲的是 ChatGPT 使用政策及案例报告。主要内容包括 AI 工具的学习支持限制,以及医学案例分析的说明。

第 3 / 34 页

这一页讲的是算法公平性中的偏差问题及相关案例研究。重点包括 Cathy O’Neil 的观点、算法偏差的影响,以及三个具体案例。

第 4 / 34 页

这一页讲的是技术系统可能带来的几种伤害类型,包括排斥性实践、误导、偏见和缺乏有效同意等问题。

第 5 / 34 页

这一页讲的是 Cathy O'Neil 关于算法的演讲内容。主要强调算法的影响和潜在偏见,以及其社会意义。

第 6 / 34 页

这一页讲的是算法设计中的决策问题,包括定义成功、选择代理指标和数据适用性的重要性。

第 7 / 34 页

这一页讲的是数据科学的决策与社会政治的关系。主要指出数据科学家在选择问题、数据和解决方案时会影响权力、地位和权利的分配,实际上是在参与政治活动。

第 8 / 34 页

这一页讲的是 Cathy O'Neil 提出的“数学毁灭性武器”概念,重点讨论模型的不透明性(Opacity)、伤害性(Damage)和规模性(Scale)。

第 9 / 34 页

这一页讲的是数据科学伦理中的偏差问题,重点包括模型对某些群体造成系统性伤害,以及训练数据不平衡导致的偏差。

第 10 / 34 页

这一页讲的是算法公平性需要区分群体,以及假设与刻板印象一致可能造成更大的伤害。

第 11 / 34 页

这一页讲的是机器学习偏差(biased ML)的后果,包括性别、种族等方面的偏见对实际应用的影响。

第 12 / 34 页

这一页讲的是通过名字预测性别的案例,数据集是不平衡的。重点是数据不平衡可能影响模型表现,以及如何处理这种情况。

第 13 / 34 页

这一页讲的是不平衡数据如何导致偏差,重点讨论机器学习可能加剧种族主义的问题。

第 14 / 34 页

这一页讲的是一个问题模型的例子,目标是根据名字预测性别,使用新西兰内政部的名字数据,通过名字的最后字母训练模型。

第 15 / 34 页

这一页讲的是新西兰不同族群人口在2001、2006和2013年的人口普查数据。主要展示了欧洲裔、毛利人、亚裔等族群的人口变化趋势。

第 16 / 34 页

这一页讲的是模型存在的一些问题,包括数据不平衡、性别识别局限性,以及缺乏多样性族群的名字数据。

第 17 / 34 页

这一页讲的是预测累犯风险(Predicting recidivism)与公平性(Fairness)的关系。重点是如何评估算法在司法领域中的公平性。

第 18 / 34 页

这一页讲的是机器学习算法中的偏见问题,尤其是预测犯罪风险的算法对黑人群体的偏见。

第 19 / 34 页

这一页讲的是预测模型的性能指标 (Performance Metrics),包括 True Positive、False Positive、False Negative 和 True Negative 的定义及应用。

第 20 / 34 页

这一页讲的是ProPublica对COMPAS算法的研究发现,重点包括算法的准确率、种族偏差问题以及误分类类型。

第 21 / 34 页

这一页讲的是 COMPAS 算法是否可以被认为是 WMD (Weapons of Math Destruction)。主要讨论了算法的不透明性、对特定群体的伤害以及其应用范围的广泛性。

第 22 / 34 页

这一页讲的是对 ProPublica 报告的批评,重点在 COMPAS 工具的公平性和预测能力。

第 23 / 34 页

这一页讲的是误报率 (false positive rates) 的差异诊断问题。主要关注算法在不同群体中的表现是否公平,以及如何识别和解决偏差。

第 24 / 34 页

这一页讲的是算法中假阳性率差异的诊断问题。重点是分析不同群体在被分类为高风险时的假阳性率差异,以及算法公平性的重要性。

第 25 / 34 页

这一页讲的是算法中假阳性率 (false positive rate) 的差异诊断问题,重点在于识别不同群体间的假阳性分布不均情况及其影响。

第 26 / 34 页

这一页讲的是预测平等 (Predictive Parity) 和错误率差异 (Error Rates Disparity) 的冲突问题。主要指出同时满足两者可能不可行,并通过示例说明种族差异对分类错误的影响。

第 27 / 34 页

这一页讲的是与犯罪预测相关的两个问题:假设的可靠性和潜在的反馈循环。讨论了逮捕数据可能不可靠,以及反馈循环可能导致更高的再犯风险。

第 28 / 34 页

这一页讲的是 ROCROI 模型中移除种族变量作为预测特征的影响。主要讨论了种族变量的负面含义、其与其他变量的高相关性,以及通过重新校准维持预测准确性的方法。

第 29 / 34 页

这一页讲的是利用面部识别预测犯罪行为的例子及其问题假设。重点在于该方法的伦理和科学争议。

第 30 / 34 页

这一页讲的是面部特征与犯罪倾向之间的关联,展示了特征均值和方差的比较。

第 31 / 34 页

这一页讲的是犯罪分类模型的评估,比较了四种算法的 AUC 值,CNN 表现最佳。

第 32 / 34 页

这一页讲的是犯罪与非犯罪人脸样本的对比。展示了两个数据集的样本图像,分别是犯罪者和非犯罪者的身份证照片。

第 33 / 34 页

这一页讲的是关于“犯罪类型”的错误假设,包括外貌与犯罪倾向的关系,以及法律系统的判断可靠性。

第 34 / 34 页

这一页讲的是奥克兰大学的视觉展示。