Week 04 - 02 - COMPSCI 712 L11 Discrimination and Bias 1_slides

Week 04 - 02 - COMPSCI 712 L11 Discrimination and Bias 1_slides视图:倍速:

第 1 / 34 页

这一页讲的是 COMPSCI 712 课程的第十一讲，主题为 AI 中的歧视与偏见（第一部分）。

第 2 / 34 页

这一页讲的是 ChatGPT 使用政策及案例报告。主要内容包括 AI 工具的学习支持限制，以及医学案例分析的说明。

第 3 / 34 页

这一页讲的是算法公平性中的偏差问题及相关案例研究。重点包括 Cathy O’Neil 的观点、算法偏差的影响，以及三个具体案例。

第 4 / 34 页

这一页讲的是技术系统可能带来的几种伤害类型，包括排斥性实践、误导、偏见和缺乏有效同意等问题。

第 5 / 34 页

这一页讲的是 Cathy O'Neil 关于算法的演讲内容。主要强调算法的影响和潜在偏见，以及其社会意义。

第 6 / 34 页

这一页讲的是算法设计中的决策问题，包括定义成功、选择代理指标和数据适用性的重要性。

第 7 / 34 页

这一页讲的是数据科学的决策与社会政治的关系。主要指出数据科学家在选择问题、数据和解决方案时会影响权力、地位和权利的分配，实际上是在参与政治活动。

第 8 / 34 页

这一页讲的是 Cathy O'Neil 提出的“数学毁灭性武器”概念，重点讨论模型的不透明性（Opacity）、伤害性（Damage）和规模性（Scale）。

第 9 / 34 页

这一页讲的是数据科学伦理中的偏差问题，重点包括模型对某些群体造成系统性伤害，以及训练数据不平衡导致的偏差。

第 10 / 34 页

这一页讲的是算法公平性需要区分群体，以及假设与刻板印象一致可能造成更大的伤害。

第 11 / 34 页

这一页讲的是机器学习偏差（biased ML）的后果，包括性别、种族等方面的偏见对实际应用的影响。

第 12 / 34 页

这一页讲的是通过名字预测性别的案例，数据集是不平衡的。重点是数据不平衡可能影响模型表现，以及如何处理这种情况。

第 13 / 34 页

这一页讲的是不平衡数据如何导致偏差，重点讨论机器学习可能加剧种族主义的问题。

第 14 / 34 页

这一页讲的是一个问题模型的例子，目标是根据名字预测性别，使用新西兰内政部的名字数据，通过名字的最后字母训练模型。

第 15 / 34 页

这一页讲的是新西兰不同族群人口在2001、2006和2013年的人口普查数据。主要展示了欧洲裔、毛利人、亚裔等族群的人口变化趋势。

第 16 / 34 页

这一页讲的是模型存在的一些问题，包括数据不平衡、性别识别局限性，以及缺乏多样性族群的名字数据。

第 17 / 34 页

这一页讲的是预测累犯风险(Predicting recidivism)与公平性(Fairness)的关系。重点是如何评估算法在司法领域中的公平性。

第 18 / 34 页

这一页讲的是机器学习算法中的偏见问题，尤其是预测犯罪风险的算法对黑人群体的偏见。

第 19 / 34 页

这一页讲的是预测模型的性能指标 (Performance Metrics)，包括 True Positive、False Positive、False Negative 和 True Negative 的定义及应用。

第 20 / 34 页

这一页讲的是ProPublica对COMPAS算法的研究发现，重点包括算法的准确率、种族偏差问题以及误分类类型。

第 21 / 34 页

这一页讲的是 COMPAS 算法是否可以被认为是 WMD (Weapons of Math Destruction)。主要讨论了算法的不透明性、对特定群体的伤害以及其应用范围的广泛性。

第 22 / 34 页

这一页讲的是对 ProPublica 报告的批评，重点在 COMPAS 工具的公平性和预测能力。

第 23 / 34 页

这一页讲的是误报率 (false positive rates) 的差异诊断问题。主要关注算法在不同群体中的表现是否公平，以及如何识别和解决偏差。

第 24 / 34 页

这一页讲的是算法中假阳性率差异的诊断问题。重点是分析不同群体在被分类为高风险时的假阳性率差异，以及算法公平性的重要性。

第 25 / 34 页

这一页讲的是算法中假阳性率 (false positive rate) 的差异诊断问题，重点在于识别不同群体间的假阳性分布不均情况及其影响。

第 26 / 34 页

这一页讲的是预测平等 (Predictive Parity) 和错误率差异 (Error Rates Disparity) 的冲突问题。主要指出同时满足两者可能不可行，并通过示例说明种族差异对分类错误的影响。

第 27 / 34 页

这一页讲的是与犯罪预测相关的两个问题：假设的可靠性和潜在的反馈循环。讨论了逮捕数据可能不可靠，以及反馈循环可能导致更高的再犯风险。

第 28 / 34 页

这一页讲的是 ROCROI 模型中移除种族变量作为预测特征的影响。主要讨论了种族变量的负面含义、其与其他变量的高相关性，以及通过重新校准维持预测准确性的方法。

第 29 / 34 页

这一页讲的是利用面部识别预测犯罪行为的例子及其问题假设。重点在于该方法的伦理和科学争议。

第 30 / 34 页

这一页讲的是面部特征与犯罪倾向之间的关联，展示了特征均值和方差的比较。

第 31 / 34 页

这一页讲的是犯罪分类模型的评估，比较了四种算法的 AUC 值，CNN 表现最佳。

第 32 / 34 页

这一页讲的是犯罪与非犯罪人脸样本的对比。展示了两个数据集的样本图像，分别是犯罪者和非犯罪者的身份证照片。

第 33 / 34 页

这一页讲的是关于“犯罪类型”的错误假设，包括外貌与犯罪倾向的关系，以及法律系统的判断可靠性。

第 34 / 34 页

这一页讲的是奥克兰大学的视觉展示。