斑马识别成狗,AI犯错的原因被斯坦福找到了丨开源

Pine 发自 凹非寺 mku搜集对生活有用的优质文章

量子位 | 公众号 QbitAI mku搜集对生活有用的优质文章

明明是只斑马,AI为什么说它是一条狗?mku搜集对生活有用的优质文章

分类模型在归类图像时有时会错误地判断类别。mku搜集对生活有用的优质文章

经过学习的AI,还会搞砸一些预测,肯定是在其中的某个环节出现了纰漏。mku搜集对生活有用的优质文章

斯坦福大学的两位博士生和教授James Zou在一篇论文中,带我们探究了分类模型犯错的原因。mku搜集对生活有用的优质文章

随后,论文提出一种方法—— 反事实的概念性解释(Conceptual Counterfactual Explanations),并评估了它的效果。 mku搜集对生活有用的优质文章

通过这种方法,我们就能重新定义模型的分类标准,从而解释AI犯错的原因。mku搜集对生活有用的优质文章

一起来看看吧。mku搜集对生活有用的优质文章

AI为什么会犯错? mku搜集对生活有用的优质文章

想要提高分类模型后续预测的准确性,就先得整明白这个模型在哪里出了岔子。mku搜集对生活有用的优质文章

一般来说,AI搞砸预测是以下原因造成的:mku搜集对生活有用的优质文章

首先是在模型实际预测的过程中,分类标准可能会与预训练时有些偏差,使得训练模型在实际预测的过程中效果不佳,进而降低预测结果的准确性。 mku搜集对生活有用的优质文章

比如说,病理学家使用预先训练好的模型来分类组织病理学图像,但效果在他的图像上却不是很好。mku搜集对生活有用的优质文章

这就可能是在他的图像中,色调与原始训练数据中不同导致的。mku搜集对生活有用的优质文章

可以看这个例子:mku搜集对生活有用的优质文章

mku搜集对生活有用的优质文章

在这个模型训练过程中,样本里所有狗的照片里都有雪,这导致该模型将雪与狗联系在一起,并错误地预测:没有雪的狗不是狗。mku搜集对生活有用的优质文章

这可能是用的数据集,都是在同一场景下收集的,会阻碍模型的泛化。mku搜集对生活有用的优质文章

除此之外,也可能是在训练模型时,人为制造的一些偏差。 mku搜集对生活有用的优质文章

例如,某一皮肤科专家利用训练好的AI来分类图像中的皮肤病,但其他同事使用的效果却不尽如人意。mku搜集对生活有用的优质文章

这可能是因为在训练的样本中,皮肤的肤色单一、且年龄段分布窄。mku搜集对生活有用的优质文章

了解了AI“犯错”的原因后,我们要怎样才能准确地判断模型哪里出现了错误呢?mku搜集对生活有用的优质文章

AI犯错,它来解释 mku搜集对生活有用的优质文章

James Zou在论文中提出了一种叫 反事实的概念性解释(CCE)的方法。 mku搜集对生活有用的优质文章

具体来说,就是通过这种方法,来探究 输入数据与预测结果之间的联系,最终找到模型的错误之处。 mku搜集对生活有用的优质文章

那CCE是怎么来解释的呢?mku搜集对生活有用的优质文章

定义概念库 mku搜集对生活有用的优质文章

首先要做的,就是设置并细化一个概念库C,即制作一个分类标准。mku搜集对生活有用的优质文章

具体来说,概念库C中的各个概念可以用来分类图像,如装置c1 (街道、雪等)、图片质量c2 (清晰、模糊等)······ mku搜集对生活有用的优质文章

这样,就能获得一组可解释的概念库C={c1,c2,…}。mku搜集对生活有用的优质文章

然后,需要给其中的每个概念找对应训练数据。mku搜集对生活有用的优质文章

具体,就是收集与其相符(Pci)和不符(Nci)的例子,一般来说数量上要一样(Pci=Nci=100)mku搜集对生活有用的优质文章

对于每个概念,CCE都要学习它们的分类方法和“思维方式”。mku搜集对生活有用的优质文章

分别通过两种方法:mku搜集对生活有用的优质文章

一个是通过学习支持向量机 (SVM),来寻找可以区分两种事物最优方式的算法 (线性分类器)mku搜集对生活有用的优质文章

另一个是学习相应的概念激活向量 (CAV),它可以用来解释图像被错误分类的具体原因。 mku搜集对生活有用的优质文章

就像下图,都是斑马的图像,归类错误的原因却不一样。mku搜集对生活有用的优质文章

mku搜集对生活有用的优质文章

这一步只需要对每个想要评估的模型做一次,之后CAV便可以用来解释任意数量的错误分类。mku搜集对生活有用的优质文章

给定错误分类标准 mku搜集对生活有用的优质文章

我们可以通过改变不同概念在模型中的比重,对其分类标准进行相应的调整,这些调整要满足以下原则:mku搜集对生活有用的优质文章

1、正确性:如果一个分类标准达到了预期的结果,那么它就被认为是正确的。mku搜集对生活有用的优质文章

2、有效性:分类标准不能违反人类的基本认知。mku搜集对生活有用的优质文章

3、稀疏性:最终目标是向用户传达模型的错误之处,太多的变量不利于有效传达信息。mku搜集对生活有用的优质文章

我们的目的是尽可能地使预测结果贴近训练结果,即最小化交叉熵损失。mku搜集对生活有用的优质文章

因此就要不断优化模型预测的标准,通过调整待修改的标准,对其进行加权,最终达到纠正错误分类的效果。mku搜集对生活有用的优质文章

了解之后,我们通过一个实际例子来看看,怎么用CCE“探测”分类模型出错的地方。mku搜集对生活有用的优质文章

mku搜集对生活有用的优质文章

然后,对这些标准进行评分,如果评分为正,则代表在图像中增加这个概念,将会提高正确分类的概率,反之亦然。mku搜集对生活有用的优质文章

在c)图中,通过CCE分析也可以直观地看到,“Polka Dots” (斑点)和“Dog” (狗)是导致模型预测错误的原因。 mku搜集对生活有用的优质文章

CCE效果怎么样? mku搜集对生活有用的优质文章

看到这里,想必大家对CCE的原理都有了初步的认识。mku搜集对生活有用的优质文章

那它判断得到底准不准确,效果究竟如何呢?mku搜集对生活有用的优质文章

CCE的目的,主要是揭示模型在训练过程中学习到的“伪相关性”,用它就可以捕获图像中出现的其他“无关要素”和图像的伪相关性。mku搜集对生活有用的优质文章

mku搜集对生活有用的优质文章

mku搜集对生活有用的优质文章

除此之外,CCE也有用在医学领域的潜力。mku搜集对生活有用的优质文章

像Abubakar Abid等人就使用CCE,在皮肤病学 (皮肤状况分类)、胸片图像中的心脏病学 (气胸分类)中都做了相关测试。 mku搜集对生活有用的优质文章

mku搜集对生活有用的优质文章

CCE使用学习到的偏差和图像质量条件来解释模型犯错,也已被专业的皮肤科医生证实——这些因素,确实很大程度上是导致皮肤图像难以分类的原因。mku搜集对生活有用的优质文章

此外,CCE的速度也很快。mku搜集对生活有用的优质文章

概念库只需要使用简单的支持向量机学习一次,每个测试示例在单个CPU上花费的时间小于 0.3smku搜集对生活有用的优质文章

重要的是,它可以很简单地应用到任何深度网络,在不需要训练数据的情况下检测到模型犯错的原因。mku搜集对生活有用的优质文章

如果你对这种方法感兴趣,想亲自试试的话,可以戳下文链接查看。mku搜集对生活有用的优质文章

作者介绍 mku搜集对生活有用的优质文章

mku搜集对生活有用的优质文章

James Zou,论文通讯作者,是斯坦福大学生物医学数据科学系的助理教授,计算机科学与电气工程系的助理教授。 mku搜集对生活有用的优质文章

于 2014 年获得哈佛大学博士学位,曾是微软研究院成员、剑桥大学盖茨学者和加州大学伯克利分校西蒙斯研究员。mku搜集对生活有用的优质文章

他的研究得到了 Sloan Fellowship、NSF CAREER Award 以及 Google、Amazon 和腾讯 AI 奖项的支持。mku搜集对生活有用的优质文章

mku搜集对生活有用的优质文章

Abubakar Abid(前)Mert Yuksekgonul(后)论文第一作者,均为斯坦福大学博士生。 mku搜集对生活有用的优质文章

参考链接:mku搜集对生活有用的优质文章

mku搜集对生活有用的优质文章

「人工智能」、「智能汽车」微信社群邀你加入!mku搜集对生活有用的优质文章

欢迎关注人工智能、智能汽车的小伙伴们加入我们,与AI从业者交流、切磋,不错过最新行业发展&技术进展。mku搜集对生活有用的优质文章

ps.加好友请务必备注您的姓名-公司-职位哦~ mku搜集对生活有用的优质文章

点这里

也许你还喜欢

图片格式转换器ico图文教程详细解

ico格式也是我们经常接触到的如桌面的图标,也有一些公司的标志等等,那么怎样把图片转换

360随身wifi2使用教程图文解说

只要你的电脑上着网,不管是台式还是笔记本,只要插上360随身wifi二代,你的手机就能接受到

打电话对方听不到我的声音图文解决

伴随着五一小长假的临近,各种音乐节等演出活动纷纷拉开了序幕。2021年,草莓音乐节计划举

怎么网页翻译成中文操作步骤图文详

现在很多人都在使用电脑,那么怎么设置英文网页变成中文呢?今天小编为大家讲讲,希望能够对

怎么root安卓手机操作步骤图文详解

使用安卓手机的用户们,对手机root并不陌生,有的朋友们为了预装一些app,或者使用一些高级

kakaotalk怎么用以及注册方法图文

kakaotalk电脑版是一个功能和国内的微信差不多的手机聊天软件,拥有windows、iPhone、An

笔记本如何设置wifi热点图文操作步

虽然很多手机支持wifi,但是不加密或者知道密码的wifi热点却寥寥无几。笔记本的无线网卡

如何查车辆违章记录图文教程最新分

生活中车辆违章很常见,但如何快速的查询自己的违章记录呢?下面就由小编带你一起共同查询

删除浏览器上保存的密码具体操作方

有时候我们会遇到一些问题,比如如何删除浏览器上保存的密码?下面就为大家介绍一下。

怎样删除浏览器具体操作方法图文介

现在给大家介绍一下怎样删除浏览器