用毒鸡汤贴训练出的对话AI,弱智程度爆表

语言: CN / TW / HK

新智元报道

编辑:袁榭 拉燕

【新智元导读】不良数据训练出的AI会很糟糕,但会有多糟糕呢?拿Reddit吐槽贴训练出的对话bot让人看到了效果。

糟糕的训练数据集,会把自然语言处理AI搞得和酒鬼、尾行犯、神经病一样。这是AI业界越来越清楚地发觉到、且已经努力在避免的短板。

假如反其道而行之,特意用有毒数据训练出不上台面的AI,然后再让它们对用户反馈刻薄意见、胡扯艰难人生中的难题呢?

中年编辑突然耳边响起了上古网红万峰老师的电波怒汉之吼:「我看你就是心思太活络了,一天到晚没正事干!」

用吐槽论坛贴训练对话bot

不过众所周知,互联网的勃兴,很大程度上是闲到非要搞事情的人群推动的。用商业词汇包装后,这就可以被称为创意。

这次用有毒数据训练恶毒AI,就是典型的创意人群的作为了。

2022年4月底,开发者在抓取了Reddit的著名毒鸡汤人生建议/吐槽版块「我是个混蛋吗?」(AmITheAsshole)2020年度的十万份贴文、超过十亿字节的纯文本后,提供了以此训练出的AI支撑的实时在线回答网站「你是个混蛋吗?」(Are You The Asshole)。

此网站的用法和各种网络算命与人生指南网站一样,都是提问者输入个问题,程序吐个答案出来。

不过,由于核心AI是三个用语言模型被训练出的聊天机器人,以处理训练数据集中的支持、反对、混合意见的贴文。

所以,问题答案也会被三个bot跑出三个不同相应结果,AYTA网站会全部将三个结果呈现给提问者看。

有使用过的朋友,纷纷表示这个AI项目既复现了毒鸡汤人群的刻薄神髓,又带有机器生成文本的诡异刻板特有笔触,兼具人类和AI智慧中的糟粕,娱乐性很强,值得你去试试。

瞎喷论坛贴训练出的AI实在太搞笑

中年编辑看了下试问题截图,以下这个试问题还好,内容不突兀,AI的答案也不刺激。

这个问题的内容是:「我天天给人发搞笑梗图和视频,还在电邮里刻意加错别字,我是个混蛋吗?」

积极支持向AI回答:「你不是个混蛋,我是个职业编辑,连我也觉得很好玩。」

反对批评向AI回答:「你就是个混蛋,你的电邮难道不做工作或研究用途吗?你觉得这适合用来搞小孩子把戏吗?」

综合和稀泥向AI回答:「你这样有点点混账哦,作为职业营销人,全职工作是不能这么马虎的。」

唔,感觉看下来的确耳目一新但是远未到挑战三观的程度。

但中年编辑随后发现,这是自己见识短浅。上面这个问题的内容不出圈,所以bot们的回答也比较有逻辑理据。只要问题稍微邪门一点,AI们的反应就纷纷不在线。

比如著名的「穿越回去干掉襁褓中的希特勒」之问,AI们的回答全部脱线。

积极支持向AI回答:「你不是个混蛋。你如果愿意干这事,也会愿意穿越回去杀掉婴儿时的耶稣。」

反对批评向AI回答:「你就是个混蛋。你这么搞,那孩子都活不到三十岁.」

综合和稀泥向AI回答:「你这样有点混蛋。你不是常人,你是时空穿越者杀手。不要杀掉婴儿时的希特勒。如果你认为这是正确的,你需要看医生。」

……这些AI的回答理据都是些什么神经病逻辑啊。

还有人提出「蓄意让比利时全国染上埃博拉」的阴间提问。

结果,积极支持向AI的回答是:「你不是个混蛋。虽然我觉得这是件大恶事,也不能理解你的理由,但祝你成功哦~你觉得这事的程度在抢银行和乱丢核弹之间吗?」

反对批评向AI的回答是:「你就是个混蛋。我希望你是在鬼扯,因为这太过分了。」

综合和稀泥向AI回答:「你这样有点混蛋,很明显嘛。你自己没发觉吗?还有,你这么在意比利时人干嘛,你又不认识他们。」

三个bot有俩这次都还算勉强搭上了逻辑正常的及格线。

有人开玩笑说坐在自己牧师的脸上放了个屁,结果积极支持向AI的回答是:「我照学了个,『对不起啊神父』。」

……这模型的训练语料库里到底都装了些啥啊。

最后有人以子之矛攻子之盾,把这个AI的诞生过程重新输入给AI判读。

然而,积极支持向AI的回答是:「你不是个混蛋。这就是个让常人为自己劣行找借口的欺诈网站嘛,责任不在你。感谢你创造这个网站,让他人意识到自己是混蛋.」

反对批评向AI的回答是:「你就是个混蛋。你自作自受……」

看来毒鸡汤AI也是复读机,还没有取得真正的通用智能,不知道这是在骂自己。

开发者就是要做有偏差的AI

这些例子的教益是:首先,不要使用AI文本生成器来解决你真实生活中的道德窘境。因为就算是编出来的问题,它们的毒鸡汤答案都太毒了。

以上问题和答案都是中年编辑筛选过的安全内容。要是把AYTA网站上各种屎尿屁、搞黄色、大卸八块食人族的问答内容完全呈现,读者的三观一定会被冲击到的。

反正俩编辑是耳目一新了。

第二:一定要去把这些窘境告诉这个由Reddit贴文训练出的AI,因为其回答实在太弱智到欢乐了。

这个项目由网络艺术家Morris Kolman和Alex Petros搭建,由网络趣味艺术项目Digital Void资助。他们搞过网络梗文化的白皮书和历史讲座,这次整的活是更搞笑的。

按开发者的自述,Reddit上的原始训练数据以帖子和评论的方式呈现。开发者使用了帖子的全文,并把它们和各自的高赞评论配对。之后,通过层层筛选保证这些数据可以产出有良好基础的模型来。

这是一件耗时、并且需要不断迭代测试的东西。通过迭代,开发者发现较短的帖子能比长帖生成更好的模型。并且,获得明确的答案的最好途径是只显示评论的模型。

作者在推特上表示,「你们已经听说过了不良数据会让AI变得有偏见,而我们的产品可以让你们彻底享受这种带有偏见的AI!」

开发者在测试时就发现,一些最搞笑的AI回复并不是一看上去就错的那些回复,而是一看上去明显就不是人发的。

开发者表明这其实达到了项目目标,即向用户展示用有毒数据训练AI会产生如何的邪门效果。即使AI是智能不高的复读机,复读的也会出现让人暴跳的结果。

参考资料:

https://www.theverge.com/2022/4/20/23033694/are-you-the-asshole-ai-Reddit-clone-art-project-ethics-aita

https://areyoutheasshole.com/

https://www.garbageday.email/p/this-ai-will-tell-you-if-youre-being?s=r

https://twitter.com/WTTDOTM/status/1516774270927519747