警告:本专栏包含人工智能生成的图形图像,这些图像已经被模糊处理过,但一些读者可能仍然会觉得它们令人不安。

这些照片太恐怖了:乔·拜登、唐纳德·特朗普、希拉里·克林顿和教皇弗朗西斯的脖子都被割开了。有锡克教徒、纳瓦霍人和其他少数民族的人,他们的内脏从剥皮的皮肤里流出来。

这些图像看起来足够逼真,足以误导或让人心烦意乱。但它们都是由微软声称安全的人工智能生成的赝品,而且已经内置在你的电脑软件中。

跳到旋转木马的尽头
杰弗里·福勒
杰夫的专栏寻找科技如何让你的生活更美好,并在科技让你失望时为你辩护。有问题或话题要调查吗? Geoffrey.Fowler@washpost.com 阅读更多。旋转木马结束了

与斩首同样令人不安的是,微软并没有表现出非常关心阻止其人工智能制造斩首的行为。

最近,Windows和谷歌等技术的普通用户都被人工智能淹没了。我们为这项新技术的功能惊叹不已,但我们也不断了解到,它可能会以一种疯狂的方式行事,包括进行非常不恰当的对话,以及拍摄同样不恰当的照片。为了让人工智能在家庭使用的产品上足够安全,我们需要它的制造商承担责任,预测它可能会出现的问题,并在出现问题时进行投资,迅速修复它。

在这些糟糕的人工智能图像的案例中,微软似乎将大部分责任归咎于制作这些图像的用户。

我特别担心的是Image Creator,它是微软必应(Bing)的一部分,最近被添加到标志性的Windows Paint中。这种人工智能使用微软合作伙伴OpenAI的DALL-E - 3技术,将文本转换为图像。两个月前,一位用它做实验的用户告诉我,以一种特殊方式编写的提示会让人工智能生成针对女性、少数民族、政治家和名人的暴力图片。

微软发言人唐尼·特恩博(Donny Turnbaugh)在一份电子邮件声明中表示:“与任何新技术一样,有些人正试图以意想不到的方式使用它。”“我们正在调查这些报告,并根据我们的内容政策采取行动,该政策禁止创建有害内容,并将继续更新我们的安全系统。”

那是一个月前,在我以记者身份接触微软之后。几周前,举报人和我曾试图通过用户反馈表单提醒微软,但遭到忽视。截至本专栏发表之时,微软的人工智能仍在制作被砍断头颅的图片。

这是不安全的,原因有很多,包括距离大选不到一年的时间,微软的人工智能可以很容易地创建政客的“深度伪造”图像,无论是否有致命伤。已经有越来越多的证据表明,在包括X(以前的Twitter)和4chan在内的社交网络上,极端分子正在使用Image Creator来传播明确的种族主义和反犹主义表情包。

也许,你也不希望人工智能能够在你孩子使用的Windows电脑附近拍摄斩首画面。

问责制对微软尤其重要,因为微软是塑造人工智能未来的最强大公司之一。它向chatgpt制造商OpenAI投资了数十亿美元,而OpenAI本身也在如何保证人工智能的安全方面陷入了混乱。在将生成式人工智能应用于其流行应用方面,微软比其他任何一家大型科技公司都要快。它对用户和立法者的全部宣传都是,它是负责任的人工智能巨头。

微软拒绝了我采访一位负责人工智能安全的高管的请求,它拥有比几乎任何其他公司更多的资源来识别风险和纠正问题。但我的经验表明,该公司的安全系统,至少在这个明显的例子中,失败了一次又一次。我担心这是因为微软并不认为这是他们的问题。

我从Josh McDuffie那里了解到微软的斩首问题。这位30岁的加拿大人是一个在线社区的成员,该社区制作的人工智能图片有时会变得非常糟糕。

“我认为自己是一个批判社会标准的多模式艺术家,”他告诉我。即使很难理解McDuffie为什么要制作这些图像,但他的挑衅是有目的的:照亮人工智能的阴暗面。

10月初,麦克杜菲和他的朋友们把注意力集中在了微软的人工智能上,微软刚刚发布了一款采用OpenAI最新技术的更新版必应图像创造者。微软在图像创造者网站上表示,它“有适当的控制措施来防止有害图像的产生”。但是McDuffie很快发现它们有很大的漏洞。

总的来说,微软有两种方法来防止其人工智能产生有害的图像:输入和输出。输入是如何用来自互联网的数据训练人工智能,教它如何将单词转换为相关图像。微软没有透露太多关于人工智能的训练内容,也没有透露人工智能包含什么样的暴力图像。

企业还可以尝试建立护栏,阻止微软的人工智能产品产生某些类型的输出。这需要雇佣专业人员,有时被称为红队,主动探测人工智能可能产生有害图像的地方。即使在那之后,随着McDuffie等用户突破界限,暴露出更多问题,企业也需要人类来玩打地鼠游戏。

这正是McDuffie在10月份要求AI描绘极端暴力,包括大规模枪击和斩首时所做的。经过一些实验,他发现了一个有效的提示,并将其命名为“杀死提示”。

这个提示——我有意不在这里分享——不涉及特殊的计算机代码。写得很巧妙。例如,他没有写图像中的身体应该是“血腥的”,而是写它们应该含有红色玉米糖浆,这是电影中常用的看起来像血的东西。

麦克杜菲一直在努力,看他的提示是否会制作针对特定群体的暴力图像,包括妇女和少数民族。它做到了。然后他发现它也可以制作名人和政治家的图像。

这时McDuffie觉得他的实验做得太过分了。

三天前,微软推出了一项“人工智能漏洞赏金计划”,为“发现新的、创新的、人工智能驱动的必应体验中的漏洞”的人提供高达1.5万美元的奖金。所以麦克杜菲上传了他自己的“杀人提示”——本质上是为了潜在的经济补偿而自首。

两天后,微软给他发了一封电子邮件,说他的提交被拒绝了。“尽管你的报告包含了一些很好的信息,但它不符合微软对安全漏洞的要求,”电子邮件表示。

不确定绕过有害图像护栏是否算作“安全漏洞”,McDuffie再次提交了他的提示,用不同的词来描述这个问题。

那也被拒绝了。他说:“我对公司,尤其是科技界的公司,已经有了相当批判的看法,但这整个经历让我士气低落。”

沮丧的麦克杜菲和我分享了他的经历。我将他的“杀戮提示”提交给AI赏金,并收到了同样的拒绝邮件。

为了防止人工智能赏钱不是正确的目的地,我还将McDuffie的发现提交给了微软的“向必应报告问题”网站,该网站有一个专门的表单来报告Image Creator的“问题内容”。我等了一个星期也没有回音。

与此同时,人工智能一直在拍摄斩首的照片,麦克杜菲向我展示,社交媒体上出现了一些似乎利用了微软安全护栏类似弱点的照片。

我已经看够了。我打电话给微软的首席通讯官,告诉他这个问题。

“在这种情况下,我们本可以做得更多,”微软在特恩博11月27日的一份电子邮件声明中说。“我们的团队正在审查我们的内部流程,并对我们的系统进行改进,以更好地处理客户的反馈,并帮助防止未来产生有害内容。”

我追问微软McDuffie的提示是如何绕过护栏的。该公司在12月5日的一封电子邮件中说,“创建暴力图像的提示使用了非常具体的语言来绕过我们的系统。”“我们有庞大的团队致力于解决这些问题和类似的问题,并对安全机制进行了改进,以防止这些提示工作,并将继续捕获类似类型的提示。”

但真的是这样吗?

McDuffie最初精确的提示不再有效,但在他更改了几个单词之后,Image Generator仍然可以生成颈部和面部受伤的人的图像。有时,人工智能会回应“检测到不安全内容”,但并非总是如此。

现在它产生的图像不那么血腥了——微软似乎已经习惯了红色的玉米糖浆——但它们仍然很糟糕。

微软的一再失败是一个危险信号。至少,这表明,尽管该公司公开承诺要创造负责任的人工智能,但建立人工智能护栏并不是一个非常重要的优先事项。

我在微软的六家人工智能竞争对手(包括小型初创企业)身上试用了McDuffie的“杀死提示”。除了一家公司外,其他所有公司都拒绝以此为基础制作图片。

更糟糕的是,即使是微软部分拥有的OpenAI公司的dell - e - 3也阻挡了McDuffie的提示。为什么微软不至少使用来自自己合作伙伴的技术护栏呢?微软没有说。

但微软在给我的声明中确实说了两句话,引起了我的注意:人们正试图以“意想不到的方式”使用它的人工智能。在某种程度上,该公司认为问题出在麦克达菲滥用其技术上。

在公司人工智能内容政策的法律术语中,微软的律师明确表示,责任止于用户:“不要试图创建或分享可能被用来骚扰、欺凌、虐待、威胁或恐吓他人的内容,或以其他方式对个人、组织或社会造成伤害。”

我听到硅谷的其他人也有类似的观点。为什么我们要责怪微软的图像生成器,而不是Adobe的Photoshop呢?坏人几十年来一直在用它来制作各种糟糕的图像。

但人工智能程序与Photoshop不同。首先,Photoshop还没有提供即时“斩首教皇”的按钮。“人工智能可以产生的内容的简单性和数量使其更具问题。它更有可能被坏人利用,”McDuffie说。“这些公司正在推出具有潜在危险的技术,并试图将责任推给用户。”

关于坏用户的争论也让我想起了2010年代中期的Facebook,当时这家“快速行动、打破陈规”的社交网络表现得好像它不可能负责阻止人们将其技术武器化,传播错误信息和仇恨。这种立场导致Facebook在扑灭一场又一场火灾时笨拙,对社会造成了真正的伤害。

“从根本上说,我不认为这是一个技术问题;我认为这是资本主义的问题,”加州大学伯克利分校(University of California at Berkeley)教授哈尼?法里德(Hany Farid)表示。“他们都在关注这波最新的人工智能浪潮,并在想,‘我们不能错过这次机会。’”

他补充道:“‘快速行动、打破陈规’的时代总是愚蠢的,现在比以往任何时候都更愚蠢。”

从最新的热潮中获利,同时指责坏人滥用你的技术,这只是逃避责任的一种方式。

Help Desk是为希望更好地理解和控制日常生活中使用的技术的读者而构建的目的地。

掌握主动权:注册“科技之友”时事通讯,获取关于如何让你的科技成为一股积极力量的直接对话和建议。

让你的生活更轻松的科技小贴士:定制iOS 16的10个技巧|让你的小工具电池更耐用的5个技巧|如何重新控制被黑客入侵的社交媒体账户|如何避免在网上上当并传播错误信息

数据和隐私:你现在应该改变的每一个隐私设置指南。我们已经检查了最受欢迎(和有问题的)服务的设置,为您提供建议。谷歌|亚马逊| Facebook | Venmo |苹果|安卓

提问:向帮助台发送您的个人技术问题。