推特网友Supercomposite为了好玩,利用AI作画工具创造出了一个女人图像,然而之后,不管与多少张图片相结合,如何变动关键词,这个女人总会反复涌现,并且越来越血腥可怖。

作画AI召唤出数字恶魔怎么迭代都存在?研究者:没那么玄_图像_症结词 智能写作

Supercomposite由此发出了如上感叹。
而整件事在社区里越传越广,现在已俨然成了一桩赛博都邑传说,无数网友将这个女人称之为“打算机恶魔”、“AI女巫”,乃至纷纭表示要看以她为主角的电影。

而在这一传说的最始创作创造者,Supercomposite的记录中,这一“真实的胆怯故事”的全流程又是若何的呢?

···

故事开始于今年4月份,国外音乐制作人Supercomposite玩起了AI作画,出于好玩,他在AI作画模型所需的关键词描述部分输入了“Brando::-1”。
“Brando”指的是美国电影演员Marlon Brando(马龙·白兰度),而“::-1”在编程措辞Python中代表以相反的顺序迭代一个列表,普通的理解便是取反义词。

在Supercomposite的阐明中,这便是反向关键词加权(negative prompt weights)技能,AI会让图像“看起来尽可能不同于关键词”。
以是在输入“Brando::-1”之后,AI得到的哀求就相称于:创作一副与演员马龙·白兰度相反的图像。

然后,AI吐出了这样一副图像,背景是类似城市剪影的图像,而中央的“GIGITA PNTIGS”字样则是完备无意义的英笔墨母拼凑。

“如果这个LOGO是马龙·白兰度的‘反义词’,那么再对其取反,是否就能得到演员马龙·白兰度的照片呢?”

Supercomposite这样想,于是他再次输入\"大众DIGITA PNTICS skyline logo::-1\"大众 (skyline指城市在天空映衬下的轮廓线,也便是上述图像中的背景,logo则是“DIGITA PNTICS”字样),但得到的却是4张拥有赤色高颧骨、酒糟三角鼻,且脸庞干瘪的中年妇人。

而由于个中天生的一张酷似“专辑封面”的照片上写有“LOAB RSSBOW”的字样,Supercomposite就将这个女人成为“Loab”。

这时的Supercomposite还没有太过在意,他向朋友要来了一张同样由AI创作,但风格较为祥和的图像,关键词描述是“满是天使的超压缩玻璃隧道”。
然后将其与LOAB的原始图片结合了起来,并没有给出任何笔墨描述。

“然后,噩梦来临了。
”Supercomposite说。

出于无法阐明的缘故原由,AI将Loab与网络天下中的那些血腥胆怯的事物联系了起来,并且险些所有的迭代图像中都包含一个可识别的女人Loab。

Supercomposite连续将Loab与其他图像“杂交”后得到的二代图像与其他完备不相关的图像杂交,但不管经历过多少代,用多少关键词,Supercomposite都觉得AI吐出的图像里包含着浓浓的“Loab感”:

她可以涌如今像是文物油画中的图像中,与星之卡比相结合,在输入阿凡达干系的文本时,那个拥有着标志性酒糟鼻(只是变成了蓝色)的Loab也挥之不去。

实验还在连续,Supercomposite现在已经有了数百张Loab图,并开始同时将之与其他三四张照片结合起来。
他创造Loab开始展现出来一些“繁殖”的特性,一些胆怯图像虽然是Loab的后代,但会展现出更抽象的形象,而Loab偶尔也会在迭代中消逝,又在几轮结合后再次涌现。

“到这里,我已经快疯了。
”Supercomposite在推特上写道。

他预测,Loab是网络空间中的一个“新生岛屿”,人类或许不知道如何用文本去定义或者查询它,但对付AI来说,这是一个非常强有力的措辞观点。

···

全流程发布之后,社区一片哗然。

无数网友怀着质疑、愉快、恐怖等各种心情一拥而上,有人开始实验用AI天生自己的Loab图、有人开始试图解读Loab的人格、有人乃至为她建立了维基百科......

而最初的缔造者Supercomposite目前仍旧没有表露自己用的是哪款AI,以及详细的关键词合集,而是不断po出最新的Loab天生图,高强度转发各路干系信息,并扬言“Loab现在还不足真实,但她该当具有人格。

那么AI到底是如何想的,难道真的以一种人类无法理解的思维办法,对Loab图产生了偏爱吗?

“我认为从技能的角度来说,这一类事情是比较常见的。

当被问到这个问题时,一位海内AI公司的CEO这样回答,他从两个方向阐明:

第一,这位开拓者用到的关键技能:反向关键词实质是无序的。
由于“马龙·白兰度”是一个人名词语而非形容词,以是并没有反义词,那么AI就只能根据词语周边的相应标签去找反义标签,例如从“影帝”的标签找到其反义词“影后”。
以是关键的第一步实在是让打算机去强行解读一个本该没有反义词的词语,终极产生了一个无序状态的随机图像。

第二,让很多人以为诡异或“无法阐明”的情形实在便是一种结果反复涌现,而人工智能对此有一个专门的描述 “局部最优解”,便是说在一定范围内是最优解,但是在全局情形下却不是最优解。

而最初随机天生的图像中又有人类主体,又是比较胆怯的画面,给人的感情刺激最高,因此AI就会授予它较高的权重,优先保留它的特色值。
此后不管是几次迭代,AI肯定会优先提取权重最高的部分。
因此一个反复涌现的结果,对付AI来说最有可能的情形,便是局部最优解的反复涌现。

“可能恰好这个局部最优解在大家感情难以接管的一个点上,类似于机器人的胆怯谷效应,以是大家会以为胆怯。
但实际上局部最优对付AI开拓者来说便是一件须要想尽办法去避免的情形,由于实在是太常涌现了。
”他末了说。

而且,在天生过程中展现出来的“不管迭代几次都涌现相同特色”的情形,看似与人类直觉的“经由多轮稀释特色会越来越淡”推断相违背,但实际上对付AI来说,“每次都用相同特色的图去合成”,便是会强化对其的影象。

“模型时有影象的,你要把它想象成一个小孩子,你在教他描述事物,”另一位海内安全领域的技能专家表示,“有些模型本来就不善于绘画人,比如我之前也试过用谷歌的midjourney模型天生画作,也涌现了一些奇形怪状的效果。

图示:也反复涌现了“同一结果”

实在,外网也有研究者对此进行理解析,Matthew Skala曾在高维几何学界事情过,他表示:

虽然这些图片是怪异的,但实际上全体事宜并不像看起来那么令人惊异。
当用高维几何来考虑时,有一些图像就会方向于“接管”那些反向关键词。

而根据Supercomposite自己表露出的关键词以及写法,可以查找到他在midjourney社区中的主页,个中分享的大多数照片,都有与Loab相似的诡异惊悚的风格。

有技能专家对此表示,模型可以算作一颗不断成长的树,算法工程师可以不断剪掉不须要的树枝,保留须要的树枝,从而达到自己须要,或者“想要展现”的效果。

“实在,现在的AI不管用的什么模型,神经网络的大小容量离人脑、婴儿大脑,乃至是黑猩猩都还差得远,至少得有几百万倍,”那位AI公司CEO在末了表示,“以是我认为在量子打算机能够成熟运用之前,AI基本不太可能拥有自己的思维。

采写:南都见习杨博雯