你的位置:新淘彩-购彩大厅 > 新淘彩成功案例 > 新淘彩 DALL-E 2语文水平被吐槽:金子和鱼画成真金·鱼,遭受一词多义就拉胯,造作率超80%

新淘彩 DALL-E 2语文水平被吐槽:金子和鱼画成真金·鱼,遭受一词多义就拉胯,造作率超80%

新淘彩成功案例

以画画水平高妙而风靡大家的 DALL-E 2新淘彩,语文水平被质疑了。 比如 bat 这个多义词,就把它给考住了。 a bat is flying over a baseball stadium(一只蝙蝠 / 球棍从棒球场上飞过)。 恶果它画出来的

详情

以画画水平高妙而风靡大家的 DALL-E 2新淘彩,语文水平被质疑了。

比如 bat 这个多义词,就把它给考住了。

a bat is flying over a baseball stadium(一只蝙蝠 / 球棍从棒球场上飞过)。

恶果它画出来的图,蝙蝠和拍子都在天上飞。

而且这不是偶而的造作,要是输入" a person is hearing a bat ",画出来的如故蝙蝠和球棒都存在。

换成另一种情况,输入 a fish and a gold ingot(一条鱼和一个金锭)。

好嘛,径直把两种东西都铸金了,造成真金 · 鱼。

可不可低估了这些造作,因为它们意味着 DALL-E 2 在把柄文本生成图像的历程中,对说话中标识到实体的基本映射关系。

即一个词对应一个实体。

以 bat 例如,画出蝙蝠大要球棍,都算 DALL-E 2 瓦解正确,但是要是两个都给,那就有问题了。

这就好比本人是单选题,填 A 或 B 都对,但是把两个都写上就违犯了规则。

更何况有技艺它还把不同物体的修设词弄错,"上沿途题的解法用不才沿途上"。

发现这一问题的,是来自巴伊兰大学、艾伦人工商议智能所的学者们,而况衰竭写了篇论文分析。

酷爱的是,商议人员约阿夫 · 高柏(Yoav Goldberg)还提到,这种情况在 mini DALL-E 和 Stable Diffusion 中并不常见。

我猜这可能是因为所谓的逆限制征象(inverse scaling)。

肤浅瓦解即是"模子越大性能越差"。

论文具体说了啥?

几位学者在发现问题后,又反复进行了屡次历练,并把问题主要诀别为三种情况:

第一、一个单词被解释为两个不同的事物

第二、一个单词被解释为两个不共事物的修设词

第三、一个单词在被解释为一个事物的同期,又被瓦解成另一种事物的修设词

前两种情况起原如故提过。

第三种情况例如来说,输入"一匹斑马和一条街道",输出的恶果中一直都有斑马线。

在这里,DALL-E 2 把斑马同期解释了两次。

在针对这些情况都重叠历练后,作家计较出 DALL-E 2 在三种情况下,出现造作的概率都朝上 80%。

其中第二种情况的造作率最高,新淘彩成功案例达到97.2%。

第三种情况下,要是给另一个名词前加上新的修设词,不错幸免造作发生。

即输入一匹斑马和一条碎石路,路面上就莫得斑马线出现了。

而在用 DALL-E mini 和 Stable Diffusion 时,这些重叠解释的情况并不常见。

作家解释,将来不错推敲商议模子的文本编解码器来追想这些问题,而况不错商议这些问题和模子大小、框架是否联系系。

作家之一 Yoav Goldberg 是巴伊兰大学的凸起解说,亦然艾伦人工智能商议院以色列分院的商议主任。

之前,他在纽约的谷歌商议中心做博士后。商议兴致地方为 NLP 和机器学习,尤其对语法瓦解感兴致。

还曾发现 DALL-E 2 自创说话

不外就在几个月之前,一位计较机专科的博士小哥发现,给 DALL-E 2 喂一些奇怪的说话,它也能生成团结类的图像。

而这些词,恰是来自 DALL-E 2 生成图像中的。

比如输入"两个农民指摘蔬菜,带字幕(Two farmers talking about vegetables, with subtitles)"后,DALL-E 2 给出的图像中,出现了一些"乱码"的词汇。

而要是再把图像中的新词 Vicootes "作为面孔丢给模子,没预料,出来这么一堆图像:

有萝卜、有南瓜、有小柿子……难道" Vicootes "就代表蔬菜?

要是再把上图气泡中一串" Apoploe vesrreaitais "扔给 DALL-E 2,一堆鸟图出现了:

"难道说,这个单词代表‘鸟’,是以农民们似乎在指摘影响他们蔬菜的鸟类?"

其时,这位博士小哥把我方的发现发布在网罗上后,坐窝引起热议。

有人试图分析 DALL-E 2 是怎样加密说话的,还有人以为这仅仅噪声。

不外总的来说,在说话瓦解方面,DALL-E 2 总能搞出点让人出人料想的事。

你以为这背后原因到底是什么呢?新淘彩

最新内容
新淘彩 好用实用的3d音效增强器用:Boom 3D 华文激活
使用 Boom 3D 不错大幅度栽培 MacBook AIr/Pro 等成就的音质,岂论是播放音乐也曾视察电影,都给你更大书特书的体验。Boom 3D 新增了颠倒实用的音量孤苦收尾功能,不错单独调整放荡愚弄的音量,
新淘彩 “VR学车+AI素质”新模式,盘货驾考培训“科技活儿”!
导 读新淘彩 “品性驾培、精通驾培、绿色驾培”是当今北京市驾培行业的发展条理。 在便利市民学车方面,有哪些新的举措? 机器巨匠工智能教育车、VR智能驾驶培训模拟器等高技术建树是
新淘彩 150W闪充+5000万三摄,硬件规格拉满
从本年上半年的情况来看,手机市集不提议各人研究旗舰机,格外是安卓阵营这边,骁龙8Gen1和天玑9000都莫得太好的推崇,诚然领有极为强悍的性能参数,但实质体验由于发烧问题,其使用起
www.xm5688.com

官方网站

关注我们

新淘彩成功案例商贸中心1088号

联系地址

Powered by 新淘彩-购彩大厅 RSS地图 HTML地图

备案号: 冀ICP备14004484号
新淘彩-购彩大厅-新淘彩 DALL-E 2语文水平被吐槽:金子和鱼画成真金·鱼,遭受一词多义就拉胯,造作率超80%