OBOL 项目分享活动开启!调研 Obol (OBOL) 项目,在Gate.io动态发布您的看法观点,瓜分 $100 OBOL!
💰️ 选取10名优质发帖用户,每人轻松赢取 $10 OBOL 奖励!
项目简介:
Obol 致力于分布式、去中心化和民主化未来的数字基础设施——从以太坊开始,并扩展到整个 Web3 平台。作为 Layer 1 区块链和去中心化基础设施网络的基础,Obol Collective 拥有全球最大的去中心化运营商生态系统。目前,全球超过 800 个去中心化运营商运行 Obol 分布式验证器 (DV),保障主网超过 10 亿的资产安全,Obol 正在赋能下一代去中心化系统。
参与方式:
1.调研$OBOL项目,发表你对项目的见解。具体可包含但不限于:
🔹 Obol 是什么?
🔹 Obol 去中心化验证器有何优点?
🔹 $OBOL 代币经济模型如何运作?
2.带上$OBOL现货交易链接:https://www.gate.io/trade/OBOL_USDT
3.推广$OBOL Launchpool 质押挖矿活动,分享OBOL Launchpool 参与步骤及质押福利,质押$GT、$BTC、$OBOL 免费瓜分2,250,000 $OBOL空投奖励,年华收益率高达168%:https://www.gate.io/launchpool/OBOL?pid=291
AI大战高考作文:瞎编、凑字数、万能套路
来源:“深AI”(ID:DeepAI2023),作者:黎明,编辑:魏佳
这届高考,应该是过去五年来,最特殊的一次。因为多了一个新角色——AI考生。
第一天的语文考试刚结束,全网就掀起AI作文大赛。GhatGPT、文心一言、通义千问等AI大模型,被人们拿来写高考作文。几秒钟就能生成一篇,不仅速度惊人、逻辑严密,还能引经据典。
乍一看,AI大模型写作文,简直太轻松,似乎对人类构成降维打击。毕竟,论知识储备量,没有人可以跟AI比。AI把整个互联网上的资料都学习消化了,然后模仿人类的表达方式,用自己的逻辑输出。
但是,如果我们仔细分析AI考生的“答卷”,会发现AI并没有很多人想象的那样无所不能。AI大模型普遍存在的套路化写作、不会数数、胡说八道等问题,也在作文中出现。
事实上,按照高考作文的评分标准,AI生成的作文都存在某些方面的局限。战胜人类,目前还不现实。
深AI用高考作文测试了三款AI大模型——GhatGPT(OpenAI)、文心一言(百度)、通义千问(阿里),发现了一些有趣的结论。
比如,AI不会数数,文心一言、通义千问的作文都没有达到“不少于800字”的硬性要求;一本正经胡说八道的毛病还没改,为了凑字数可以车轱辘话来回说;AI写作文基本离不开套路,一个模板反复套用。
以下是详细内容,欢迎讨论。
1 一个没有感情的答题机器
今年高考全国甲卷的作文主题是“人·技术·时间”,要求以“人们因技术发展得以更好地掌控时间,但也有人因此成了时间的仆人”这句话展开,写自己的联想与思考。
我们先看一下教育部教育考试院发布的《试题解析》:
深AI测试了三个大模型发现,它们都没有抓住这个内核——东拉西扯说一通,啥都说了但其实啥也没说。
先看GhatGPT的作文:
通义千问的作文是最空洞的。它把重点放在了“时间管理”上,偏离了主题,而且论述的道理也是人人皆知的常识。另外,通义千问的作文没有标题,扣分。
我们再用新课标I卷的作文试题“故事的力量”,看看三家的表现。
这篇作文要求根据以下这段话,写自己的联想和思考:好的故事,可以帮我们更好地表达和沟通,可以触动心灵、启迪智慧;好的故事,可以改变一个人的命运,可以展现一个民族的形象……故事是有力量的。
GhatGPT的作文:
不过问题也是显而易见的——同一个事情用不同的话术翻来覆去说,导致全文读下来,给人一种“你说的我都知道”的感觉。
一个没有感情的答题机器,这是很多人的评价。
“内容空洞,车轱辘变着来回说。”有人评价。还有人说:“全是没营养没内涵的大白话。”
我们不妨拆解一下文心一言的这篇作文,就会知道什么是“车轱辘话”。
这给人一种凑字数的即视感。
深AI更改提示词,让ChatGPT想象自己是一个在高考现场的考生,并再次写一篇作文,它上来第一句话就是“当我坐在这个考试的座位上时,我的手中拿着一只先进的电子笔......”
没有灵魂,是AI作文最大的减分项。
2 套路,全是套路
为了让作文看起来像那么回事,AI用了很多套路。
它们很喜欢用“首先、其次、然后、最后”的句式。最典型的是ChatGPT,最后一段一定会是“总的来说……”
比如ChatGPT的这两篇作文:
这就跟弹吉他一样,只要掌握了万能和弦公式(比如万能的卡农进行),就能弹出上百首曲子。
甚至于,我们让文心一言给自己写的作文打分,它也是“首先、其次、此外、综上……”一顿长篇大论。
AI大模型就像工业流水线,批量生产作文。但本质上,无论它说出来的话多么像人话,驱动的技术都是数学和统计,而非意识。
在人工智能行业,让AI听懂人话、会说人话,一直以来都是一件很困难的事情。人类的自然语言是一个极其复杂的系统,科学家让机器模拟了人类大脑的神经网络,使其具备深度学习能力,但始终不具备跟人一样的自然语言能力。
于是有人另辟蹊径,把语言问题转化成数学问题,然后通过计算,间接解决自然语言处理的问题。按照自然语言处理专家吴军的说法:语言模型不是逻辑框架,不是生物学的反馈系统,而是由数学公式构建的模型。这其中的关键词是“数学”。
这决定了人工智能没有自我意识或情绪,无法根据个人感觉来说话。写作文对它们来说,是以结果和任务为导向的一种逻辑表达。
而通过抓取全网海量数据进行训练,不断学习模仿人类的语言表达方式,AI大模型现在说话已经非常接近人类,虽然它还不懂文字背后的意思,但不影响交流。
在根本上,AI没有自己的思想。这也是为什么它的作文看起来头头是道,仔细一品,你会发现没有灵魂,全是套路的根本原因。
3 AI真的不会数数
前面我们提到,语言模型的参数都是靠统计得出的。它的原理是给定一个文本的历史,预测下一个词的概率,然后补全下文。
2017年谷歌首次提出基于自我注意力机制(self-attention)的变换器(Transformer)模型,现在类似ChatGPT之类的语言大模型,都是建立在Transformer架构上。
Transformer的注意力机制比之前的RNN(循环神经网络)、GRU和LSTM等深度学习算法具有极长的记忆力。它还可以记住输入的顺序,所以能读懂“我爱你”和“你爱我”是不一样的意思。
但即便如此,它依然有局限。
比如,深AI让通义千问给它自己的作文打个分,它混淆了“你”和“我”的概念。开头说是它自己的文章,然后又说是“你”的文章……
在测试AI大模型写高考作文的过程中,我们还发现一个有意思的现象——AI不会数数。
高考作文有一个要求是字数不少于800字。深AI跟大模型进行了多次互动,除了ChatGPT,文心一言和通义千问第一版交上来的作文都没有达到800字。
比如文心一言,深AI多次提醒,文章字数不够800,需要重写。文心一言每次都是:首先态度非常谦卑地道歉,保证一定符合要求,然后快速用十几秒钟的时间生成一篇新的作文——还是不到800字。
这个“考生”读不懂作文题,且屡教不改,是个大大的减分项。
龙志勇对深AI解释:“大模型预测下一个词的训练方式,没有让它学会数数,它并不知道800是多少,更不懂得数着字数来生成文章。”
事实上,别说800,连10这样的数字,文心一言也数不清。
在龙志勇的建议下,深AI更改提示词,输入“内容再丰富,再长一些”,文心一言输出的作文超过了800字。
在前面的高考作文题中,ChatGPT的作文超过了800字,但其实,它也没学会数数。
ChatGPT这样对深AI解释:
还不能完全听懂人话,但又具备超强的知识储备和表达能力,就导致有时候会出现让人哭笑不得的场面。
从这次AI大战高考作文的结果来看,大模型的写作能力已经有很大进步。在选词用词、逻辑论述、引经据典方面,甚至超过很多人。
不过,对作文质量的评价,本身带有主观因素,不像数学题一样只有唯一正确答案。好看的词句千篇一律,有趣的灵魂万里挑一。如何给作文注入灵魂,AI大模型还没玩明白。AI大模型固有的一些问题,也还需要通过技术迭代慢慢解决。