“测验和分数不应该是门生生存的全部。除了分数,我还可以去关心窗前第一排柳芽的萌动;去欣赏天上金黄的满月,让后羿嫦娥、吴刚玉兔的传说在心中流过;去艳服的西湖边骑行,淋一点小雨,吹无数的风……但是,家长的教导又让人无法反驳:‘你知道吗,中考差一分,就是一个操场的人!’ 这,就是我的烦恼。 ” 以上这段笔墨是AI天生的,照旧人写的? 我问了7个人,有5个以为由AI天生,重要来由是“辞藻堆砌”。 AI通用模子的文本天生本领连续进阶,已经到了人无法正确辨别的水平,因此,其不妥利用大概带来的虚伪消息、学术不端举动、恶意产物评价等题目引起社会高度关注。 据公安部网络安全局官方公众号,因利用AI假造“顶流明星在澳门输了10亿”的谎言,一名夫君被处以行政拘留8日。据先容,3月10日,网民徐某强为博流量、谋取非法长处,利用软件“某书”中AI聪明生乐成能,输入热门词,制作“顶流明星被曝境外豪赌输光十亿身价引发舆论海啸”的谎言信息并在网上发布,造成谎言敏捷扩散,引发大量网民议论,诱发相干谎言、话题等频仍登上热搜热榜,严峻扰乱公共秩序。 2023年2月16日,“杭州市当局3月1号取消机动车依尾号限行”的“消息”疯传。据浙江之声报道,当天杭州某小区业主群讨论ChatGPT,一位业主开顽笑说实验用它写“杭州取消限行”的“消息”,在群里直播了用ChatGPT写作的过程,并把文章发在群里,其他业主不明就里,截图转发。 人工智能、人类智能——面临一个文本,该怎样辨别其“真伪”? 3月24日,西湖大学天然语言处置惩罚实行室的博士生鲍光胜打开实行室团队研发的AI应用步伐Fast-DetectGPT,将开头那段“我的烦恼”的笔墨输入,步伐很快给出判定效果:由AI天生的概率为19%。 它说对了,这段笔墨摘自杭州一名七年级门生的作文。 ![]() Fast-DetectGPT页面截图 文本毕竟是人脑构思的,照旧电脑天生的?大概人难以判定,但它可以或许被判定——辨别者可以是AI本身。这是研究者的思绪。 Fast-DetectGPT在开源模子GPT-Neo 2.7B上运行,无需练习即可辨认各种AI大语言通用模子天生的文本内容,对GPT3.5、GPT4天生的文本,辨认率分别到达96%、90%。与斯坦福大学2023年提出的DetectGPT相比,检测速率进步340倍,辨认错误率低落75%。客岁,以鲍光胜为第一作者、西湖大学工学院副院长张岳传授为通讯作者的相干论文在深度学习范畴顶级集会——2024国际表征学习大会上发表。 张岳2003年结业于清华大学盘算机科学专业,今后在牛津大学得到该专业硕士、博士学位,在剑桥大学从事博士后研究,现为西湖大学终身传授,重要研究天然语言处置惩罚、文本发掘、呆板学习和人工智能。鲍光胜是他的博士生,曾在微软(中国)、阿里巴巴工作多年,三年进步入西湖大学。本年,他们关于Fast-DetectGPT的私有大模子扩展Glimpse的论文已被4月将在新加坡举行的2025国际表征学习大会收录。 汹涌消息:对于AI天生的文本,现在主流的辨认方法有哪些? 张岳:重要有监视分类器法、零样天职类器法、水印法。利用监视分类器法要网络大量已知数据,包罗AI天生文本和人类创作文本,做分类学习。对练习时见过的大语言模子天生的文本,它的辨认正确率较高;但碰到未见过的模子天生的文本,辨认正确率降落。 Fast-DetectGPT、DetectGPT属于零样天职类器法,无需网络数据举行练习,重要通过AI文本的特性来“找同类”。 水印法是在天生AI文本时打上“水印”。国家互联网信息办公室、工信部、公安部、国家广电总局已发布《人工智能天生合成内容标识办法》,将于9月起实行,要求相干服务提供者对天生合成内容添加显式标识,或在天生合成内容的文件元数据中添加隐式标识,就属于此类。这种方法的正确率高,但存在标志被人为弱化乃至移除的风险。 汹涌消息:Fast-DetectGPT的工作原理是什么? 鲍光胜:简朴地说, AI更懂AI,Fast-DetectGPT“认出”了同类。 所谓“天生”文本,就是呆板通过上文来选择下文,选择依据是词汇、句式等在其学习的数据会合的利用概率,概率越大,越大概被选中——可以想象一下搜刮引擎中跳动的下拉提示框。 Fast-DetectGPT的工作基于一个条件:人类和AI通用模子在文本形成中有差别的选择。人类写文章时的选择比力多样,个体间的差别大;而差别AI通用模子间的差别不显着——由于在语料库上预练习的通用模子反映的是人类作为团体的写作举动,天生文本时也倾向于选择有更高模子概率的词汇、句式。因此,两种文本在词汇利用、句子布局、语法复杂度、语义连贯性等方面有差别,昨们提取覆盖这些区别特性的统计量“条件概率曲率”,分析它们在两类文本的分布,当被测文本的统计特性值重要落在AI天生文本的分布中,则大概率为AI天生的。 不妨如许明白:作为AI,Fast-DetectGPT面临被测文本,先在不改变原意的环境下改写,再将本身的文本与被测文本对比,假如被测文本是AI写的,相似性会比力明显。 张岳:人类的思索是因果性的——它来自于举动及其反馈、结果、互动等,而通用模子的思索方向统计性。写文章,AI的写法是学习现有数据,根据词与词之间“共现性”的概率高低等来选择下文,缺少“泛化性”,也就是将在练习数据会合所习,通过背后的因果逻辑“举一隅反三隅”,应用到别处,从而得到分布以外的泛化性。这与创造性的人类写作有很大区别。 ![]() 西湖大学工学院副院长张岳传授(右)和他的博士生鲍光胜。受访者供图 汹涌消息:那么,“阿尔法围棋”(AlphaGo)为什么能频频下出人类想不到的招数?而且2016年韩国李世石九段在番棋战中仅有的一局中盘胜是人类的“末了一胜”,那以后再也没有赢过AlphaGo? 张岳:围棋的变革近于无穷,但效果只有两种,或胜或负(和局极其偶尔),弈棋规则也很明白。在这种环境下,AI步伐的“算力”得以充实发挥,AlphaGo在练习中学习了几万份专业棋手的对弈棋谱,还举行了三万万盘自我对决。而保持高强度角逐状态的天下顶尖棋手,均匀每年的职业对局不凌驾一百盘,纵然加上练习对局、打谱,其数目也完全不在同一量级。 AlphaGo没有生理颠簸,这也是它在人机对弈中的上风之一,但写作中最难得的大概就是情绪、是“生理颠簸”。另一方面,“写得好”也没有界限,不存在止境,无法罗列。 汹涌消息:Fast-DetectGPT检测DeepSeek-v3天生文本的正确率到达89%,对DeepSeek-R1的检测正确率则较低。昨们看到,雷同R1的推理模子正成为大模子发展的新方向,Fast-DetectGPT会有什么优化和改进? 张岳:R1通过较长的推理链举行思索和规划,天生的文本内容与此前通用模子的输出分布有差别。昨们推测,这大概是R1在强化学习,探索新的推理路径时产生了分布变革,使现有检测器的工作难度增长。 现在的Fast-DetectGPT演示版利用的是开源小语言模子GPT-Neo 2.7B,说它“小”,是由于模子的参数只有27亿个。假如利用更强的模子,好比671B的满血版DeepSeek-R1,理论上辨认正确率就会更高。 技能总是双刃剑,模拟、辨别会是长期的“攻防战”。作为Fast-DetectGPT的私有大模子扩展,Glimpse可以检测26种语言的文本,并有更高的辨认正确率。总的说,AI模子天生的文本会越来越传神,但人类利用AI步伐对文本举行辨认的本领也将越来越强盛。 |