您的位置:首页 >资讯 > IT >

AI检测AI:“矛”更利还是“盾”更坚

2024-08-19 10:53:18    来源:科技日报

近年来,人工智能(AI)技术推动生产力快速发展,但同时也因技术滥用导致各种问题。

为监督AI技术使用,如今市面上不乏各类用于检测AI生成内容(AIGC)的工具,如普林斯顿大学学生开发的GPTZero、斯坦福大学研究团队推出的DetectGPT等。我国一些研究团队也陆续发布各类检测工具,如西湖大学文本智能实验室研发的Fast-DetectGPT。

人类的创作与AIGC之间存在哪些差异?AI检测工具如何根据差异进行识别?AI检测工具如何应对越来越聪明的大模型?带着这些问题,记者采访了有关专家。

AI创作套路化明显

“虽然大模型在不断发展迭代,但到目前为止,AIGC与人类的创作在用词用语、逻辑语法等方面依旧存在明显区别。”Fast-DetectGPT研发者之一、西湖大学文本智能实验室博士生鲍光胜说。

在用词用语上,AIGC有相对固定的偏好。“不难发现,一些词语会反复在语段中出现。”鲍光胜举例说,有研究发现,大模型应用于英语学术论文写作时,“delve”(深入研究)一词的使用频率大大提高,这是因为大模型习惯用这个词对语句进行润色修改。

在逻辑语法上,AIGC惯常使用的一些语法搭配方式,在人类创作中可能并不常见。“受模型建模的影响,AIGC有相对固定的行文逻辑和表述模式,且这些模式会不断地被重复。人类在行文上则更为灵活,没有固定套路。”鲍光胜说。

北京大学信息管理系师生比较了AI生成与学者撰写的中文论文摘要。研究结果同样显示,AI生成的摘要具有较高同质性和较强写作逻辑性,并惯用归纳总结等学术话语体系;学者撰写的摘要则具有显著个性化差异,使用凸显实际含义的搭配较多,并常用与国家政策密切相关的词语。

哈尔滨工业大学一名研究生向记者讲述了他使用大模型的实际感受:“当我给大模型提供一些材料让它扩写,它每次都用相同的套路——把给定的材料拆解开,分为若干点论述。总体来说感觉它写得比较‘僵’。”

AIGC相对套路化的创作,可能会影响人类的用语习惯。“随着越来越多人用AI创作或润色文字,人类会受到潜移默化的影响,这或将影响整个社会对语言的使用。”鲍光胜说。

三种路径识别文本

如何准确识别AI生成内容?鲍光胜介绍,目前主要有三种技术路径进行检测,分别是模型训练分类器法(也被称为监督分类器法)、零样本分类器法、文本水印法。“三种检测方法本质上都是利用AI检测AI,且各有优劣。”鲍光胜说。

模型训练分类器法,首先要收集大量人类创作内容与AIGC,然后以此为基础训练一个能区分两类内容的分类器。“这是目前被广泛使用的一种方法,但缺点较为明显。”鲍光胜解释,用于训练分类器的数据有限,很难覆盖所有类型和语言的文本。分类器在训练数据覆盖的文本领域或语言上检测准确率较高,反之准确率则较低。而且,模型训练往往需要较高成本,数据规模越大,训练成本越高。

相比之下,零样本分类器法不需要对机器进行训练,也无需收集数据。它利用已训练好的大模型,抽取语言模型生成文本的特征,据此来区别人类与机器。“似然函数是零样本检测法中比较常用的基准之一,它可以简单理解为一段文本在某个模型的建模分布中出现的概率。概率是一种特征,不同的概率体现了人类创作内容与AIGC的差异。”鲍光胜进一步解释,“零样本分类通过综合考虑多种函数特征来区分人类创作内容与AIGC。”

如今,很多大语言模型几乎覆盖了互联网上的全部数据。因此,相比于模型训练分类器,零样本分类器在不同领域、不同语言的文本上表现较为一致。

不过,零样本分类器也存在明显缺点。一方面,现有零样本分类器依赖生成文本的源语言模型进行检测,这意味着如果是未知源模型生成的文本,分类器就无法准确检测。另一方面,为提高检测准确率,零样本分类器往往需要多次调用模型,这增加了模型的使用成本和计算时间。

“文本水印法则是一类‘主动方法’。区别于前两类方法,它不是检测已生成的文本,而是在AI生成文本时加入水印。人类虽然看不出这些水印,但却能通过技术手段检测出来。”鲍光胜说,文本水印法的准确率较高,但缺点在于水印可能被人为弱化甚至移除。此外,对于无法访问模型内部结构的大语言模型,技术人员可能无法在生成内容时成功加入水印。

检测技术需不断改进

“未来,我们要不断更新、完善现有技术,力争实现快速、准确、低成本检测,在大模型这把‘矛’越来越锋利的同时,让检测技术这面‘盾’更为坚固。”鲍光胜说。

记者了解到,为提升检测准确性,目前市面上的商用AI检测软件大多融合了多种技术手段。国内外研究团队也在进一步完善相关技术。

例如,西湖大学文本智能实验室团队在DetectGPT基础上研发的Fast-DetectGPT模型,可提升AI检测准确性,缩短检测时间。“Fast-DetectGPT与其他零样本分类器原理一致。其中一个创新点在于,我们提出通过条件概率曲率指标进行检测。”鲍光胜说,“与DetectGPT相比,Fast-DetectGPT在速度上提升340倍,在检测准确率上相对提升约75%。”

对AI检测AI的前景,有两种截然不同的观点。一种观点认为,未来AIGC将会与人类创作极为相似,以至于检测工具无法判别。还有一种观点认为,随着技术发展,检测技术或将赶超大模型技术,实现对AIGC的有效识别。

“目前,无论是AI生成的文字、图片还是视频,都在技术可识别的范畴之内。相较于文字,图片和视频甚至可以直接被专业人士肉眼识别。期待未来通过大模型技术的不断进步,推动检测技术发展。”鲍光胜说。( 吴叶凡)

标签:

相关阅读

精彩放送

我国科研人员发现:星系中心黑洞“越胖”,星系“老得越快”

浙江金华:以“智改数转”推动企业高质量发展

香港将积极布局未来创科产业

专家建议加快加工、饲用高粱选育开发

海信集团发布2023年度ESG报告 绿色技术推动产业数字化和低碳转型

培育壮大数字消费新场景

植物性状变化对湿地碳汇功能的调控作用发现

我国科学家发明新型“热发射极”晶体管

向上的中国·绿潮奔涌|万顷绿海锁黄沙

焦点访谈:守护好“无价之宝”

透视7月中国经济“成绩单”:新产品、新产业激活新动能

何以中国 行走河南丨一眼千年!洛阳到底有多少“国家宝藏”

何以中国 行走河南丨“豫”见中原文化 看文化大省何以底气十足

打击整治涉体育领域“饭圈”违法犯罪,公安机关出手

7月经济总体延续回升向好态势

加快经济社会发展全面绿色转型——来自2024年全国生态日主场活动的观察

出海“闯世界”!这里的外贸企业正乘风远航

这些大事件,铭刻生态文明建设壮阔历程

中央精神文明建设办公室等五部门联合发布2024年全国“新时代好少年”先进事迹

台湾花莲县海域发生6.1级地震 震源深度16千米

公安部公布4起打击整治涉体育领域“饭圈”违法犯罪典型案例

担负起新的文化使命,建设中华民族现代文明

“共建‘一带一路’助力共建国家现代化发展”

【东盟专线】东盟官员赞赏中国绿色发展成就 冀加强合作

(铸牢共同体 中华一家亲)“医”路守护13年 宁南百姓家门口看病不用愁

【最是新疆看不够】土耳其媒体人在喀什见证民族团结、宗教和睦

洋洋大观 | 美国博主恋上中国乡村:100元日照大集美食挑战

江南华南分散性强降雨天气持续 北方又将有降雨过程

武汉举行2024全国生态日宣传活动

第十二届海峡青年节·两岸青年营地联欢活动在福州举办

第十二届海峡青年节峰会在福建福州举办

南航境外首例婴儿担架运输顺利完成

【有理有句·生态文明】“守好一库碧水”是奉献,更是使命

格尔木庆海西州70周年暨大学生玉珠峰登山培训圆满闭幕

艾索洛Eversolo数播产品荣获EISA 2024-2025欧洲影音大奖 “音乐流媒体数播年度最佳产品”奖项

河南牧润智能装备有限公司为饲料生产插上科技翅膀

赖廷阶书法屡次荣登世界影响力艺术舞台 开创文化使者国际新时代

已投2.6万亿元!中国城市更新加速度

江西分宜:小螺蛳“嗦”出大产业 激发地方文旅新活力

何以中国·寻根辽宁丨红山文化:中华文明的古老源头

高质量发展调研行丨“低值”垃圾拉满新价值 厦门如何做到?

创新点串珠成链 产业化向绿而行——江苏省常州市以新能源产业发展引领绿色低碳转型

声动中国丨与自然共生,同万物相融

全国生态日|七里海和它的伙伴们

全国生态日 | 中国湿地,连接世界

可可西里巡山日记|无人区生存挑战

【邂逅中国 爱上中国】法国留学生陆小万:从荒漠到林海,聆听绿水青山的回响

大脑推理神经过程首次阐明

硅光子芯片让“量子罗盘”更小更精确

超冷原子传感技术成功检测太空环境变化

顶尖运动员脑中的六大“秘密武器”

磁共振成像可预测心力衰竭风险

为什么人类喜欢水

抗炎饮食或能降低患痴呆症几率

江苏校企携手推动粮食流通与现代服务深度融合

柔性材料“下一站”:更多功能 更强智能

柔性材料“下一站”:更多功能 更强智能

两极冰盖不对称演化 对全球气候影响重大

科研人员发现一脉冲星处于罕见双中子星系统

纳米孔可提升金属强度

揭开青藏高原地气相互作用的“面纱”

新型催化剂使葡萄糖高效产果糖

肇庆高新区:新能源智能汽车“一路疾驰”

节能降碳 变废为宝

科研人员发现 一脉冲星处于罕见双中子星系统

国泰航空发布中期业绩:加码千亿投资 以品质服务创造长期价值

大脑推理神经过程首次阐明

揭开青藏高原地气相互作用的“面纱”

湖北发布低空经济“16条”

激活数据要素 推动新质生产力发展

“看电视难”究竟砸了谁的锅?

中国科技元素 闪耀巴黎奥运

3D打印技术催动高质量数实融合

防范人工智能风险要有安全阀

中国家电缘何全球“圈粉”

锚定现代化 改革再深化|“智造力”释放新质生产力

何以中国 行走河南 | 钢卷尺之城——世界最“卷”的地方

23.25℃,这是我国避暑消夏好去处的平均温度

代人转账竟是诈骗一环!警惕电诈套路新花样

何以中国 行走河南丨唐三彩走出博物馆

前7个月全国网上零售额同比增长9.5%

7月份规上工业原煤、原油、天然气、电力生产平稳增长

联合国专家:中国要适应增长更缓但更均衡的新阶段

国家统计局:7月份国民经济运行总体平稳、稳中有进

豪情满怀,荒原化作林海 二次创业,续写绿色奇迹

怎么运动更健康?10招教你科学健身→

快被晒焦的沙滩宝贝,「美黑+养生」一步到位

​看了这篇才知道,原来粉色这么好搭!

上新|| 从现在可以一直穿到深秋的衬衫、裙子,给大家准备好了!

玩闲鱼必备神器,现在可直接用丰巢发货啦!

连皱纹白发也为她增色,这位50+美人靠穿搭征服全网

女人裙子不要越买越多,还是这3种“裙子”受欢迎,高级优雅

贵气女人怎么穿?质感是高级的关键,展现出不刻意的松弛之美

银川市“来宁夏 畅饮一夏”葡萄酒 畅饮季正式启动

入秋第一件单品 时髦“梭织”真香

商务风走不下去了?中国利郎转战高尔夫市场

咦?你的墨镜“怪”好看的!

北京三里屯太古里们,“躺着赚钱”的时代已经过去

广州国际汽车零部件及售后市场展将于8月28拉开帷幕

重组、裁员、减产?通用中国:长期发展承诺不变

如何“激活”房车市场?

动力电池产业“三高”趋势明显

【回车键】到海外淘金吧

北美汽车工厂告急:产能利用率将不足三分之二

Stellantis中国区人事调整

英国7月汽车销量14.75万辆,同比微增2.5%

印度企业Ola Electric上市,市值48亿美元

半年出新款,老车主怒了!极氪怎么了?