您的位置:首页 >资讯 > 科技 >

DeepSeek成功的底层逻辑及产业影响

2025-02-19 14:32:17    来源:新华网

来源标题:DeepSeek成功的底层逻辑及产业影响

仿佛是一夜之间,DeepSeek迎来了“滔天的流量”。它不仅在全球引发了新一轮的AI应用热潮,而且给全球的算力资本市场带来了重大冲击。究其原因,DeepSeek不仅在训练成本及使用成本、模型训练及优化方式等领域实现了大量的工程创新,而且打破了AI领域许多的传统叙事逻辑。简而言之,DeepSeek正在改变游戏规则。

DeepSeek最新推理模型R1的横空出世,带来了一个非常大的惊喜,仅用6天就发展了1亿用户。“用好奇心来揭开AGI的神秘面纱”这一愿景,更增添了神秘色彩。那么,DeepSeek在技术上究竟有哪些创新,成功的背后有哪些深层次的原因?这一切将对中美下一个十年的科技竞争产生哪些影响?

工程创新

成就与众不同

DeepSeek不仅引发了全球新一轮的AI应用热潮,而且对全球的算力资本市场产生重大冲击。究其原因,DeepSeek在训练成本及使用成本、模型训练及优化方式方面均实现了大量工程创新。

成本是最大的亮点。DeepSeek-R1的整体训练成本比OpenAI少了一个数量级以上。R1在整个训练过程中的工程优化和创新亮点非常多,包括“Multi-Head Latent Attention——多头隐形注意力机制”“Multi-token predication——多token预测”“有选择性地使用8个浮点数精度FP8来替代FP16甚至FP31”等。这些优化其实都不容易实现。每一个看似不显著的优化,在层级叠加效应下却产生了非常惊人的效果。

DeepSeek其实一共发布了两个模型,分别是R1和R1-zero。DeepSeek基于V3这个基础模型聚焦强化学习获得了R1-zero。但是,R1-zero在回答一些问题的时候容易产生包括“多语言混杂”在内的诸多问题。Deep-Seek又对这个模型进行了SFT(监督微调优化),从而产生了R1。R1的强化学习功能可以实现自动化,是比较容易去scale的。这样一来,该模型未来的想象空间接近无限。

颠覆性改变

打破传统叙事逻辑

DeepSeek之所以备受关注,本质在于打破了很多AI领域的传统叙事逻辑,例如OpenAI对于推理模型的算力堆叠霸权逻辑、AI应用圈的OpenAI寡头垄断格局逻辑、美国对中国的高制程芯片封锁逻辑以及AI大模型的开源闭源逻辑……

首先,AI圈公认这种推理模型的实现难度是极大的。此前,比较好的推理模型只有OpenAI的GPT o1。Anthropic做不出来,Google“卡”了很久才推出表现一般的Germini 2.0。DeepSeek-R1至少是o1的平替,甚至部分能力还要强于o1。进一步来看,R1不仅免费还开源,训练成本和使用成本均实现了指数级下降。原先o1凭借领先性可以“收割”相当长一段时间的价值,但DeepSeek-R1的出现以及开源的举措,让绝大多数开发者以及聚焦应用的创业公司都能够以更低的门槛去做开发。更加便宜且更容易私有化部署的R1,击碎了华尔街对于所有大模型公司的估值逻辑。

其次,DeepSeek的出现打破了AI应用圈原有的竞争枷锁。就算是美国的顶尖应用公司选择DeepSeek和ChatGPT时,答案也很清楚。Cursor、Perplexity这些AI领域的超级明星应用,都第一时间进行了DeepSeek模型的部署,而且设置了推荐第一优先级。此外,Google、Amazon、NV等平台也都部署了Deep-Seek模型。这些改变,同步影响了云服务的市场格局。国内大量从事应用开发的企业,在DeepSeek-R1出现之前不得不使用微软云(为了便捷使用GPT-4的API);现在,使用阿里云上部署的Deep-Seek成为可选项。

再其次,DeepSeek带来了芯片封锁逻辑的崩塌。DeepSeek在辉达CUDA生态的更底层(例如PTX层),通过微调底层代码来优化性能,从而解决“连接通信能力和调度能力被阉割”的问题。专家普遍认为,目前中美AI大模型领域的技术差距约为4个月。从技术能力发展的趋势来看,这一差距继续缩小的概率大于扩大的概率。

最后,开源让DeepSeek在舆论战中至少“不落下风”。在AGI的道路上做出最强大的模型并开源,应该是OpenAI最早的初心和使命。市场永远不会说谎,谁的模型能力强谁就能掌握最终的话语权。2024年12月DeepSeek V3发布的时候,国际主流媒体主要关注其“成本低廉”;当Deep-Seek-R1发布时,情况则截然不同,因为“滔天的流量”来了。作为一个开源模型,DeepSeek让所有用户在任何领域都增加了一个“顶尖专家”,免费且24小时随时在线。

标签:

相关阅读

精彩放送

江苏苏州:“以智为用”推动产业高质量发展

从“替代人”到“助力人” 人形机器人或迎“量产元年”

微信测试接入DeepSeek生态圈持续扩大

拥抱人工智能变革新机遇

我国科学家创制“精准治疗”技术助锂电池“起死回生”

敲除这两个基因 作物将更好抵御寄生植物

三星Galaxy S25系列品鉴会在北京举行

国家公共数据资源登记平台即将上线试运行

AI大模型真的能让基金业绩更好?

中国登月服和载人月球车名称确定

我学者找到合成“超级钻石”新途径

极致性能背后的算力逻辑:DeepSeek如何重构AI研发的底层叙事

中国人工智能在巴黎人工智能行动峰会受热议

陆地微纳塑料的生态效应研究取得新成果

科技手段拓宽龙门山生态监测覆盖面

春节档电影中国视觉特效技术引发关注——国产电影很炫很震撼

打破“无坝不裂”的魔咒

AI助手“小科”在线解答科研人员难题

国际团队检测到迄今最高能中微子

我国学者找到合成“超级钻石”新途径

超导量子比特实现全光学读取

干细胞疗法或将翻开新篇章

新法高效回收钙钛矿太阳能电池

超薄太赫兹电磁波吸收器面世

“分子开关”能让细胞由癌变恢复正常

市场应用前景广阔 手术机器人技术加速拓展医疗边界

传统外贸加速拥抱跨境电商 助力经济结构优化升级

申城AI基础设施企业:让“满血版”DeepSeek更适配好用

三星Galaxy S25系列手机在中国正式发布

DeepSeek“出圈”有望加速AI普及

中国人工智能在巴黎人工智能行动峰会受热议

高盛:DeepSeek催化资产重估 外资加速抢购中国股票

AI声音滥用现象调查:你的声音被谁“偷”走了?

40岁左右优雅女人必看,这三大搭配秘籍,轻松解锁时尚魅力

冬季穿搭如何摆脱路人感?穿衣不显胖、搭配不老气,耐看舒适

冰雪经济热度高 创新驱动装备产业持续升级

业绩再现高增长 跨国美妆巨头另辟蹊径

北京高校团队解密亚冬会颁奖礼服“瑞雪报捷” 有温度也有风度

复古潮点燃正装腕表

含金量难测 “金包银”成消费陷阱

金价上涨至历史新高 预计全年整体涨幅小于去年

打造完整“谷子经济”产业链

始祖鸟多番人事变动聚焦“商鸟”,新任高管曾在耐克、露露乐蒙等品牌任职

猛士闹元宵,东风猛士917《蛟龙行动》主题展亮相北京汽车博物馆

人车对话更快更主动:中国车企迎来“DeepSeek时刻”

奇瑞开启“三个元年”,上市为2025首要任务

国家发展改革委:消费品以旧换新行动有效激发消费活力

1月汽车消费指数为61.1

上汽火速携手华为 “尚界”将有何不同?

入门即高配,开卷“价值战”,全新BMW X3长轴距版即将上市

自主品牌替代效应明显 汽车进口量连续四年负增长

从春运充电这“桩”事看补能基础设施体系变化

车企抢流量,新项目落地忙 新能源车在蛇年如何挖深护城河

高薪“抢”人渐热 AI应用新赛道催生人才新需求

人工智能带火港股 基金经理配置紧追风口

从春运充电这“桩”事看补能基础设施变化

南北冰雪同热 产业消费共兴

退钱啦,3月底截止!个税手续费退付流程请收好

粮食大省应全力打造产业新高地

核心城市房地产市场活跃度提升

春节楼市成交平稳 一线城市示范效应明显

一月我国期货市场成交增长 大宗商品整体偏强

2025年机电产品出口将继续保持韧性

AI播报“0失误”引关注 高校师生热议播音专业如何应对新挑战

航拍甘肃万人拔河 绳长1808米重16吨

《哪吒2》原来藏着这么多文化密码

黄金饰品克单价超880元 金店银行促销花样多消费火

“还能装”“努力塞”,交警提醒:返程“满载而归”或存安全隐患

赶作业用AI 学生乐家长忧

一根铁杆大葱 带富一方百姓

文化中国行丨明月高悬、彩灯万盏 看元宵夜里的诗意中国

经济政策一线微观察|文旅市场“开门红”后热度持续

文化中国行·古画里的中国丨看看老祖宗怎么“闹”元宵

2024年全国社会物流总额突破360万亿元

文化中国行·焦点访谈丨“中国年”→“世界年” 全球共庆申遗成功后首个春节

春运满月 全社会跨区域人员流动量预计超70亿人次

从“新春第一会”透视各地高质量发展三大新趋势

(新春走基层)新疆大漠护林人:为野生动植物撑起绿色希望

为全年经济开好局起好步——各地力争首季“开门红”

时光相册|我们的春节·张灯结彩庆元宵!

新春走基层丨邓城人的油条擂台赛

花灯如昼闹上元——台湾各地元宵节扫描

贵州非遗香港闹元宵

主播说联播丨银发列车,点亮金色机遇

冰雪奇缘交织东方文韵(冰城观澜)

国产动画何以迎来“沸腾时刻”(新语)

借亚冬会东风扩容冰雪经济

新春走基层|元宵节,林海深处收到“月的消息”

新春走基层|百年龙灯蜕变记

(哈尔滨亚冬会)“中国红”与“冰雪白”再相遇 亚冬会释放冰雪旅游“热动能”

中国与世界共享“冰雪机遇”(环球热点)

洋洋大观|薪火长相传,天涯共此“狮”

“中国是一个非常多元、令人着迷的国度”(外国游客感受“中国之美”)

一加手机春节期间全行业销量增幅第一,一加 Ace 5 Pro 成销量增幅冠军

孔达达:宁海十四夜 山海之间的文化焰火

泰康在线:深耕社会责任田,为人民美好生活筑起坚实防线

纽莱伊美坚持科学淡班,2024年再攀高峰,荣誉奖项成果斐然

秉持长期主义 银行理财进阶“耐心资本”

信银理财践行“五篇大文章”成果排名全行业第一

临沂商城控股集团联合深度数科集团 召开服务商城创新发展调研交流会

第一届CBA俱乐部杯决赛阶段比赛新闻发布会圆满举办

应用为先,未来已来——深圳打造人工智能先锋城市观察

2024年我国规上电子信息制造业 增加值同比增长11.8%

DeepSeek颠覆了什么?——大模型“国产之光”破局的启示

人形机器人产业发展不断提速 机构看好板块投资机遇

DeepSeek有望激发 新一波人工智能创新浪潮

家用市场期待机器人来“敲门”

春节假期全国揽投快递包裹超19亿件