登录
/
注册
门户
资讯
论坛
网站赚不到钱?立刻加入参与变现
字体超市--好字体用得起,买得起!
共建未成年人"Z站长网"网络空间承诺书
Z站长网
站长工具
站长文章采集
提供网站文章自动采集
Alexa排名查询
根据 Alexa 排名统计数据估算网站 IP、PV 值.
百度权重查询
根据关键词指数与排名估算网站的百度流量
SEO综合查询
查询网站在各大搜索引擎上的SEO数据
友情链接查询
查询网站的友情链接数据及识别对方是否骗链
Whois信息查询
查询域名的详细whois信息及验证域名是否过期
网站备案查询
查询网站的ICP备案、网安备案及备案历史记录
ico图标制作
提供专业ico图标制作
站长素材
字体下载
分享PS字体、免费字体、商业字体库
简历模板
提供各类个人简历模板下载,包括中英文简历.
高清图片
提供高清图片下载,包括背景图片、欧美图片等
矢量素材
打造高精矢量素材下载,包括矢量花纹、图标等
PPT模板下载
提供各类PPT模板下载,包括企业、商务等模板
PSD素材
提供海量PSD素材
源码下载
源码上传
精品源码
源码平台
汇集各类源码
正版软件
各行业主流软件、功能完善
插件/模版
discuz\织梦\thinkphp等精品模版插件
源码下载
各种源码/软件/模版/插件免费下载
网站排名
行业排行榜
提供休息娱乐、购物、服务等行业网站的排名
地区排行榜
提供全国34个省级行政区域的网站排名
移动网站排行榜
提供中文网站排名
公司排行榜
根据各行业各地区公司市值、注册资金等排名情况。
关注我们
Z站长网-新浪微博
有时卖萌,有时天然呆,节操与【小站】同在
Z站长网-微信公众号
请微信搜公众号Z站长网,添加关注我们
Z站长网
Z站长网-百家号
专注报道互联网、创业和前沿资讯.
[登录/注册]
免费搭建"企业官网"私域
播放器收一切自然量
广告招租QQ:258638587
广告招租QQ:258638587
10000来路IP只需8元
专业SEO按天计费源码
用户名
Email
自动登录
找回密码
密码
登录
立即注册
编程
电脑基础
Z站长网
Portal
Ai
BBS
资讯
专题
发布帖子
搜索
搜索
本版
文章
帖子
用户
道具
勋章
任务
设置
我的收藏
退出
返回列表
@Xizi_aCmicjkp
2025-1-28 14:34:18 ·
问答
关注
对话中国工程院院士:DeepSeek,毕竟锋利在那里?
[ 复制链接 ]
来自
版块
:
问答
932
5
文 | 新浪科技 周文猛
1月27日,DeepSeek应用登顶苹果美国地域应用市肆免费App下载排行榜,在美区下载榜上逾越了ChatGPT。同日,苹果中国区应用市肆免费榜表现,DeepSeek成为中国区第一。
DeepSeek毕竟锋利在那里?
本日,中国工程院院士、清华大学盘算机系传授郑纬民及多位AI圈人士在与新浪科技沟通中,指出了DeepSeek其乐成出圈的关键地点。
现在,业界对于DeepSeek的喜好与称赞,重要会合在三个方面。第一,在技能层面,DeepSeek背后的DeepSeek-V3及公司新近推出的DeepSeek-R1两款模子,分别实现了比肩OpenAI 4o和o1模子的本领。第二,DeepSeek研发的这两款模子本钱更低,仅为OpenAI 4o和o1模子的非常之一左右。第三,DeepSeek把这一两大模子的技能都开源了,这让更多的AI团队,可以或许基于最先辈同时本钱最低的模子,开辟更多的AI原生应用。
那么,DeepSeek是怎样实现模子本钱的低落的呢?
郑纬民指出,“DeepSeek自研的MLA架构和DeepSeek MOE架构,为其自身的模子练习本钱降落,起到了关键作用。”他指出,“MLA重要通过改造留意力算子压缩了KV Cache巨细,实现了在同样容量下可以存储更多的KV Cache,该架构和DeepSeek-V3模子中FFN 层的改造相共同,实现了一个非常大的希罕MoE 层,这成为DeepSeek练习本钱低最关键的缘故原由。”
就技能层面而言,KV Cache是一种优化技能,常被用于存储人工智能模子运行时产生的token的键值对(即key- value数值),以进步盘算服从。详细而言,在模子运算过程中,KV cache会在模子运算过程中充当一个内存库的脚色,以存储模子之前处置惩罚过的token键值,通过模子运算盘算出留意力分数,有用控制被存储token的输入输出,通过“以存换算”制止了多数大模子运算每次都是从第一个token开始运算的重复盘算,提拔了算力利用服从。
别的,据郑纬民透露,DeepSeek还办理了“非常大同时非常希罕的MoE模子”利用的性能困难,而这也成了“DeepSeek练习本钱低最关键的缘故原由”。
现在,通过MoE混淆专家模子提拔AI大模子的专业认知本领正成为业界公认的有用本领,而且一个大模子的专家模子数目越多,模子就越希罕,服从也越高,但专家模子变多大概导致终极天生的效果不太正确。
据郑纬民先容,“DeepSeek比力锋利的是练习MoE的本领,成为公开MoE模子练习中第一个能练习乐成这么大MoE的企业。”新浪科技相识到,为包管大规模MoE专家模子的平衡运行,DeepSeek利用了先辈的、不必要辅助丧失函数的、专家加载平衡技能,包管每个token下,少量专家网络参数被真正激活的环境下,差别的专家网络可以或许以更平衡的频率被激活,防止专家网络激活扎堆。
别的,DeepSeek还充实使用专家网络被希罕激活的计划,限定了每个token被发送往GPU集群节点(node)的数目,这使得GPU之间通讯开销稳固在较低的水位。
海量资讯、精准解读,尽在新浪财经APP
责任编辑:常福强
本帖子中包含更多资源
您需要
登录
才可以下载或查看,没有账号?
立即注册
x
回复
使用道具
举报
综合
最新
热度
发表评论
全部评论 5
楊羊羊
回复
使用道具
举报
评论
·
使用道具
·
举报
真的有被惊艳到了呀哈哈哈哈,真的黑白常高级呀[微笑][微笑]
2025-1-28 14:32:54
小小吴
回复
使用道具
举报
评论
·
使用道具
·
举报
每个汉字和英笔墨母都熟悉,它们一拥抱我就含糊了……[允悲]
2025-1-28 14:33:15
未来的明天
回复
使用道具
举报
评论
·
使用道具
·
举报
如今的这些东西真的黑白常的好,也非常的高级。
2025-1-28 14:33:36
良辰余辉
回复
使用道具
举报
评论
·
使用道具
·
举报
看着郑纬民的书长大的[允悲][允悲][允悲]
2025-1-28 14:33:57
梅目如画
回复
使用道具
举报
评论
·
使用道具
·
举报
无私奉献
2025-1-28 14:34:18
@Xizi_aCmicjkp
此人什么也没留下~
关注
文章
95
积分
302
汽车电动化智能化趋势不会改变
阅读 1201
汽车早参 | 广汽拟投资小马智行,何小鹏回应Robotaxi业务希望 ...
阅读 1195
前三季度赛力斯新能源汽车销量达31万辆 助推营收同比预增超5倍 ...
阅读 1177
热文
3 天
7天
1
互联网大厂重回春晚
1871热度
2
1月游戏版号发放再破百,机构:或推动产业繁荣发展,中概互联ETF
1844热度
3
中欧班列(西安)新年开门红
1833热度
4
抖音做不好互联网医疗?
1830热度
5
不再掉队?阿森纳英超强势8连胜,去年同期4胜2平2负
1828热度
6
千亿元巨头 业绩新高!洛阳钼业最新年度业绩再度刷新历史纪录 ..
1826热度
7
重庆:到2025年底建成逾2000座超充站
1824热度
8
以优良文风提升宣传质量和水平
1821热度
9
吴清再度提及量化交易监管 如何理解最新提出的“趋利避害、突出
1812热度
10
无人不网 未成年人网络保护面临新风险
1789热度
1
大厂员工再无巨额年终奖
1759热度
2
摩根大通分析师警告称美股出现互联网泡沫式的市场集中 前10大股
1707热度
3
威马成“危马”:创始人行踪成谜 车主困在“售后中” ...
1690热度
4
被AI淘汰的专业,出现了
1687热度
5
售33.98万元起 新款腾势D9正式上市
1679热度
6
再提“派兵” 马克龙敦促盟友力挺乌克兰
1676热度
7
AI进讲堂、AI数字底盘……一文感受数字新生活
1676热度
8
国网数科控股公司荣获工信部工业互联网平台贯标认证 ...
1667热度
9
售23.58万起 新款冒险家及混动版上市
1660热度
10
互联网平台提现限制重重,是合理规定还是霸王条款? ...
1608热度
查看更多
发布新话题
所属版块
返回版块
高级模式
B
Color
Image
Link
Quote
Code
Smilies
您需要登录后才可以回帖
立即登录
发送
本版积分规则
回帖后跳转到最后一页
说说你的想法......
0
5
0
返回顶部