华泰证券：DeepEP开源有望开释推理需求讲理诈欺与算力

06 2025-03
华泰证券：DeepEP开源有望开释推理需求讲理诈欺与算力

发布日期：2025-03-06 09:17 点击次数：182
　　华泰证券以为，DeepSeek通过优化推理本钱，有望股东LLM交易化诈欺加快。基于此，看好推理需求开释带动IaaS管事商稼动率升迁，云厂商有望受益。其次，磋商到R1带来模子智力升迁的同期又可完了低本钱部署，有望带动AI诈欺加快浸透。临了，尽管当今DeepEP仍需要在Hopper+CUDA+NVLink的框架下完了，但中长久来看，跟着国产卡的适配跟进，技能有望向更多国产生态迁徙，国产AI算力板块有望迎来成长机遇。
　　全文如下
　　华泰 | 蓄意机：DeepSeek - EP降本，讲理诈欺与算力
　　2025年3月1日，DeepSeek发布《One More Thing， DeepSeek-V3/R1 Inference System Overview》，其中提到通过大模子跨节点行家并行，DeepSeek完了了$87，072/天的低本钱推理，灵验算力赢得显耀升迁。咱们以为，跟着国产算力硬件冉冉适配DeepEP体系，DeepSeek模子或通过性价比上风带动推理需求开释，国产算力有望加快成长。
　　中枢不雅点
　　中枢亮点：推理本钱大幅镌汰，理思景色下15%付费率即可盈亏平衡
　　据DeepSeek，V3和R1推理管事占用节点总数，峰值占用为278个节点，平均占用226.75个节点，DeepSeek假设GPU租出本钱为2好意思金/小时，总本钱为$87，072/天。此外，在2025/02/27 12:00 PM至2025/02/28 12:00 PM，V3和R1模子推理浮滥Token 776B（输入608B+输出168B），平均每百万Token措置本钱为0.11好意思元。DeepSeek假设若是总共Tokens一起按照DeepSeekR1的订价蓄意，表面上一天的总收入为$562，027，本钱利润率545%。但磋商到当今DeepSeek仅通过API收费，故土们测算若按照R1收费订价，付费Token占总Token的15%即可完了推理经过的盈亏平衡。
　　中枢技能：通过EP完了更高的糊涂量和更低的延长
　　DeepSeek-V3 / R1 推理系统的优化计算是：更大的糊涂，更低的延长。为了完了这两个计算，炒期货DeepSeek的决议是使用大规模跨节点行家并行（Expert Parallelism/EP），并开源了DeepEP代码。具体来看，中枢智力包括：1）大规模跨节点行家并行：接收了预填充-解码理会架构，不同阶段同期进行多个行家并行蓄意；2）蓄意/通讯重复：将GPU中的SM（流多措置器）分手为蓄意、通讯两部分，各自同期履行相应职责负载，减少延长恭候时刻；3）负载平衡：通过预填充负载平衡、解码负载平衡、行家并行负载平衡，尽可能地为每个 GPU 分拨平衡的蓄意负载、通讯负载。
　　中枢原因：推理订价/本钱的各异或为外部算力供应受限的截至
　　对比来看，国外模子如OpenAI o3-mini在推理订价方面较DeepSeek更贵，如每百万Token输入的价钱为$0.55（缓存射中），而R1为$0.14。咱们以为，API订价的各异或有特别一部分来自于推理本钱的各异，DeepSeek或凭借EP等更极致的软硬件优化，完了推理本钱的大概。咱们以为，这一气象的背后，响应的是国表里算力供应以及产业标的的各异。国内大模子厂商在算力供给受限的布景下，通过技能优化的方法不停压榨硬件性能，在有限的算力下完了最优的模子恶果。基于此，咱们以为，国内模子有望凭借性价比上风，带动下流交易化诈欺，完了人人阛阓的份额升迁。
　　中枢受益：DeepEP开源有望开释推理需求，讲理诈欺与算力
　　咱们以为，DeepSeek通过优化推理本钱，有望股东LLM交易化诈欺加快。基于此，咱们看好推理需求开释带动IaaS管事商稼动率升迁，云厂商有望受益。其次，磋商到R1带来模子智力升迁的同期又可完了低本钱部署，有望带动AI诈欺加快浸透。临了，尽管当今DeepEP仍需要在Hopper+CUDA+NVLink的框架下完了，但中长久来看，跟着国产卡的适配跟进，技能有望向更多国产生态迁徙，国产AI算力板块有望迎来成长机遇。
　　风险教导：AI技能迭代不足预期；AI交易化不足预期；本申报基于客不雅信息整理，不组成投资提倡。
- 证券
- 华泰
- 有望
- 开源
- DeepEP

让建站和SEO变得简单

华泰证券：DeepEP开源有望开释推理需求讲理诈欺与算力

热点资讯

相关资讯

让建站和SEO变得简单

华泰证券：DeepEP开源有望开释推理需求 讲理诈欺与算力

热点资讯

相关资讯

华泰证券：DeepEP开源有望开释推理需求讲理诈欺与算力