1、DeepSeek 公司诞生
2023 年 7 月,DeepSeek 公司由幻方量化创始人梁文锋主导创立,其团队依托幻方投资的资金与“萤火超算”万卡级算力资源(万张A100 GPU),致力于AGI 技术探索。2023 年 7 月 17 日,杭州深度求索人工智能基础技术研究有限公司(DeepSeek)正式注册,定位为技术驱动的开源AI 公司。
2、DeepSeek 里程碑事件
DeepSeek 整个发展历程可以分为五个阶段:
阶段一:2023 年 11 月,DeepSeek 代码模型首秀。主要包括:DeepSeekCoder:首个开源代码大模型,支持多语言生成与调试,且性能超越CodeLlama,奠定了技术口碑。DeepSeek LLM 67B:通用大模型开源,对标LLaMA2 70B,中英文任务表现领先。
阶段二:2024 年 1 月-5 月,DeepSeek 实现了MoE 架构创新。发布DeepSeekMoE 国内首个开源 MoE 模型,采用细粒度专家共享架构。DeepSeek-V2第二代 MoE 模型,引入 MLA(多头潜在注意力)技术,推理成本仅为LLaMA3的 1/4,API 定价低至 GPT-4 Turbo 的 1/70,大幅拉低AI 使用成本。
阶段三:2024 年 6-8 月,多领域拓展与性能跃升。DeepSeek 发布垂直领域模 型 DeepSeek Coder V2 ( 2024 年 6 月 ) : 代码能力超越GPT-4Turbo。DeepSeek-Prover-V1.5(2024 年 8 月):数学推理模型,覆盖初等数学至研究生水平。
阶段四:2024 年 12 月,实现通用模型的迭代。DeepSeek-V3 发布,公司宣称训练成本仅 550 万美元,性能对标国际闭源模型,生成速度提升3倍。DeepSeek-VL2(2024 年 12 月):多模态 MoE 模型,视觉能力显著提升。
阶 段 五 : 2025 年 1 月 20 日 , DeepSeek 正式发布第一代推理模型DeepSeek-R1-Zero 和 DeepSeek-R1。
3、DeepSeek 的爆火
随着 DeepSeek-R1 发布,相关话题在媒体网络爆火,微信指数迅速超越ChatGPT。2025 年 2 月 5 日,DeepSeek 同样也成为了资本市场的宠儿。DeepSeek概念指数仅仅诞生 10 日后,2025 年 2 月 14 日 DeepSeek 板块成交金额就超过了全部 A 股成交额的 20%。同时期内,沪深 300 指数涨幅约为3.8%,DeepSeek成为了这一轮市场上涨的重要推动力量。
除了在媒体和资本市场的火爆,DeepSeek 是国内首个获得各行各业认可并实际接入的大模型。具体来看,目前已经接入 DeepSeek 的已经包括云服务领域,网络安全领域,办公&教育,医疗,政务等等行业的多家国内外知名企业。
云服务领域
华为云:2 月 1 日,硅基流动与华为云团队联合首发并上线基于华为云昇腾云服务的 DeepSeek 推理服务,让模型能够在大规模生产环境中稳定运行。腾讯云:2 月 2 日宣布在高性能应用服务“HAI”上支持一键部署DeepSeek-R1模型,开发者仅需 3 分钟即可接入调用。
阿里云:2 月 3 日宣布阿里云PAI Model Gallery支持云上一键部署 DeepSeek-V3、DeepSeek-R1。百度智能云:2 月3日宣布DeepSeek-R1 和 DeepSeek-V3 模型已在百度智能云千帆平台上架,并推出了超低价格方案。
京东云:2 月 4 日宣布正式上线 DeepSeek-R1 和DeepSeek-V3模型,支持公有云在线部署、专混私有化实例部署两种模式。联通云:2月3日宣布联通云已基于星罗平台实现国产及主流算力适配多规格DeepSeek-R1模型。
天翼云:2 月 6 日,电信天翼云自主研发的“息壤”智算平台率先完成国产算力与 DeepSeek-R1/V3 系列大模型的深度适配优化。火山引擎:支持V3/R等不同尺寸的 DeepSeek 开源模型,提供高性能推理服务。
网络安全领域
360 集团:2 月 2 日宣布其安全大模型正式接入DeepSeek,将以DeepSeek为安全大模型基座,训练出 “DeepSeek 版” 安全大模型。
安恒信息:2月4日发布信息称,旗下恒脑・安全垂域大模型正式集成DeepSeek,完成基于DeepSeek-R1 的安全大模型的训练。
奇安信:2 月5 日宣布自主研发的QAX安全大模型已全面完成了 DeepSeek 的深度接入。亚信安全:2 月5 日宣布基于DeepSeek-V3/R1 构建智能体,能够在海量的安全告警中,快速、低成本地挖掘到不同来源、不同类型安全告警中的关联关系。
安博通:2 月7 日,安博通下一代 AI 防火墙与人工智能大模型强强联合,搭载DeepSeek-R1-Distill-Qwen-32B模型。
办公&教育领域
视觉中国:完成 DeepSeek-R1 接入与本地化部署,并在多个产品中深度应用其能力。
钉钉:钉钉 AI 助理接入 DeepSeek,支持深度思考。用友:通过引入 DeepSeek 进一步优化 YonSuite 的 AI 能力,并将以更多数据开源模型训练YonGPT 模型。飞书:飞书多为表格、飞书智能伙伴已接入DeepSeek。
ima:正式接入 DeepSeek-R1 模型,在使用搜、读、写和知识库的时候,可以选择腾讯混元大模型或 DeepSeek-R1 模型。网易有道:全面接入DeepSeek-R1,AI 全科学习助手 “有道小 P” 结合 DeepSeek-R1 超长思维链所提供的思考及分析能力,进一步优化了个性化答疑功能。
云学堂:已全面接入DeepSeek-R1/V3大模型,云学堂的 AI 制课专家、AI 学习地图、AI 学习专家、AI 对练等产品均能够使用包括 DeepSeek 在内的多种大模型能力。
万兴科技:已完成与DeepSeek最新推理大模型 DeepSeek-R1 的深度适配,旗下产品如万兴喵影、亿图图示、亿图脑图 MindMaster、万兴 PDF 等均已集成该模型。
知乎:DeepSeek-R1模型能力已经在知乎直答网页和知乎 App 双端集成上线,实现了搜索结果和解答质量的全面提升。科大讯飞:讯飞开放平台宣布 DeepSeek 全系大模型现已正式上线,支持公有云 API 调用和专属模型一键部署。
政务,医疗等其他
深圳全面启用 DeepSeek 打造智慧政务新体验:2 月16 日,深圳市基于政务云环境面向全市各区各部门正式提供 DeepSeek 模型应用服务,实现了基于DeepSeek 的人工智能政务应用一体化赋能升级。此前,深圳已于2 月10日完成DeepSeek-R1(671B)满血版模型在政务云上的部署,并于2 月13 日组织开展全市使用操作培训,成为全省首个基于政务云信创环境下全市范围部署应用DeepSeek 的城市。据 “北京海淀” 微信公众号 2 月11 日消息,海淀区正式为区内企业提供 DeepSeek 全量模型服务,为辖区内行业提供大模型开发、大模型推理 API 服务、大模型应用开发服务等。
浙江省卫健委和蚂蚁集团联合推出 “安诊儿” :2 月16 日,由浙江省卫健委和蚂蚁集团联合推出的 “安诊儿” 宣布融合 DeepSeek-R1,升级大模型底座能力。多家医疗企业接入 DeepSeek :2 月 6 日,智云健康宣布将DeepSeek-R1模型接入公司自研医疗人工智能系统 “智云大脑”。2 月7 日,医渡科技宣布,已将 DeepSeek 人工智能模型整合至公司自主研发的“AI 医疗大脑” YiduCore。2月 7 日,鹰瞳 Airdoc 自主研发的万语医疗大模型完成焕新升级,接入DeepSeek R1 模型。
海外知名企业
微软已将 DeepSeek-R1 模型纳入其 Azure AI Foundry,这标志着AI 经济格局的重大转变。这一整合不仅挑战了现有的 AI 服务定价,还使更多企业能够以更低的成本采用 AI 技术。
英伟达支持 DeepSeek:作为国际巨头之一,英伟达已正式宣布支持 DeepSeek 模型服务。英特尔支持DeepSeek:英特尔是另一家正式宣布支持 DeepSeek 模型服务的国际巨头。
更多行业研究分析请参考思瀚产业研究院官网,同时思瀚产业研究院亦提供行研报告、可研报告(立项审批备案、银行贷款、投资决策、集团上会)、产业规划、园区规划、商业计划书(股权融资、招商合资、内部决策)、专项调研、建筑设计、境外投资报告等相关咨询服务方案。