AI 行业的 “价格天花板”,被 DeepSeek 彻底砸碎了!4 月 26 日 – 27 日,DeepSeek 创始人梁文锋连续甩出两轮重磅降价,旗下 V4 系列模型价格暴跌 90%,百万 token 输入(缓存命中)低至 0.02 元,相当于一杯奶茶钱就能撬动数亿级 AI 调用量,真正让开发者、中小企业迎来 “token 自由” 时代。
这场降价风暴来得又猛又急,堪称 AI 行业有史以来最彻底的一次 “普惠革命”。4 月 25 日晚,DeepSeek-V4-Pro 率先开启首轮降价,输入(缓存未命中)价格从 12 元 / 百万 token 降至 3 元,输出价格从 24 元降至 6 元,降幅达 75%。仅隔一天,官方再放 “杀招”:全系 V4 模型输入缓存命中价格直接砍至首发价的 1/10,叠加限时优惠后,V4-Flash 百万 token 仅 0.02 元,V4-Pro 低至 0.025 元,直接创下全球大模型价格新低。
很多人对这个价格没概念,换算成日常场景更直观:处理 100 万字的长文档、搭建全年高频调用的智能客服、运营日均万次交互的 AI 应用,月度 token 成本可能只需几分钱到几元钱。有开发者测算,调价后综合使用成本降幅超 73%,网友更是直呼 “像手机流量从 5 元 1G 跌到 5 毛 1G,AI 使用门槛彻底归零”。
此次降价核心聚焦 “缓存命中” 场景,却精准击中 AI 商用的核心痛点。所谓缓存命中,就是用户重复调用、长文本续写、RAG 知识库检索等高频场景,这类场景占企业 AI 调用量的 80% 以上。DeepSeek-V4 凭借自研 DSA 稀疏注意力架构,将百万 token 上下文的算力消耗降至前代的 27%,缓存占用更是压缩至 10%,技术突破直接支撑价格断崖式下跌。
两款模型精准覆盖不同需求,性价比拉满:
- DeepSeek-V4-Flash(轻量化):主打高效低成本,缓存命中输入 0.02 元 / 百万 token,未命中 1 元、输出 2 元,适合日常聊天、轻量创作、小型客服等场景。
- DeepSeek-V4-Pro(旗舰级):激活参数 49B,支持百万级超长上下文,缓存命中输入 0.025 元 / 百万 token(限时至 5 月 5 日),未命中 3 元、输出 6 元,适配长文档分析、复杂推理、企业级 RAG 等高端需求。
梁文锋此番降价,绝非简单的 “价格战”,而是国产 AI 技术成熟后的必然普惠。从底层来看,DeepSeek-V4 完成了从英伟达 CUDA 到华为昇腾 CANN 的全链路迁移,重写 200 多个核心算子,实现国产算力的高效适配。技术自主 + 算力国产化,让 DeepSeek 摆脱海外算力卡脖子的同时,把成本优势彻底让渡给用户。
降价消息一出,行业瞬间震动。国内智谱、MiniMax 等竞品股价应声下跌,而 DeepSeek-V4-Pro 发布首日调用量暴涨近 4 倍。对开发者和中小企业而言,这更是颠覆性利好:以前不敢碰的长文本处理、多轮深度推理、大规模 AI 应用,现在成本几乎可以忽略不计;个人开发者零成本即可搭建专属 AI 工具,中小企业用极小预算就能实现 AI 赋能转型。
更值得关注的是,此次降价并非短期促销,输入缓存命中低价为永久政策,仅 V4-Pro 的 2.5 折优惠限时至 5 月 5 日。这意味着,“token 自由” 不是短暂狂欢,而是 AI 行业进入平价时代的开端。梁文锋曾说 “AI 不应是奢侈品,而是人人可用的工具”,如今 DeepSeek 用实际价格兑现了这句承诺。
当百万 token 仅需 2 分钱,当 AI 调用成本比水电还便宜,一场全民 AI 普及浪潮已然来临。个人创作者可以用 AI 解放生产力,中小企业能低成本拥抱智能化,开发者能零门槛探索 AI 创新。DeepSeek-V4 的降价,不仅是价格的颠覆,更是 AI 价值的回归 —— 技术的终极意义,从来都是普惠大众,赋能千行百业。
未经允许不得转载:物联网的那些事 - Totiot » 炸穿地板!DeepSeek-V4 价格暴降 90%,百万 token 仅 2 分钱,梁文锋送上全民 token 自由

微信关注,了解更多 





