新闻资讯

压力给到梁文锋

摘要:

根据 DeepSeek 过往的产品更新周期来看,梁文锋的主场时间又快到了。

来源|《中国企业家》杂志

作者|闫俊文

编辑|张晓迪

这两天,中美大模型公司各有大事发生。

4 月 15 日凌晨,OpenAI 发布了 GPT-4.1 系列模型,包括 GPT-4.1、GPT-4.1 Mini、GPT-4.1 Nano,它们的核心特征是成本更低,速度更快;同一天,另一家中国明星 AI 公司,智谱 AI 正式启动上市辅导备案,由中金公司担任辅导机构。备案报告显示,智谱 AI 将在今年 8 月至 10 月完成 IPO 辅导计划。

此前的 3 月底,智谱 AI CEO 张鹏曾告诉《中国企业家》,他判断实现 AGI,路程还长," 不管我们融了多少钱,其实都是 AGI 道路上的盘缠,未来,还需要更多盘缠,我们会持续地做相关的事情 "。

如今看来,这个 " 更多的盘缠 " 就是指 IPO。

2025 年开年,DeepSeek" 燃爆 "AI 圈,目前,截至 R1 模型正式发布已经过去 86 天。

DeepSeek 和梁文锋的团队什么时候推出新的大模型产品,尤其是 R1 的更新版?

《中国企业家》统计了国外 Anthropic、Meta 等公司更新大模型的周期,如果是模型的重大升级,周期在 5 至 10 个月左右;而同一版本的功能升级则在 3 至 4 个月之间。

根据 DeepSeek 官网数据,梁文锋的 AI 团队更新产品与国外主流公司同频,2024 年 9 月发布 V2.5,12 月发布 V3,2025 年 3 月将 V3 更新为 V3-0324 版本,也几乎每隔 3 个月就会迎来一次升级。

有一些预测认为,DeepSeek 下一次更新 R1 模型可能是在 5 月初,届时或提前发布,但 DeepSeek 方面目前还尚未对这种预测进行回应。

OpenAI 也在追求更小更快

公开资料显示,GPT-3 的参数规模为 1750 亿,GPT-4 的参数规模为 1.76 万亿,到了 GPT-4o 参数约 2000 亿规模,此次 OpenAI 推出的 GPT-4.1 Mini,被称作 OpenAI 的高效小型模型,在多个基准测试中表现超越 GPT-4o,大幅减少延迟并降低 83% 成本。

GPT-4.1 Nano 被称之为首个超小型模型,它能支持 100 万 token 的上下文窗口,适用于低延迟任务,如分类和自动补全。

值得注意的是,上述三个模型将上下文窗口处理的规模从 GPT-4o 的 128K 直接提升至 100 万 token(1M)。这意味着模型在更长的文本中保持专注和理解的能力得到了强化。

具体到成本、价格方面,GPT ‑ 4.1 比 GPT ‑ 4o 便宜 26%,输入、输出分别是每百万 token2 美元和 8 美元;GPT ‑ 4.1 Nano 输入、输出分别为 0.1 美元和 0.4 美元。

对比 DeepSeek,标准时间段内,V3 模型输入、输出百万 token 的费用为 0.5 元、8 元,R1 推理的费用分别为 1 元和 16 元。

可以说,OpenAI 也打上了 token 的价格战,价格直接对标 DeepSeek。

与此同时,OpenAI 已暂停了其此前 2 月发布的 GPT-4.5,原因在于成本太高,其 API 定价为输入、输出每百万 token75 美元、150 美元。官方回应说此次调整旨在将更多资源投入未来模型的研发。

关于开源,OpenAI 的 CEO 山姆 · 阿尔特曼不得不走向与 DeepSeek 同样的路径,他曾表示,DeepSeek 的出现并未影响 GPT 的增长,OpenAI 将推出更好的开源模型。

不过,在 DeepSeek 冲击之下,阿尔特曼曾经一度非常恼火,甚至恐慌,他曾在社交平台上指责 R1 模型使用了 GPT 的数据蒸馏,又写 *** 给美国 *** ,声称限制 AI 技术流向中国等国家,并禁用 DeepSeek。

但这并不影响 DeepSeek 的影响力。在英伟达的 2025GTC 开幕主题演讲会上,黄仁勋数次提到 R1 模型,并用 R1 模型验证了黄仁勋所谓的 " 推理越多,所需算力越多 " 的说法。

除了 OpenAI,谷歌在 4 月 9 日也举办了发布会,宣布推出 Agent2Agent 智能体交互协议,该协议允许生态系统中的 AI 智能体进行底层技术无关的相互操作。多个智能体的协作将带来更高的自主性,同时成倍提高生产力、降低长期成本。

梁文锋的主场时间又快到了

在 R1 模型 " 爆火 " 之后,DeepSeek 除了模型升级,人事布局上动作颇多,DeepSeek 官网在 3 月份发布了 *** CFO、COO、财务负责人岗位的信息。这也被一些媒体解读为 DeepSeek 在为融资做准备;模型方面,DeepSeek 更大的动作是 3 月 25 日发布了 V2 模型的更新版。

目前,DeepSeek 并未发布有关融资方面的信息。4 月 3 日,梁文锋和团队发表了一篇论文,题目是《通用奖励建模的推理时间缩放》,文章论述了如何让注意力机制更高效地处理更长的上下文等。

DeepSeek" 燃爆 "AI 圈后,外界对其充满好奇和新的期待。潞晨科技 CEO 尤洋近期在接受《中国企业家》采访时说,如果有机会跟梁文锋面对面,他最想问梁文锋的是他最终的目标是什么," 梁文锋是想做一个成功的商业化公司,还是想通过一些其他手段做一些非盈利的事情?这两者肯定差距是非常大的,OpenAI 可能还是想做一个 Google 那样的非常高价值的商业化公司。"

记者了解到,目前,无论是杭州本地的大公司,还是深圳的顶级创投,都难见梁文锋一面。

近期英伟达公开表示,美国 *** 正在限制其 H20 芯片向中国的出口,并且 H20 芯片对华出口需要获得许可证,这一要求是 " 无限期 "。

而 H20 芯片正是梁文锋最在意的 " 基础设施 ",早先,梁文锋在接受媒体采访时说," 我们真正的挑战从来不是资金,而是高端芯片的出口禁令。"

不过,面对禁令,梁文锋也并非坐以待毙,他曾在接受媒体采访时说," 英伟达的 GPU 没有什么神秘之处,但要赶上他们,就必须重建团队、付出时间和成本,追赶下一代技术——这才是真正的护城河。"

  • 凯德申报首支国内消费基础设施公募REIT,规模约28亿
  • 界面调查|隆化养老院大火警示:失能老人们,困在顶层中
  • 昨夜今晨国际外盘头条一览_2025年4月16日_财经新闻
  • 嘉实多中国回应向客户发布润滑油涨价沟通函
  • 李家超率团访问浙江
  • 北京理工大学:教师宫某涉嫌师德失范,暂停其一切职务活动
  • 印度面临关税压力 要求亚马逊和沃尔玛全面开放市场
  • 尾盘:美股涨跌不一 三大股指本周均将录得跌幅
  • 本周市场前瞻:特斯拉、谷歌、波音、英特尔等公司财报以及美联储官员讲话
  • 宇树科技回应机器人马拉松比赛:官方没有参赛 正忙于格斗直播
  • 特朗普关税冲击生存环境,新加坡希望通过提前大选强化内部稳定
  • 提升青春期+亲子含量:社区商业综合体这样用好“二次元”
  • 江西卫健委原主任王水平被查,全省4月已有15名干部主动交代问题
  • 一周新车盘点 | 仰望U7首搭水平对置发动机 阿维塔06开启预售
  • 133名国际学生联合行动,状告美国政府非法取消学生签证
  • 思特威:一季度净利润同比增长1264.97%
  • OPPO中国区总裁:更多精力会花在AI底层,研究用户场景需求
  • 中国人寿官网更新:李祝用正式出任副董事长、总裁
  • 深圳一程序员4年不租房睡车里,工作日利用公共卫生间洗漱:一天消费100元上下,周末回阳江陪妻儿
  • 开盘|国内期货主力合约互有涨跌 沪金涨近2%
  • 新加坡金管局放松货币政策 预计2025年经济增速放缓
  • 礼来公布口服降糖药积极结果,或年底前提交用于体重管理上市申请
  • 摩根大通将2025年布伦特原油价格预测从每桶73美元下调至66美元
  • 特朗普政府提议取消对联合国维和任务资助
  • 上海群文创作大检阅,102个节目角逐群星奖
  • 《难哄》播放量进全球前六,奈飞也爱国产剧?
  • 事关稀土精矿进口,A股巨头回应!
  • 紫金矿业一季度归母净利润101.67亿元 同比增长62.39%
  • 印刷成本激增、流媒体订阅流失风险加剧,关税风波影响美国出版与娱乐业|文化周报
  • 广东报告2起公共卫生事件,分别为食用毒蘑菇、蟾蜍中毒死亡
  • 地平线与奇瑞达成HSD全球首发量产合作
  • 广汽发布12款车规级芯片
  • 中国蔬菜协会营养与品牌分会在京成立,王晓举为首任会长
  • 直通部委 | 多部门关爱帮扶农村留守妇女 全国家电以旧换新突破1亿台
  • 新加坡金管局放松货币政策 预计2025年经济增速放缓
  • 美对华加征245%关税?外交部回应来了
  • 强调“报行合一”!人身保险产品“负面清单”增至103条
  • 美共和党据悉考虑对百万富翁设40%税率 以抵消减税成本
  • 特斯拉多头警告公司面临“红色警报”时刻 马斯克应离开政府效率部
  • 研究表明全球经济增长威胁上升 美国信心指标遭重创
  • 美联储古尔斯比:不希望美联储货币政策独立性遭质疑
  • 刚刚!大跌超10%,陷入停滞!
  • 一周个股动向:地产股获主力青睐 九号公司被密集调研
  • 快手笑古:“新线城市+AI”将成为本地生活的增长引擎
  • 因关税影响的不确定性 沃尔沃集团将在美国裁员至多800人
  • 字节跳动2024年利润增速和利润率下滑,海外收入占比达历史最高
  • 谈判进展甚微,欧盟对美关税征收范围将扩大至厕纸和化妆品
  • 马斯克公开对特朗普政府表达不满
  • 直击杭州银行业绩会:正积极寻求大股东可转债转股等方面支持
  • 关税担忧席卷全球,华尔街目光投向新兴市场债券
  • 市场监管总局出台37条重点举措,支持民营企业发展
  • 让更多创新成果落地生金
  • 泽连斯基首次公开指责中国?几个意思啊?
  • 直击杭州银行业绩会:正积极寻求大股东可转债转股等方面支持
  • 特朗普不想夺取运河了?巴拿马与美国备忘录排除驻军条款
  • 【理响中国】努力开创周边工作新局面
  • 俄乌“暂停打击”协议到期 ,冲突要升级?梅德韦杰夫最新发声:美国“明智”,欧洲也应该这么做......
  • 早盘:美股跌幅扩大纳指跌2.4% 特朗普再次呼吁美联储降息
  • ETF日报:模拟芯片企业加大研发投入,国内产能充足,具有国产替代的能力和空间,可关注半导体设备ETF
  • 特朗普关税致成本上升,芭比娃娃世界笼罩阴霾
  • 河南项城工厂爆炸事故通报:共致6死3伤,存在转包非法生产情况
  • 豁免来了,尴不尴尬...
  • 普京签署法律,诋毁俄军将面临最高7年监禁
  • 外汇制度全面改革后,阿根廷比索将走向何方?
  • 消息称币安仍在考虑与特朗普家族的加密货币企业交易
  • 星纪魅族正式进军中东市场
  • 华为去年收入超8600亿元,政企业务收入增长超25%
  • 习近平同越共中央总书记苏林、越南国家主席梁强共同会见中越人民大联欢活动代表
  • 二氧化碳突出又致5死9伤,兰州金河煤矿18年发生9起事故伤亡超40人
  • 广发基金刘格崧一季报:首次买入广东宏大、分众传媒,减仓亿纬锂能
  • 【专访】Snow Peak中国区CEO:希望消费者提到“飞钓”,就想到我们
  • 收盘:美股收盘涨跌不一道指跌逾500点 三大股指周线均录得跌幅
  • 长安期货刘娜:橡胶驱动不足,短期或震荡为主
  • 长三角主流媒体将走进“来电”宜昌,探寻高质量发展密码
  • 上美开搞内部“赛马”:一个韩束不够好,那就再来三个
  • 花旗将未来12个月欧元汇率预测上调至1.20美元
  • 推动汽车行业高质量发展,行政手段整治无序竞争不可或缺
  • “百万英才汇南粤”!广东深圳,为何远赴上海邀约全球英才?
  • 对谷歌非法广告技术垄断的裁决意味着什么?
  • 习近平抵达吉隆坡
  • 多位知名基金经理在管产品变更:鲍无可增聘老将共管,冯波卸任2基金
  • 因关税影响的不确定性 沃尔沃集团将在美国裁员至多800人
  • 大宗商品综述:贸易及地缘局势主导市场 原油续涨 黄金回调 铜走低
  • 经济日报社副社长赵子忠:企业家应“拼”字当头,敢闯敢为
  • 《殷墟甲骨精粹注译》:一场关于甲骨的“Deepseek”
  • 聚丙烯:关税政策持续加码 华南区域供需格局将会如何生变?
  • 打造科创综指“增强”版   富国科创综指增强今日首发
  • 跨界合作“原神”餐厅首次开放,北京环球度假区上新线下场景体验
  • 中信证券:贸易战僵持阶段,中国的政策选项更多、空间更大、能耗更久
  • 事关稀土精矿进口,A股巨头回应!
  • 新酒店 | 绘姑苏繁华,丽思卡尔顿酒店亮相苏州
  • 一周新车盘点 | 中期改款Model Y公布售价 比亚迪夏正式上市
  • 新任遂宁市委副书记王忠诚已任市政府党组书记
  • 我国与沙特签署《核能发展安全与安保合作谅解备忘录》
  • 批评美国政府的学者需特别谨慎,加拿大大学教师协会对赴美发警告
  • 印刷成本激增、流媒体订阅流失风险加剧,关税风波影响美国出版与娱乐业|文化周报
  • 工信部发布第一季度电信服务质量通告,上海巨人网络科技有限公司被点名
  • 学费顷刻“蒸发”、戒掉“中国制造”,特朗普关税下美国人在恐慌什么
  • 一周200余家次披露!深市回购增持浪潮涌动
  • 澳亚集团拟“5供2”基准供股
  • 南京信息工程大学商学院讲师李玮玮逝世,终年45岁
  • 美国佛罗里达州立大学枪击事件已致2人死亡
  • 和朱啸虎唱反调,高工预测2035年国内人形机器人市场规模破千亿
  • 哪吒汽车前CEO张勇辟谣:Logo花费5亿不实 设计费不超百万
  • 关键词: