AI 资讯 · 2026-04-24
-
In another wild turn for AI chips, Meta signs deal for millions of Amazon AI CPUs
Meta has commandeered a big chunk of Amazon's homegrown CPUs (not GPUs) for AI agentic workloads, signaling that a new kind of chip race has begun.
-
DeepSeek V4终于发布,但它留下的5道主观题还没有答案
文|周鑫雨 资料整理|钟楚笛 编辑|苏建勋 杨轩 靴子终于落地。 被调侃“Next Week”近3个月的DeepSeek V4,终于显露真身。 1.6T的最大参数量、1M的上下文窗口、针对Agent的性能优化,以及基于MoE(混合专家模型)和稀疏注意力机制DSA,降低计算和显存需求——这些曾被外界纷纷猜测的参数和性能,随着V4的官宣,一锤定音。 DeepSeek V4性能测评结果。 姗姗来迟的原由,与V4将训练框架从英伟达迁移到华为昇腾上有关,也与DeepSeek内部的决策变动有关。我们得知,2025年年中,DeepSeek曾面临一次较为严重的训练失败。 “当时,DeepSeek面临重新适配芯片的问题。”一名知情者提到,“内部有关训练方向的意见也不完全统一。梁文锋提出了一些自己的要求,但在执行层面很难折中。” 不过,与外界关于“新模型支持多模态生成和理解”的猜测不同,V4依然是个语言模型。暂缓多模态生成的训练策略,主要源于算力和现金的掣肘。 多名知情者告诉《智能涌现》,DeepSeek的对外融资窗口,是2026年4月中旬打开的。内部的导火索,是DeepSeek需要更多资金支持,训练参
-
智源:FlagOS完成DeepSeekV4八款芯片Day0 适配,实现三重技术突破
雷峰网讯 DeepSeek今日发布了DeepSeek-V4-Pro 1.6T 旗舰模型(1.86万亿参数)及DeepSeek-V4-Flash 284B 高效模型(2840亿)。由智源研究院牵头研发的众智FlagOS第一时间对两个“巨无霸”模型进行全量适配,已经完成 DeepSeek-V4-Flash在 8款以上 AI 芯片上的全量适配与推理部署,包括海光、沐曦、华为昇腾、摩尔线程(FP8)、昆仑芯、平头哥真武、天数、英伟达(FP8)等芯片。FlagOS 同时正在推进 DeepSeek-V4-Pro 模型在多个芯片的迁移适配,后续即将开源。首先完成在八款芯片适配的DeepSeek-V4-Flash 是深度求索推出的 V4 系列两大模型之一,采用混合专家(MoE)架构,总参数量 284B,激活参数仅 13B,支持 100 万 token上下文长度。该模型在架构上引入了混合注意力机制(结合压缩稀疏注意力CSA与高度压缩注意力HCA,大幅提升长上下文效率)、流形约束超连接(mHC,增强跨层 信号传播稳定性)以及 Muon优化器(加速收敛、提升训练稳定性)。预训练数据超过32Ttoken,后训
-
GPT-5.5来了!全榜第一碾压Opus 4.7,OpenAI一雪前耻;百度最新通报!原贴吧员工石某某,获刑12年;曝DeepSeek最新估值高达3000亿
要闻提示1.GPT-5.5来了!全榜第一碾压Opus 4.7,OpenAI一雪前耻2.百度最新通报!原贴吧员工石某某,获刑12年3.曝DeepSeek 50亿起投,最新估值高达3000亿4.为“干私活”删除公司AI训练数据,一程序员获刑五年十个月5.中国僧人玩CS2修行走红!电脑价值4万,用RTX40906.伊朗全国断网超52天创纪录!称美国思科等设备存后门,仍能远程破坏7.索尼研发9眼8臂乒乓球机器人,打败日本多名顶尖选手今日头条GPT-5.5来了!全榜第一碾压Opus 4.7,OpenAI一雪前耻4月24日消息,据报道,Anthropic 在私募二级市场的估值已突破 1 万亿美元。作为参照,OpenAI 今年 3 月末最新一轮融资的估值,仍停留在 8520 亿美元。这组对比数据也表明了曾经稳坐头把交椅的 OpenAI,如今正在直面被追赶、被超越的压力,但就在刚刚OpenAI 的反击旋即而至:24日凌晨,GPT-5.5 正式发布,同步亮相的还有面向更高阶任务的 GPT-5.5 Pro 版本。这次更新,看似只是 0.1 的版本号迭代,在推理效率上却判若大版本更新—— 同样的 Codex
-
阿里云百炼上线DeepSeek-V4
4月24日消息,阿里云百炼平台首发上线DeepSeek-V4-pro和DeepSeek-V4-flash两款模型,API价格与DeepSeek官网一致,百万Tokens输入最低仅需1元,百万Tokens输出最低2元。近期,百炼Token Plan也将支持调用该模型。 官方信息显示,DeepSeek-V4拥有百万超长上下文,在Agent能力、世界知识和推理性能上均表现优秀。DeepSeek-V4对Agent产品进行了适配和优化,在代码任务、文档生成任务等方面表现均有提升。 目前,阿里云百炼已上线等100多款顶尖全模态模型,是模型种类最丰富的大模型服务平台。雷峰网
-
DeepSeek V4终于发布!打破最强闭源垄断,明确携手华为芯片
在Agent能力、世界知识和推理性能上均实现国内与开源领域的领先。
-
China’s DeepSeek previews new AI model a year after jolting US rivals
Chinese AI company DeepSeek released a preview of its hotly anticipated next-generation AI model V4 on Friday, saying that the open-source model can compete with leading closed-source systems from US rivals including Anthropic, Google, and OpenAI. DeepSeek says V4 marks a major improvement over prior models, especially in coding, a capability that has become central […]
-
打造生物智能基础设施,AI4S企业「奥明星程」获超亿元A轮融资|36氪首发
36氪获悉,AI for Science公司「奥明星程」近日完成超亿元A轮战略融资。本轮投资方包括深创投、复星医药(复健资本)、太平股权、广东中医药大健康基金、杭实集团等多家头部投资机构、产业链龙头企业及多地国资。同时,公司也与包括深圳湾实验室在内的多家国际顶尖科研机构建立了深度成果转化合作机制,形成覆盖技术研发、临床应用及产业生态赋能的全链条布局。 2025年被视作AI4S发展的分水岭。随着通用科研引擎的出现,以及英伟达GTC大会将AI4S与大语言模型、具身智能并列为人工智能三大核心方向,全球资本与技术资源正加速向该领域聚集。然而,当前多数AI在科学探索中仍停留在“结果拟合”层面,在机制理解与问题定义上存在能力断层。 奥明星程的核心目标,就是实现“从结果到机制、从解题到出题”的跃迁。公司创始人兼CEO林子奥认为,奥明星程“并非简单提升模型、智能体精度,而是致力于构建AI科学家能力体系”。 具体而言,公司将聚焦三个层面的突破:第一,让AI从“表征学习”走向“机制建模”,不只预测结果,而是逼近疾病发生发展的内在逻辑;第二,让AI具备“问题定义能力”,不仅回答问题,还能够在复杂系统中识别关
-
千问加速上车!10多家头部车企同日宣布接入
2026北京车展开幕首日,长安、东风、北汽、比亚迪、吉利、长城、理想、上汽大众、上汽智己等宣布接入千问。未来,这些车企的部分车型在车内可实现复杂路径规划、闲聊、查新闻、订酒店、买门票、点外卖、查快递等全场景服务。汽车智能化正在发生深刻变革,阿里云提供了一整套“端+云”协同架构助力汽车行业打造极致体验的智能座舱:端侧部署Qwen-Omni全模态大模型,可感知物理世界,保障隐私安全,在弱网环境下也能快速响应、稳定运行;云端通过千问链接数字世界,提供多种服务。在识别车控指令、车辆运行状态,及用户意图等方面,端侧可直接执行;针对复杂的任务,端侧把请求通过网络分发给云端的千问,精准拆解意图后,千问调用对应的阿里巴巴生态服务,用户可以一句话在车里完成订餐、购物、导航、支付等一系列操作。3月份,一汽红旗率先宣布接入千问智能体,在车内可实现多模糊意图识别与复杂路径规划的服务闭环;4月份,广汽集团宣布接入千问后,座舱具备了极强的逻辑理解与长文本处理能力,并融入阿里巴巴“吃、住、行、游、购、娱”全生态,实现“一次指令、全部搞定”。据了解,千问正持续提升模型能力、加速生态协同,同时Qwen-Omni全模态大
-
DeepSeek previews new AI model that ‘closes the gap’ with frontier models
DeepSeek says both models are more efficient and performant than DeepSeek V3.2 due to architectural improvements, and have almost "closed the gap" with current leading models, both open and closed, on reasoning benchmarks.
-
火山引擎发布新一代汽车AI解决方案,一个AI大脑深度联动整车
4月24日,北京车展开幕首日,火山引擎发布基于Agentic AI架构的新一代汽车AI解决方案,包含AI座舱套件方案、豆包座舱助手方案两大解决方案。基于行业首个全链路端到端AI座舱架构,本次发布的全新解决方案彻底颠覆了上一代智能座舱 “意图分域 + 多 Agent协同”的语音助手架构,通过一个AI大脑深度联动整车,打通车控、导航、智驾等关键功能域,实现 "感知 - 推理 - 执行 - 记忆 - 学习" 一体化闭环。新技术架构下,火山引擎面向汽车行业提供两套不同方式的合作方案。其中,AI座舱套件方案基于已经广泛量产落地的豆包大模型智能座舱方案,进一步做了Agentic化的架构升级,车企可以按需灵活配置上车。豆包座舱助手方案是完整的产品级交付,并与豆包APP互联互通、能力同步进化,将在今年年内量产上车。火山引擎总裁谭待发布会上,火山引擎总裁谭待公布了汽车行业最新成绩单。目前,火山引擎已经与100%主流车企合作推动AI创新。搭载豆包大模型的智能汽车已超过700万辆,覆盖超50个汽车品牌、145个车型,搭载量稳居行业第一。用户活跃度也显著提升,豆包大模型日均完成超3000万次座舱交互和服务闭环
-
东风汽车携手火山引擎 共筑未来AI时代新汽车、新生态
4月23日,东风汽车集团有限公司(以下简称东风汽车)与字节跳动旗下云和AI服务平台火山引擎正式签署战略合作协议。此次合作,双方将深度整合东风汽车在整车研发制造领域的深厚积淀,与火山引擎在人工智能、云计算等前沿技术领域的领先优势,围绕智能座舱、企业数智化升级及AI云平台建设等核心领域展开深度合作。此次携手,标志着双方在AI汽车领域的共同探索与创新迈出关键一步,将共同定义和打造下一代“AI Car”,为用户带来前所未有的智慧出行体验。东风汽车与火山引擎签署战略合作协议此次战略合作,双方充分发挥各自的优势,共同打造智能座舱新一代AI交互体验,携手提升商品定义,生态服务等相关能力,让AI能力成为贯穿全价值链业务的“神经网络”,合作由此从单一领域拓展至多维度、深层次。未来,东风汽车与火山引擎将持续深化合作,持续推动豆包大模型、云计算在汽车全产业链的深度融合与创新应用,共同打造面向未来的AI汽车,为中国汽车行业的技术革新、驾乘体验创新注入源源不断的动力。雷峰网
-
导远科技亮相北京车展:以精准时空智能,加速物理AI走向现实
2026年4月24日,2026北京国际汽车展览会(以下简称“北京车展”)启幕。导远科技携多款产品与解决方案亮相,系统展示其在高精度时空智能领域的技术积累与最新成果。导远在车规级量产交付中持续打磨产品力。目前,公司已获得超过30家国际及国内主机厂的量产项目,产品可靠性在数百万智能驾驶单元中得到验证。从芯片到系统,构建时空智能「全栈能力」作为实现车规级惯性芯片设计、标定、测试及系统集成全栈能力的企业,通过贯通微机械结构设计、电路架构、封装工艺到测试与量产的全流程,导远实现了对产品性能与供应链稳定性的掌控。导远将低应力陶瓷气密封装工艺应用于汽车领域。这一工艺提升了惯性芯片的机械稳定性和长期可靠性,使零偏稳定性与长期耐久性提升超过70%,并确保产品在-40℃至125℃全温域环境中保持可靠。同时,该系列芯片不仅符合ISO 26262 ASIL-D功能安全标准,更通过了AEC-Q100车规级认证。此外,导远惯性芯片拥有软硬件协同设计,内嵌误差诊断与补偿机制,实现从传感层开始的数据自验证,为后续算法处理提供高保真的数据源。导远已形成覆盖芯片、IMU/GNSS模组及INS系统的全栈时空智能解决方案,并
-
电商龙虾Accio Work已接入DeepSeek V4、Qwen 3.6等国内领先模型
今天中午DeepSeek V4发布,下午3点记者发现,被称为“电商龙虾”的Accio Work已经接入该模型,成为首批接入DeepSeek V4的Agent工作台。不仅如此,千问的最新模型Qwen 3.6等国产领先模型也均已接入Accio Work。目前用户在Accio Work的模型选择里,就已经能看到DeepSeek V4 Pro和Flash两种模型,其中Pro被标注为“理解与生成更强,适合进阶任务”,与Qwen 3.6 Max的标注相同。据悉,Accio Work是阿里国际面向全球推出的企业级Agent,能7 x 24小时自主运行、处理复杂的商业任务,尤其擅长电商,在中小商家、个人创业者中受到欢迎,有用户称其能30分钟“手搓”出一家全球网店。而近期国内多款模型齐发,均针对Agent能力进行了专门优化。公开资料显示,DeepSeek V4就在发布时提到:“已针对主流的Agent产品进行了适配和优化,在代码任务、文档生成任务等方面表现均有提升。”雷峰网
-
“电商龙虾”Accio Work已接入DeepSeek V4、Qwen 3.6等模型
36氪获悉,4月24日,DeepSeek V4发布。“电商龙虾”的Accio Work已经接入该模型,成为首批接入DeepSeek V4的Agent工作台之一。此外,Qwen 3.6等国产模型也均已接入Accio Work。据了解,Accio Work是阿里国际面向全球推出的企业级Agent,能7 x 24小时自主运行、处理复杂的商业任务。
-
安克创新发布首款存算一体AI芯片Thus™
36氪获悉,近日,安克创新发布首款神经网络存算一体AI音频芯片Thus™。据介绍。该芯片基于NOR Flash技术,原生支持4兆参数模型,实验室测试显示相比传统蓝牙耳机芯片最高可带来150倍AI峰值算力提升。
-
海外研究:360漏洞挖掘智能体能力规模接近Claude Mythos
近日,苏黎世联邦理工学院安全研究中心研究员发布最新研究指出,中国网络安全头部企业360推出的漏洞挖掘智能体已接近Anthropic旗下Claude Mythos的能力规模。研究进一步认为,这类能力有可能转化为“对中国有利的网络攻防非对称优势”,标志着中国在AI漏洞自动发现领域正在形成重要竞争能力。相关研究发布后迅速引发国际安全界关注,彭博社、SecurityWeek、联合早报、Economic Times等多家媒体相继报道,并将360漏洞挖掘智能体视为Claude Mythos的重要竞争者。 公开信息显示,360漏洞挖掘智能体已累计发现超过1000个漏洞,其中50余个被认定为高危漏洞,覆盖Windows内核、Microsoft Office组件、OpenClaw以及多类物联网设备等关键基础设施软件。这意味着漏洞发现正式进入智能体自动化、规模化生产的新阶段。研究同时指出,中国现行漏洞上报制度要求企业优先向国家主管机构提交漏洞信息,使高价值漏洞资源能够在国家层面形成集中优势。相比欧美分散披露体系,这一机制正在把漏洞研究能力转化为国家级安全能力储备,形成制度层面的战略优势。业内分析认为,随着
-
营收增速36%背后:Akamai推理云正靠4400个边缘节点切入AI推理战场
云也在告别互联网时代。这场告别发生在每一层:最底层的IaaS,算力形态从CPU转向GPU加速集群;PaaS层与新兴的MaaS层(模型即服务)融合,企业无需关心模型训练和部署,通过API即可调用AI能力;最贴近用户的SaaS层被一种全新的交互方式取代——给Agent布置一个任务,由它自主决策、独立完成。AI带来的变量不止于此。当黄仁勋直言AI推理的规模将达到AI训练负载的10亿倍时,云的组织逻辑也随之发生改变。推理时代,中心云正在输掉毫秒级算力竞赛在过去,AI训练时代的一切都是集中的——数据、算力、模型,全部可以堆在少数几个超大规模数据中心里。此时玩家之间比拼的,是谁能调集更多GPU、谁能扛住更长的迭代周期。但当AI的重心从训练转向推理时,这套集中式打法不得不面临物理瓶颈。海量、实时、持续涌入的在线请求,是AI推理时代最明显的特征。它背后隐藏着用户对毫秒级响应的期待。 Akamai亚太区云计算架构师总监 李文涛Akamai亚太区云计算架构师总监李文涛指出,以首Token时延为例,大规模多用户在线游戏的玩家要求控制在15毫秒以内,电商个性化推荐约20毫秒,即便是容忍度最高的自动应答机器人,
-
阿里云百炼上线DeepSeek-V4
36氪获悉,4月24日,阿里云百炼平台首发上线DeepSeek-V4-pro和DeepSeek-V4-flash两款模型,API价格与DeepSeek官网一致,百万Tokens输入最低1元,百万Tokens输出最低2元。近期,百炼Token Plan也将支持调用该模型。目前,阿里云百炼已上线等100多款全模态模型。