AI 资讯 · 2026-04-22
-
Token消耗量翻10倍才算企业转型及格线?三位产业一线大佬教你用出性价比
想让大模型替自己卖命,一查Token账单,却有一种“重生之我为大模型公司打工”的错觉。这样的案例,已经开始在不少企业内部上演。尽管过去一年里,每百万Token的推理成本大约下降了75%,但成本下降的曲线远远比不过消耗量增长的斜率。全球最大的大模型API聚合平台OpenRouter统计数据显示,截至2026年3月,其年化Token吞吐量呈现10倍增长。与此同时,资本市场也用脚投票——Anthropic年化收入在短短三个月里突破300亿美元大关,增幅约为233%……面对Token消耗量至少翻了一个数量级的现实,“如何在高效使用Token的同时有效控制成本”的问题随之而来。为此,雷峰网邀请3位来自产业链不同环节的一线大佬共同解读Token膨胀背后的效率账本:尚明栋:九章云极联合创始人兼COO ,原微软服务器高可用集群文件系统核心开发工程师,曾参与发布Windows 7和Windows 8,是SMB 3.0的主要拟草人之一。肖嵘:云天励飞副总裁、首席科学家、正高级工程师,历任微软研究院高级研究员、微软必应搜索资深软件工程师、平安产险人工智能部总经理等。关涛:云器科技联合创始人、CTO,分布式系
-
清华段岳圻团队论文:从调参数到做控制,文生图迎来一次方法论升级丨CVPR 2026
很多人在使用文生图工具时都会遇到类似的情况,输入一段很清晰的描述,希望画面中人物站在左边、动物在右边,或者希望海报上出现一段完整可读的文字,但生成结果却常常让人失望。要么位置关系混乱,要么文字变形,要么整体画面看起来不自然。继续调整参数,有时结果会更接近描述,但画面质量却明显下降,颜色变得奇怪,结构开始扭曲。反复尝试之后,往往需要生成十几张甚至几十张图,才能勉强挑出一张可用的。这种既想让模型听懂指令,又不希望画面被破坏的矛盾体验,已经成为很多用户在实际使用生成模型时的共同感受。随着生成式人工智能逐渐进入设计、电商、内容创作等真实场景,这种问题变得更加突出。用户不再只是追求一张看起来不错的图,而是希望结果稳定、结构正确、细节可靠,可以直接用于实际工作。然而现有方法在可控性和稳定性之间始终存在明显冲突,模型越是强调语义对齐,就越容易牺牲视觉质量,这种内在限制逐渐成为生成模型走向更广泛应用的一道门槛。在这样的背景下,清华大学段岳圻团队提出了《CFG-Ctrl: Control-Based Classifier-Free Diffusion Guidance》这一研究工作,从更底层的角度重新审
-
OpenAI now lets teams make custom bots that can do work on their own
OpenAI is giving users of its Business, Enterprise, Edu, and Teachers plans access to cloud-based "workspace" agents available in ChatGPT that can perform business tasks. In its blog post, OpenAI gives examples of agents like one that finds product feedback on the web and sends a report in Slack and a sales agent that can […]
-
氪星晚报|快手618商家大会于杭州启动 ;OpenAI据悉正洽谈向一家私募股权合资企业投资至多15亿美元;事关节能降碳工作,中办、国办重磅文件对外发布
大公司: 特斯拉AI语音功能即将上线 据网信上海消息,4月21日,上海新增1款已完成备案的生成式人工智能服务,为特斯拉车机语音大模型服务。对此,4月22日,特斯拉方面人士回应称:“敬请期待”。按照规定,已上线的生成式人工智能应用应在显著位置或产品详情页面公示所使用已备案生成式人工智能服务情况,注明模型名称及备案号,并根据《人工智能生成合成内容标识办法》添加生成合成内容标识。(第一财经) 快手618商家大会于杭州启动 36氪获悉,4月22日,快手电商在杭州举办618商家大会,表示2026年全年将投入千亿级别流量扶持优质供给。快手电商数据显示,2025年日均动销商家规模同比增长超15%,全年入驻优质新商同比增长26%,日均动销品牌同比增长34%。用户需求端同步增长,今年3月短视频月均购买用户数同比增长超15%,泛货架月均购买用户数同比增长超17%。 新氧与锦波生物达成战略合作 36氪获悉,4月22日,新氧与锦波生物达成战略合作,锦波生物将旗下新品“薇旖美ColPact”独家专供新氧的线下轻医美门店“新氧青春诊所”。截至目前,“新氧青春诊所”已在全国开设56家门店。据新氧CEO金星透露,公司
-
单Agent时代结束,AI们开始组团上班
Kimi K2.6来了!
-
从GPU到Token:AI基础设施竞争逻辑重构
商汤大装置已实践三年
-
国产多模态Agent拿下医学分割SOTA!不用改模型、不加token
已被CVPR 2026接收
-
Workspace agents
Learn how to build, use, and scale workspace agents in ChatGPT to automate repeatable workflows, connect tools, and streamline team operations.
-
Introducing workspace agents in ChatGPT
Workspace agents in ChatGPT are Codex-powered agents that automate complex workflows, run in the cloud, and help teams scale work across tools securely.
-
Now Meta will track what employees do on their computers to train its AI agents
Meta employees' activity at work is now being used to train the company's AI agents. As reported by Reuters, Meta is installing a tool it calls Model Capability Initiative (MCI) on US-based employees' computers that runs in work-related apps and websites, recording mouse movements, clicks, keystrokes, and occasional screenshots. The data from this tool will […]
-
We're launching two specialized TPUs for the agentic era.
The eighth generation of Google’s TPU includes two specialized chips that will power the future of AI.
-
独家 | 华为19级天才少年赵立晨离职创业,瞄准具身 Agentic OS
雷峰网独家获悉,前华为天才少年、19 级技术专家赵立晨已于2026年3月离职,加入杭州拉格朗日具身技术有限公司。拉格朗日走的是一条区别于其他具身公司的差异化路线,聚焦于具身智能架构研发(Agentic OS)与硬件规模化落地,试图在具身智能最关键、也最难的一层建立优势。01赵立晨是谁据公开信息显示,赵立晨本科、硕士均就读于北航软件工程,长期聚焦 3D 视觉与多模态,相关工作累计引用超过千次,是北航目前唯一入选华为天才少年计划的学生。本科阶段,他两次斩获 ACM-ICPC 东亚区决赛金牌;2021 年,他在商汤参与 INTERN 20B 大模型预训练,属于国内最早一批大规模预训练实践。作为天才少年计划中极少见的校招硕士,赵立晨 2023 年进入华为后,从零搭建起一支 20 多人的团队。他曾获得华为算法大赛亚军,主导 AI 智家宝 Agent 端云架构持续迭代,相关项目斩获中国电信卓越创新奖,并将于 2026 年下半年迎来大规模量产。凭借突出的技术与交付能力,赵立晨在两年多时间内进入 19 级晋升通道,成为华为最年轻的技术高管之一,也是业内少有的算法、架构、工程落地全栈型技术专家。02Ag
-
Making ChatGPT better for clinicians
OpenAI makes ChatGPT for Clinicians free for verified U.S. physicians, nurse practitioners, and pharmacists, supporting clinical care, documentation, and research.
-
死亡率「99%」的芯片创业淘汰赛,为旌科技为何能活下来?
“芯片赛道上挤着这么多公司,淘汰者十之八九,最终只会留下少数几家。”这是为旌科技创始人兼CEO郑军在2021年做出的判断。那一年,公司刚成立不久,这个判断听起来像是一种“冷静过头”的悲观。但回头再看,这句话几乎成了现实的注脚。2020年前后,半导体行业融资金额突破1400亿,同比暴涨近4倍,大量芯片公司在这一时期诞生。2024年,Wind统计的数据显示,国内芯片公司关闭数量超万家。为旌科技诞生于2020年的芯片创业热潮,选择了竞争最激烈的端侧AI芯片赛道,在这场残酷的出清中,成为少数跑出来的样本之一。核心团队出自海思,让为旌科技在起步阶段就具备了打通ISP、NPU到工具链的全栈自研能力,但这只是“入场券”。真正拉开差距的,是其在战略与组织上的持续进化。五年间,为旌科技聚焦智慧视觉与智能驾驶领域,实现业内一流的暗光成像能力、典型模型计算效率数倍于同档位竞品,用实践证明了克制是更高级的效率。凭借独有的技术优势、坚定的产品定力以及穿越周期的组织进化力,为旌科技突破了同行难以进入的头部客户,实现50+量产订单、百万级发货量。为旌科技在智慧视觉和智能驾驶芯片已经站稳脚跟,但新的机遇和挑战已经来临
-
中山大学郭裕兰团队:数据充足却训练失败,多智能体到底卡在哪丨CVPR 2026
很多人其实已经在不知不觉中接触到了多智能体协作带来的变化。电商大促时,仓库里往往不是一台机器人在工作,而是一整组机器人同时分拣、运输、避让和交接。自动驾驶真正困难的地方,也不只是让一辆车学会开,而是让很多辆车在同一条路上彼此配合。现实中的很多复杂任务,本质上都不是单个智能体可以独立完成的,智能系统也是一样。但现实世界并不会给这些系统太多试错机会。仓库机器人撞一次货架,工业机械臂装错一次零件,代价都是真实的。也正因为如此,越来越多研究开始转向离线强化学习,也就是先利用已有数据训练策略,而不是依赖实时试错。可一旦从单智能体走向多智能体,难度会迅速上升,因为系统不仅要学会做决策,还要在反馈有限的条件下学会协作。这正是当前行业里的一个现实瓶颈。很多方法在实验环境里效果不错,但到了离线多智能体场景中,往往很快暴露出问题。一方面,真实任务里的奖励通常非常稀疏,模型很难知道自己到底哪一步做对了。另一方面,多智能体协作还会带来责任分配问题,也就是最后成功了,却很难判断到底是哪一个智能体起了关键作用。结果就是,系统明明有大量历史数据,却依然学不会稳定协作,更谈不上面对新任务时的泛化能力。在这样的背景下,
-
泄露用户隐私!曝某AI助手将B用户简历发给A用户;苹果更换CEO原因曝光;微信宣布5国可用微信支付;航旅纵横「崩」了一天,借钱功能却正常
要闻提示NEWS REMIND1.苹果更换 CEO 原因首次曝光,希望特努斯带回乔布斯时代的决断力2.泄露用户隐私!某AI助手被曝将 B 用户简历发给 A 用户3.微信宣布5国可用微信支付4.招聘页面聚餐图用AI画!BOSS直聘回应:禁止虚假图片5.前小鹏汽车副总裁李力耘加入众擎机器人,出任CTO6.航旅纵横“崩”了一天:核心服务全线瘫痪,借钱功能却正常7.曾月薪9万招人!时隔5年茶颜悦色重返一线城市8.SpaceX招股书草案曝光:2025年营收超150亿美元,马斯克拥有绝对控制权今日头条苹果更换 CEO 原因首次曝光,希望特努斯带回乔布斯时代的决断力4月21日消息,当地时间4月20日,苹果宣布,蒂姆・库克将于今年9月卸任CEO、转任执行董事长,CEO职位由约翰・特努斯接任。4月21日,苹果市值跌破4万亿美元,截至22日凌晨,苹果股价跌1.57%,最新市值3.95万亿美元。著名记者马克・古尔曼披露了此次苹果换帅的核心内幕。报道指出,出任CEO后,特纳斯将采取更加果断的领导风格,这与库克形成了极其鲜明的对比。作为CEO,库克在任期间,对具体的产品决策大多采取放手式管理,绝大多数时候,他都
-
百度Create大会双主论坛议程揭晓,多项重磅升级发布将集中亮相
Create2026百度AI开发者大会将于5月13日至14日在北京国家会议中心二期举办。本届大会迎来战略升级:首次整合“Create 百度AI开发者大会”与“云智大会”,并启用双主论坛全新架构,从企业技术底座、个体应用范式两大维度,全面解码AI智能体规模化落地路径。其中百度集团执行副总裁沈抖将于超级个体主论坛发表主题演讲。业内认为,随着大模型能力与AI基础设施建设持续演进,AI发展正呈现两大趋势:一是加快进入面向企业生产系统的规模化应用阶段,推动底层基础设施与智能体体系协同完善;二是持续向个体生产力延伸,推动新型生产方式与组织形态加速形成。AI已进入企业生产系统与个体生产力同步重构的新阶段。技术与产品主论坛以及超级个体主论坛的设置,正是围绕这一阶段性变化展开。技术与产品主论坛:AI Infra、Agent Infra再升级,重磅发布产业级智能体应用进展据介绍,由百度智能云倾力打造的技术与产品主论坛,将围绕AI Infra与Agent Infra两大方向,系统展示AI从底层能力到产业应用的完整链路,涵盖算力调度、大模型能力及智能体体系等关键环节。在 AI Infra 层面,将重点呈现面向
-
广东:开发高能效人工智能芯片和异构计算架构
36氪获悉,广东省人民政府办公厅发布关于印发《广东省加快推进人工智能全域全时全行业高水平应用行动方案》的通知。支持开展大模型机理研究、人工智能可解释性、复杂系统智能建模等前沿基础理论探索。开展科学计算智能算法、结构化数据智能方法以及跨学科知识推理方法研究。开发高能效人工智能芯片和异构计算架构,开展科学数据的清洗与标注、合成与增强等关键技术研究,开发人工智能关键支撑软件、工具链等。聚焦量智融合关键技术、类脑芯片与新型计算架构、6G与人工智能融合等方向,开展人工智能前沿交叉探索。
-
广东:推动整车企业积极按程序争取L3级自动驾驶车型准入和上路通行试点
36氪获悉,广东省人民政府办公厅印发《广东省加快推进人工智能全域全时全行业高水平应用行动方案》。方案提出,“人工智能+”智能网联汽车。加速智能驾驶规模化应用,依托广州、深圳新能源汽车产业集群优势,加强智能网联部件等零部件布局。加快人工智能在自动驾驶、智能座舱等领域应用,推动整车企业积极按程序争取L3级自动驾驶车型准入和上路通行试点。推进智能网联汽车跨区域测试示范互认机制,有序开展大湾区智能驾驶测试和商业化运营。
-
Google makes an interesting choice with its new agent-building tool for enterprises
Gemini Enterprise Agent Platform takes an interesting approach: It is geared for IT and technical users.
-
Google Cloud launches two new AI chips to compete with Nvidia
Google's newest TPUs are faster and cheaper than the previous versions. But the company is still embracing Nvidia in its cloud — for now.
-
阿里等巨头洽谈投资DeepSeek
据媒体援引四位知情人士透露,腾讯控股和阿里集团正在洽谈投资DeepSeek,这家人工智能新兴公司最近首次开始筹资。一位知情人士透露,DeepSeek目前正寻求以超过200亿美元估值筹集资金。(财联社)
-
谷歌云发布用于人工智能的新型TPU芯片
4月22日,谷歌云发布最新一代张量处理单元(TPU),旨在提升人工智能计算服务的速度和效率。全新TPU系列将推出两个版本:TPU 8t用于创建AI软件,TPU 8i用���运行已创建的AI服务。(界面)