返回

AI周报-20260222:Sonnet 4.6发布、Gemini 3.1推理翻倍、千问3.5打破不可能三角

作者 兴之所志 发布于 2026.02.22 AI周报

本文多数报道采用Axios的“Smart Brevity”新闻体,阅读第一段可概览了解事件本身,后面2-3段是对事件的影响和背景等进行介绍,可根据需要阅读、扫读或直接跳过。

主体结构

  1. AI动态:本周AI领域的核心动态,包括AI产品、AI公司、AI影响和监管等方面的事件。一般10条左右。
  2. 时事要闻:国内外重大政治经济事件。一般5条左右。
  3. 评论观点:新闻事件分析、管理评论等。一般5条左右。
  4. 工具教程:AI、Obsidian和办公工具和教程分享。可能有可能没有。
  5. 随便看看:未归类的不带有信息和知识的内容。可能有可能没有。
  6. 寓形宇内:新闻看多了容易烦躁,看点没什么用的东西缓和一下(目前主要是诗词)。

本文所有新闻报道附有原文链接,微信公众号体系内的文章可直接跳转阅读原文。

本文主要由AI基于网络新闻报道进行提炼,并经人工修改完成

1 AI动态

1.1 36氪独家|豆包DAU破亿,成字节史上推广费用最少的破亿产品

What happened: 36氪独家获悉,字节跳动旗下AI产品豆包的日均活跃用户数(DAU)已突破1亿大关。据字节内部人士透露,豆包的用户增长(UG)及市场推广费用,是字节历史上所有DAU破亿产品中花费最低的。产品的爆发得益于其Seedream生图模型、Seedance生视频模型等功能持续激活创作场景,相关玩法屡次登上热搜,带动每日自然下载量达百万级。

Why it matters: 豆包的迅猛崛起正搅动着国内AI应用市场的竞争格局。面对其强大的流量与优秀的关键指标,其他科技巨头如腾讯、阿里等也在加紧投入,腾讯元宝持续发力推广,阿里则启动了AI to C计划并对其产品进行大力度推广。

Between the lines: 字节跳动是国内较早布局AI领域的公司,豆包APP于2023年8月上线,相较于同年10月推出的Kimi和2024年5月上线的腾讯元宝,获得了抢跑的时间优势,并曾长期霸占APP下载榜榜首。豆包大模型所属的Seed团队被视为公司核心战略业务,在2025年经历了团队整合与组织架构升级,并获得额外期权激励,以聚焦大模型基础研究与应用落地。

What’s next: 据了解,火山引擎将成为2026年央视春晚独家AI云合作伙伴,豆包也将配合上线互动玩法。步入2026年,豆包或将成为推动AI深入亿万民众日常的重要产品。不过,字节内部也有声音认为,豆包的商业化路径尚不明确,且大DAU带来的推理成本对公司利润构成一定压力,但其MaaS服务商业化进展据称已大幅超出预期。

(36氪,2026年2月16日)

总结由 deepseek-ai/DeepSeek-V3.1-Terminus 生成

[[36氪独家|豆包DAU破亿,成字节史上推广费用最少的破亿产品-36氪]] https://36kr.com/p/3609313072153862

1.2 独家:五角大楼威胁惩罚Anthropic

What happened: 美国国防部长Pete Hegseth接近切断与人工智能公司Anthropic的商业联系,并计划将其指定为“供应链风险”。这意味着任何希望与美国军方开展业务的公司都必须切断与Anthropic的联系。一位高级国防部官员表示,此举将确保Anthropic为“迫使我们采取这样的行动付出代价”。

Why it matters: 此类惩罚通常是为外国对手保留的。五角大楼首席发言人Sean Parnell表示,国防部正在审查与Anthropic的关系,并强调合作伙伴必须愿意帮助美军在任何战斗中获胜,这关乎美军和美国人民的安全。

Between the lines: Anthropic与五角大楼就军方使用其Claude模型的条件进行了数月的紧张谈判。Anthropic愿意放宽其当前的使用条款,但希望确保其工具不被用于大规模监视美国人或开发无需人类干预即可开火的武器。五角大楼则认为这些限制过于严格且不切实际,坚持要求军方能够将AI工具用于“所有合法目的”。有消息称,高级国防官员对Anthropic感到不满已有一段时间,并乐于公开挑起争端。

What’s next: 将Anthropic指定为供应链风险,将迫使众多与五角大楼有业务往来的公司证明其工作流程未使用Claude,这可能会造成巨大影响。五角大楼此次对Anthropic的强硬态度,也为与OpenAI、Google和xAI的谈判定下了基调。一位高级行政官员表示,五角大楼有信心其他三家公司会同意“所有合法使用”标准,但熟悉讨论的消息人士称,许多问题仍未决定。

(Axios,2026年2月16日)

总结由 deepseek-ai/DeepSeek-V3.2 生成

[[Exclusive_Pentagon_warns_Anthropic_will_pay_a_price_as_feud_escalates]] https://www.axios.com/2026/02/16/anthropic-defense-department-relationship-hegseth

1.3 Gemini灵魂人物传奇工程师Jeff Dean最新访谈:未来人均50个虚拟实习生,用不上专家了

What happened: 谷歌首席人工智能科学家 Jeff Dean 在近日的深度访谈中分享了关于AI模型发展的前瞻性观点。他表示,大一统模型的时代已经到来,未来将是专用模型与模块化模型的组合,模型知识可以像下载软件包一样安装。他还预测,未来每个人都能拥有50个虚拟实习生,只需管理5个小组即可高效协作。

Why it matters: Dean指出,模型正在变得越来越强,不再需要领域专家,通用模型在绝大多数情况下会胜过专用模型。这种趋势将改变人机协作模式,大幅提升生产效率。同时,低延迟、高能效的硬件发展对AI大规模部署至关重要,未来模型延迟有望比现在低20-50倍。

Between the lines: Dean透露,谷歌通过蒸馏技术让新一代Flash版本达到甚至超越上一代Pro版本的效果,这是维持帕累托前沿的关键。他还强调,谷歌内部采用硬件与模型的协同设计,需要预测未来2-6年的机器学习计算需求,以指导TPU芯片的研发方向。

What’s next: Dean预测,个性化模型能访问用户所有授权数据将带来巨大价值提升,专用硬件将使模型延迟更低、成本更亲民。他认为延迟突破1万token/s后,模型可以进行更深入的思维链推理,生成更高质量的代码,人类可能不再需要直接阅读代码。

(AI前线,2026年2月17日)

总结由 deepseek-ai/DeepSeek-V3.1-Terminus 生成

[[Gemini灵魂人物传奇工程师Jeff_Dean最新访谈未来人均50个虚拟实习生用不上专家了]] https://mp.weixin.qq.com/s/SMTdXyMVpvxrcNmXRcXqeA

1.4 2026年迄今融资超1亿美元的17家美国AI公司

What happened: 根据TechCrunch的统计,在2026年不到两个月的时间里,已有近20家美国AI初创公司完成了单轮1亿美元或以上的巨额融资。其中,有三家公司融资额超过10亿美元,另有14家公司融资额在1亿至10亿美元之间。

Why it matters: 如果2026年头几周的情况可以作为指标,那么AI初创企业市场将迎来又一个巨额融资和高估值的年份。数据显示,美国AI初创公司在2025年通过巨额融资筹集了超过760亿美元。

Catch up quick: 这些巨额融资事件密集发生在2026年1月和2月。例如,在2月,Anthropic宣布完成300亿美元的G轮融资,估值达3800亿美元;Runway完成3.15亿美元E轮融资,估值53亿美元。在1月,Elon Musk的xAI以200亿美元E轮融资开启新年;SkildAI完成14亿美元C轮融资,估值140亿美元。

The big picture: 2026年初创公司是否能取得与2025年相同的成功,还有待时间验证。这些融资活动涵盖了从AI研究实验室、基础设施平台到医疗聊天机器人、语音AI和机器人模型等广泛领域。

(TechCrunch,2026年2月17日)

总结由 deepseek-ai/DeepSeek-V3.2 生成

[[Here_are_the_17_US-based_AI_companies_that_have_raised_100M_or_more_in_2026_TechCrunch]] https://techcrunch.com/2026/02/17/here-are-the-17-us-based-ai-companies-that-have-raised-100m-or-more-in-2026/

1.5 特朗普如何拯救TikTok:一场两年运动的幕后故事

What happened: 2024年11月,特朗普在Mar-a-Lago与Charlie Kirk和TikTok CEO Shou Zi Chew会面,随后在就职日签署行政令暂缓TikTok禁令,最终促成美国投资者收购TikTok美国业务。

Why it matters: 此次会面是特朗普内部人士克服国会和政界对TikTok国家安全担忧的关键胜利。这些内部人士帮助说服特朗普竞选团队在2024年6月开通TikTok账号,并精心策划了将TikTok美国业务出售给美国投资者控股的合资企业的复杂交易。

(Axios,2026年2月17日)

[[How_Trump_saved_TikTok_Backstory_of_a_2-year_campaign]] https://www.axios.com/2026/02/17/trump-tiktok-ban-charlie-kirk

1.6 介绍 Claude Sonnet 4.6

What happened: Anthropic 公司于2026年2月17日发布了其最新的AI模型 Claude Sonnet 4.6。该模型在编程、计算机使用、长上下文推理、智能体规划、知识工作和设计等技能上实现了全面升级,并提供了测试版的100万令牌上下文窗口。对于免费版和Pro版用户,Sonnet 4.6 现已成为 claude.ai 和 Claude Cowork 的默认模型,定价与 Sonnet 4.5 保持一致。

Why it matters: Sonnet 4.6 的性能提升显著,使得许多以往需要调用顶级模型 Claude Opus 才能完成的任务,现在可以用 Sonnet 模型实现,这包括具有实际经济价值的办公任务。早期用户反馈显示,在Claude Code中,用户对Sonnet 4.6的偏好度比Sonnet 4.5高出约70%,甚至在59%的情况下更倾向于选择它而非2025年11月发布的Opus 4.5。此外,该模型在计算机使用技能上相比之前的Sonnet模型有重大改进。

Catch up quick: 在计算机使用领域,Anthropic于2024年10月率先推出了通用计算机使用模型。当时的模型被描述为“仍处于实验阶段”。根据标准基准测试OSWorld的数据,在过去的16个月里,Sonnet系列模型在该测试上取得了稳步提升。Sonnet 4.6的早期用户已经能在处理复杂电子表格或多步骤网页表单等任务中看到接近人类水平的能力。

What’s next: Sonnet 4.6 现已在其所有Claude产品线、API及主要云平台上可用。免费套餐也已默认升级至Sonnet 4.6。对于开发者,可以通过Claude API使用 claude-sonnet-4-6 快速开始。同时,Anthropic指出,对于需要最深度推理的任务,如代码库重构、协调工作流中的多个智能体等,Opus 4.6 仍然是最强的选择。

(Anthropic,2026年2月17日)

总结由 deepseek-ai/DeepSeek-V3.2 生成

[[Introducing_Sonnet_46]] https://www.anthropic.com/news/claude-sonnet-4-6

1.7 OpenAI收购OpenClaw标志着ChatGPT时代开始终结

What happened: OpenAI于2026年2月收购了开源AI智能体项目OpenClaw,其创始人Peter Steinberger宣布加入OpenAI,负责”下一代个人Agent开发”,致力于”为所有人带来智能体”。该项目将转移至一个独立基金会,但OpenAI已提供赞助并可能影响其方向。

Why it matters: 此次收购标志着行业重心正从对话界面果断转向能够浏览、点击、执行代码并代表用户完成任务的自主智能体。对于OpenAI而言,Steinberger的加入将帮助解决Agent产品在易用性、本地执行能力、多Agent协作效率以及场景落地方面的四大短板。

Between the lines: OpenClaw最初名为”ClawdBot”,基于Anthropic的Claude模型构建。Anthropic并未接纳在其平台上构建的社区,反而向Steinberger发出了停止并终止函,要求其更名并切断与Claude的关联,这实际上将这一热门项目推向了其主要竞争对手。OpenClaw具备”本地执行+云端赋能”核心技术及高效的多Agent协作机制,这正是OpenAI现有的以云端为主的Agent产品所缺乏的关键能力。

What’s next: 开源社区的核心关切是OpenClaw在OpenAI旗下是否能保持真正的开放。Steinberger承诺将项目转为基金会结构,Altman也公开表示项目将保持开源。随着Steinberger加入,硅谷的Agent大战将推向高潮,2026年围绕用户留存、付费和生态将是一场恶战。然而,OpenAI面临”人才难留”的老问题,公司内部”产品压倒研究”和”过度追求商业化”的氛围可能成为Steinberger未来需要应对的挑战。

(VentureBeat,2026年2月17日;AGI接口,2026年2月16日)

总结由 deepseek-ai/DeepSeek-V3.2 生成

[[OpenAIs_acquisition_of_OpenClaw_signals_the_beginning_of_the_end_of_the_ChatGPT_era]] https://venturebeat.com/technology/openais-acquisition-of-openclaw-signals-the-beginning-of-the-end-of-the

[[OpenAI急迫招入OpenClaw之父解决四个问题]] https://mp.weixin.qq.com/s/G2aIIMqUgaxD_nBDTl9KDw

1.8 Qwen3.5:迈向原生多模态智能体

What happened: 阿里巴巴旗下千问大模型团队于2026年2月16日(除夕)正式发布Qwen3.5系列模型,并推出首款开放权重模型Qwen3.5-397B-A17B。该模型总参数量达3970亿,单次推理激活参数仅170亿,性能在MMLU-Pro(87.8分)、GPQA(88.4分)等多项基准测试中超越Gemini-3-Pro、GPT-5.2等顶级闭源模型。模型采用创新的混合架构,结合线性注意力(Gated Delta Networks,获NeurIPS 2025最佳论文奖)与稀疏混合专家(MoE)技术,支持1M token上下文长度和原生多模态能力(含2小时视频理解)。阿里云百炼平台同时公布其API定价为百万Tokens输入低至0.8元,仅为GPT5.2的1/15、Gemini-3-pro的1/18。语言与方言支持从119种扩展至201种。

Why it matters: Qwen3.5打破了行业长期存在的”顶级性能、完全开源、极致性价比”不可能三角,其开源生态已覆盖400余个模型,全球下载量突破10亿次。Qwen3.5-Plus部署显存占用降低60%,在32k/256k上下文长度下的解码吞吐量分别是Qwen3-Max的8.6倍/19.0倍,显著降低了部署与推理成本,使中小企业能以极低成本落地AI应用,有望改变闭源模型垄断高价API的行业格局。

Between the lines: 模型突破依赖阿里全栈协同能力:平头哥自研芯片针对MoE架构优化,阿里云提供算力支撑,千问团队通过注意力门控机制解决长上下文衰减问题。其多模态能力基于文本+视觉混合数据联合训练,实现了真正的原生多模态理解能力(非分步拼接方案)。相较于Qwen3系列,Qwen3.5的性能提升主要源于对各类强化学习任务和环境的全面扩展,更加强调RL环境的难度与可泛化性。团队还通过异构基础设施实现高效的原生多模态训练,在混合文本-图像-视频数据上相比纯文本基线达到近100%的训练吞吐。

What’s next: 千问3.5仅是阿里春节档开源计划的第一弹,接下来将继续开源多款可部署于本地、端侧等不同场景的模型,旗舰版Qwen3.5-Max将在年后压轴登场。团队下一阶段的重点将从模型规模转向系统整合,计划构建具备跨会话持久记忆的智能体、面向真实世界交互的具身接口及自我改进机制。普通用户可免费体验千问3.5模型,开发者可前往魔搭社区或HuggingFace下载部署。

(千问大模型,2026年2月16日;极客公园,2026年2月16日;量子位,2026年2月16日)

总结由 deepseek-ai/DeepSeek-V3.1-Terminus 生成

[[Qwen3.5:迈向原生多模态智能体]] https://mp.weixin.qq.com/s/AAanKh5uiCuvFVMAP4nIvw

[[千问_35用第一性原理打破大模型的不可能三角_20260218_171354]] https://mp.weixin.qq.com/s/oSd2LwrFzYuUmvfy62tXTQ

[[最强开源大模型除夕登场397B参数千问35超越Gemini_3百万Tokens低至8毛_20260218_171429]] https://mp.weixin.qq.com/s/xasS3qkNcr8ZwaYWob1KRA

1.9 Sam Altman与Dario Amodei在AI峰会上拒绝握手,此前OpenAI与Anthropic在超级碗广告战中激烈交锋

What happened: 2026年2月19日,在印度新德里举行的AI影响峰会上,OpenAI首席执行官Sam Altman与Anthropic首席执行官Dario Amodei在合影环节出现尴尬一幕。印度总理纳伦德拉·莫迪(Narendra Modi)举起Altman的手示意合影,但并肩而站的Altman和Amodei既没有握手,也没有眼神交流。当谷歌的Sundar Pichai和Meta的AI负责人Alexandr Wang等人手拉手拍照时,这两位竞争对手公司的CEO只是举起了拳头。Altman事后对记者表示,他当时很困惑,不确定该做什么。

Why it matters: 这一公开场合的紧张关系凸显了两人破裂关系的程度,以及这种关系如何升级为激烈的竞争。尽管几年前这两位CEO还曾是同一团队的成员,但如今他们的对立日益公开化。此次尴尬的握手事件发生在两家公司超级碗广告冲突不到两周后,表明双方的不和仍在持续。

Catch up quick: Altman与Amodei并非一直是竞争对手。Amodei曾在2016年至2020年间在OpenAI的Altman手下工作,离职前担任研究副总裁,专注于AI安全。2021年,Amodei与他的妹妹兼联合创始人Daniela Amodei以及其他十几名前OpenAI员工共同创立了Anthropic,其使命是将安全放在首位。2023年11月,当Altman被突然罢免OpenAI CEO职务时,董事会曾接洽Amodei以取代他,甚至考虑合并两家AI初创公司,但据报道Amodei拒绝了这两项提议。

The big picture: Anthropic已迅速发展成为OpenAI的强大竞争对手,员工从初创时的十几人增长到超过2500人,并获得了来自谷歌、Salesforce和亚马逊等公司的数十亿美元融资。上周,该公司在一轮融资中筹集了300亿美元,使其投后估值达到3800亿美元,成为全球最有价值的私营公司之一。Altman与Amodei之间的事件表明,他们仍陷于一场争夺AI主导权的高风险公开竞争中。

(Fortune,2026年2月19日)

总结由 deepseek-ai/DeepSeek-V3.2 生成

[[Sam Altman and Dario Amodei refused to hold hands at an AI summit weeks after OpenAI and Anthropic clashed in a tense Super Bowl ad war]] https://fortune.com/2026/02/19/openai-anthropic-sam-altman-dario-amodei-refused-to-hold-hands-ai-super-bowl-ad-war-ceos-big-tech-conflict/?utm_source=tldrai

1.10 沙特阿拉伯Humain公司向马斯克的xAI投资30亿美元

What happened: 沙特阿拉伯的人工智能公司Humain于2月18日宣布,已向埃隆·马斯克(Elon Musk)的人工智能初创公司xAI投资30亿美元。这笔投资是xAI总额200亿美元融资轮的一部分,该轮融资在xAI被马斯克的太空探索公司SpaceX收购前不久完成。根据彭博社估算,Humain将持有合并后总价值约1.25万亿美元的新公司约0.24%的股份。

Why it matters: 这笔交易强化了马斯克与沙特阿拉伯的关系,该国已将人工智能作为其经济多元化、摆脱石油依赖的核心支柱。同时,这也为运营X社交平台和Grok聊天机器人的xAI提供了一个现成的客户,因为Grok在采用率上落后于OpenAI的ChatGPT,且xAI的商业版图仍在建设中,此前主要专注于政府合同。

Catch up quick: Humain成立于2025年,背后有沙特万亿美元主权财富基金公共投资基金(Public Investment Fund)的支持,并一直在积极进行交易,以建立训练和运行AI模型所需的基础设施和算力。此前,Humain已投资了AI视频生成初创公司Luma AI,并与芯片制造商Advanced Micro Devices Inc.和思科系统公司(Cisco Systems Inc.)成立合资企业,以提升沙特的数据中心容量。

The big picture: 科威特、卡塔尔、沙特阿拉伯和阿拉伯联合酋长国的主权财富基金控制着超过4万亿美元的资产,这些石油资源丰富的国家中有许多已将人工智能置于其经济多元化的核心位置,使其成为这个有望重塑日常生活许多方面的行业的关键参与者。例如,卡塔尔投资局(Qatar Investment Authority)在9月投资了Anthropic,而阿布扎比的MGX则是该AI公司最新一轮融资的联合领投方。

(Bloomberg,2026年2月18日)

总结由 deepseek-ai/DeepSeek-V3.2 生成

[[Saudi_Arabias_Humain_Invests_3_Billion_Into_Musks_xAI]] https://finance.yahoo.com/news/saudi-arabia-humain-invests-3-123558006.html

1.11 AI领域出现新网络俚语“AI;DR”

What happened: 随着互联网上AI生成内容泛滥,网络用户近期开始使用新俚语“AI;DR”(全称为“AI, didn’t read”)来标识或嘲讽低质量AI内容。该术语源自经典网络用语“TL;DR”(too long; didn’t read),近期通过Threads等平台帖子引发关注,并在Bluesky等社交媒体获得一定传播。

Why it matters: 这一现象反映了公众对AI生成内容泛滥的日益不满。词典出版商Merriam-Webster将“slop”(低质内容)评为2025年度词汇,印证了AI技术快速普及引发的强烈反弹。程序员Sid在博客中指出,写作是洞察他人思维的直接窗口,而外包给大语言模型(LLM)的内容失去了阅读价值。

Between the lines: “AI;DR”并非全新概念,但此前未能流行。当前其再度兴起恰逢反AI情绪达到新高,尽管全球经济仍在持续加大对AI技术的投资。部分用户采取“半杯满”视角,认为至少越来越多人选择不再忽视低质内容,而是直接批评传播者。

What’s next: 网络社区正积极推广这一术语的使用,有用户明确表示“我们需要快速采纳这个说法”。这种集体行动表明用户群体正在形成主动识别和抵制AI低质内容的共识机制。

(Futurism,2026年2月16日)

总结由 deepseek-ai/DeepSeek-V3.1-Terminus 生成

[[There’s a Grim New Expression AI;DR]] https://futurism.com/artificial-intelligence/aidr-meaning

1.12 一场春节突袭阿里改写了AI战局

What happened: 2026年2月初春节假期期间,阿里巴巴在B端与C端同时发力,实现了AI业务的突破。除夕当天,阿里突袭式发布了新一代大模型Qwen 3.5,其中Qwen 3.5-Plus版本以极低的推理成本(API价格为0.8元/百万Token)提供了高性能。在C端,千问App通过“春节30亿免单”活动,要求用户通过AI指令完成购物等实际任务,活动期间全国超过1.3亿人首次体验AI购物,累计发出50亿次“千问帮我”指令,千问DAU飙升至7352万。

Why it matters: 这场春节战役标志着中国AI应用竞争从“群雄逐鹿”进入“千豆争霸”的双雄格局。阿里不仅获得了庞大的用户基数,更重要的是培养了用户“有事找AI”的心智习惯,这将重构未来的商业逻辑和超级入口的竞争维度。对于企业用户而言,Qwen 3.5极致的性价比为AI大规模商业化设定了新的起跑线。

Between the lines: 阿里的爆发并非单纯依靠营销投入,而是其“自研芯片+云平台+大模型”全栈垂直整合能力的集中体现。阿里内部遵循CEO吴泳铭提出的AI发展“三阶段”理论,前期专注于模型性能的“智能涌现”阶段,通过开源策略构建了全球最大的开源大模型生态。当模型智能跨过临界点后,才在C端推动“自主行动”的商业化落地。

What’s next: 春节战役后,中国AI竞争的焦点已从“生成答案”转向“生成行动”。阿里凭借其电商、物流、支付等物理世界的履约能力,将AI竞争拉入了现实商业场景。未来真正的考验在于补贴退潮后,如何凭借产品能力留住用户,而阿里通过此次活动获得的海量真实场景数据,将加速其AI在处理复杂指令方面的进化。

(虎嗅APP,2026年2月17日)

总结由 deepseek-ai/DeepSeek-V3.1-Terminus 生成

[[一场春节突袭阿里改写了AI战局_20260218_171032]] https://mp.weixin.qq.com/s/zGVxpUB4wQ3QDP17EMjHWg

1.13 马年春晚背后的科技大战揭秘

What happened: 2026年马年央视春晚及地方卫视春晚成为AI与机器人技术的集中展示平台,松延动力、宇树、魔法原子、银河通用等人形机器人企业以及字节跳动、华为等科技公司深度参与节目制作与演出,机器人表演涵盖小品、武术、舞蹈、烹饪等多样化场景,AI技术则应用于视频生成、实时字幕、舞美渲染等环节。

Why it matters: 这场晚会被观众戏称为“机器人春晚元年”,不仅刷新了多项技术表演纪录,更完成了大规模的前沿科技普及,将AI和机器人技术推向全民视野,预示着这些技术正从实验室演示加速走向大众生活应用,可能对未来科技产业发展产生深远影响。

Between the lines: 春晚历来是技术应用的先行试验场,此次科技企业密集亮相的背后,是行业希望通过这一高曝光平台展示技术成熟度与商业化潜力,同时反映出AI与机器人技术已逐步具备实际落地能力,从“炫技”转向功能性参与。

What’s next: 随着AI被直接嵌入内容制作链条、机器人承担完整表演任务,这类技术有望更快速地渗透至文娱制作、日常生活及工业生产等多个领域,加速技术普及与产业融合进程。

(智东西,2026年2月17日)

总结由 deepseek-ai/DeepSeek-V3.1-Terminus 生成

[[在AI和机器人里找节目马年春晚背后的科技大战揭秘]] https://mp.weixin.qq.com/s/XXMHgGqpuj3SY26eIa6VBA

1.14 在您的聊天中引入 Manus:您的个人 Agent,随时随地

What happened: 2026年2月16日,AI公司Manus(现为Meta的一部分)宣布推出“Manus Agents”,用户现可直接在Telegram等消息应用中访问和使用其完整的AI助手功能。该服务旨在让用户无需复杂设置即可通过聊天界面启动多步骤任务、处理文件并使用各种工具。

Why it matters: 这一产品旨在消除个人AI代理通常所需的复杂设置、持续维护和不可预测成本等使用障碍,让用户能专注于AI的功能本身。它将完整的Manus平台能力带入了用户日常沟通的场所,意味着用户可以通过简单的消息交互来完成研究、数据处理、创意生成等复杂工作。

Catch up quick: 个人AI助手集成到聊天应用中的概念并非全新,但此前大多数解决方案存在设置复杂和维护困难的问题。Manus Agents的设计正是为了应对这些挑战,其核心目标是让用户的AI助手能在他们已经进行沟通的地方被随时访问。

What’s next: Telegram是Manus Agents首个支持的平台,该功能已向所有订阅层级的用户开放。公司表示,正在积极开发对其他消息平台的支持,并将在可用时分享更新。

(manus.im,2026年2月16日)

总结由 deepseek-ai/DeepSeek-V3.2 生成

[[在您的聊天中引入_Manus您的个人_Agent随时随地]] https://manus.im/zh-cn/blog/manus-agents-telegram

1.15 字节跳动在春节点亮自己的 ChatGPT 时刻

What happened: 2026年农历春节前后,字节跳动通过其火山引擎平台冠名央视春晚,并首次将AI技术深度融入晚会制作与互动环节。除夕当晚,其视频生成模型Seedance 2.0、豆包大模型2.0及图像创作模型Seedream 5.0 Lite等技术应用于春晚舞美视效、机器人交互及观众互动中,观众需通过豆包App生成图片或文字以获取红包,豆包当日AI总互动量达19亿次。

Why it matters: 此次合作标志着AI技术首次全面渗透至春晚这一国民级活动,字节跳动试图借此创造关于AI的集体记忆,并向外界传递其AI战略不仅是开发应用,更是服务于各产业。官方数据显示,豆包大模型在火山引擎上的日均Token处理量已超50万亿,外部客户规模超过100家,反映出其技术落地与商业化进展。

Between the lines: 与移动互联网时代靠红包补贴拉动增长的逻辑不同,AI产品的体验提升依赖底层模型能力而非用户规模。字节跳动CEO梁汝波曾指出,豆包未呈现“越多人用越好用”的特性,因Chatbot类产品难以通过普通用户数据优化模型,且算力成本随用户量线性增长,而非摊薄。

What’s next: 字节跳动于2025年设立代号“Seed Edge”的AGI前沿研究项目,旨在进行长期基础研究,并放宽考核周期。公司将以技术跃迁为核心,通过更长周期的ROI评估推动AI产品发展,试图在AI时代复现类似Google Chrome或ChatGPT的“硬实力”突破。

(晚点LatePost,2026年2月17日)

总结由 deepseek-ai/DeepSeek-V3.1-Terminus 生成

[[字节跳动在春节点亮自己的 ChatGPT 时刻]] https://mp.weixin.qq.com/s/4XK4mTtGb_rxpjxm4Lcjlg

1.16 谷歌要重夺王座:Gemini 3.1 Pro推理分数翻倍,幻觉率继续下降,价格不变

What happened: 谷歌于2026年2月19日发布了新一代AI模型Gemini 3.1 Pro。该模型在衡量核心推理能力的ARC-AGI-2测试中得分达到77.1%,较前代Gemini 3 Pro的31.1%翻倍提升,同时AA-Omniscience幻觉率下降38%。新模型已以预览版形式上线,定价维持输入每百万tokens 2美元起、输出每百万tokens 12美元起。

Why it matters: 第三方机构Artificial Analysis测试显示,Gemini 3.1 Pro在10项智能评估中6项排名第一,综合智能指数超越Claude Opus 4.6。其”加量不加价”策略显著降低企业使用成本——跑完同等测试集的费用不足Claude Opus 4.6的一半。谷歌CEO桑达尔·皮查伊(Sundar Pichai)强调该模型擅长将创意项目转化为现实。

Between the lines: 新模型引入”三级思考”模式(低/中/高),用户可依任务难度调节算力分配。此举解决了开发者需维护多模型的痛点,且高端模式直接集成Deep Think的深度推理功能。谷歌DeepMind负责人戴密斯·哈萨比斯(Demis Hassabis)指出,此举旨在强化模型”真正的正确性”而非表面流畅度。

What’s next: 研究人员姚顺宇透露”后续还会有更好的模型持续推出”。目前Gemini 3.1 Pro已部署于Google AI Studio、Vertex AI等平台,普通用户可通过Gemini应用或NotebookLM体验,企业客户可在Vertex AI和Gemini Enterprise中调用。

(腾讯科技,2026年2月20日)

总结由 deepseek-ai/DeepSeek-V3.1-Terminus 生成

[[谷歌要重夺王座Gemini_31_Pro推理分数翻倍幻觉率继续下降价格不变]] https://mp.weixin.qq.com/s/hFPuvm1bcYIp6z2BvlSfCw

1.17 豆包千问疯狂撒钱月之暗面疯狂搞钱

What happened: 据《智能涌现》独家获悉,人工智能公司月之暗面(Moonshot AI)在近期完成的超7亿美元融资中,新增了凯辉基金作为股东,且老股东高榕创投也参与其中。此外,该公司在以超过100亿美元估值开启的新一轮融资中,已收到多家投资机构的意向,其中包括欧洲背景的海外基金。

Why it matters: 此次融资局面被知情人士形容为“抢”,反映出市场对头部大模型公司的高度追捧。自智谱和MiniMax在港股IPO后市值大幅上涨(分别超过2200亿港元和2600亿港元),一级市场投资者对大模型资产的热情被进一步点燃,月之暗面等未上市公司的估值差距为资本提供了潜在的套利空间。

Between the lines: 月之暗面自2025年下半年起采取滚动融资策略,估值在短短两个月内翻了超过2.2倍。这一策略转变的背景是,二级市场通过智谱和MiniMax的成功上市,为大模型公司提供了明确的估值锚点,促使未上市初创公司迅速抬高估值以吸引资金。

What’s next: 面对大厂通过巨额补贴抢占AI应用市场的竞争压力,大模型创业公司需持续投入巨额资金以维持技术领先地位。阶跃星辰董事长印奇指出,基模研发每年需要30亿至50亿元的资金投入,才能确保公司留在竞争牌桌上。

(智能涌现,2026年2月18日)

总结由 deepseek-ai/DeepSeek-V3.1-Terminus 生成

[[豆包千问疯狂撒钱月之暗面疯狂搞钱_智能涌现独家_20260218_164106]] https://mp.weixin.qq.com/s/hTv5bJQIgF5WK-IZzRcSBA

2 时事要闻

2.1 福特号航母战斗群抵达地中海,为打击伊朗带来更多潜在选项

What happened: 美国海军”杰拉尔德·R·福特”号航母打击群于2026年2月20日(周五)通过直布罗陀海峡,进入地中海。该打击群包括”福特”号航母及其护航驱逐舰,此举在美国与伊朗紧张局势升级的背景下,增强了美国在中东地区的空中打击能力部署。

Why it matters: 分析人士指出,尽管美军在地中海和中东的海上力量规模未达到2003年伊拉克战争或海湾战争的水平,但”福特”号与已在阿拉伯海部署的”亚伯拉罕·林肯”号航母打击群形成了双航母存在,为总统特朗普应对德黑兰提供了强大的军事选项。美国海军分析人士Steven Wills表示,根据潜在打击行动的节奏和航母武器库存,其搭载的航空联队可进行持续约一周的打击。

Between the lines: 美国正致力于与伊朗达成协议,以终止其核项目并清除浓缩铀等。本周早些时候在日内瓦的会谈取得了进展,但特朗普总统在周四暗示,美国对伊朗的行动可能最快在10天内发生。他声称,”我们要么达成协议,要么对他们来说将是不幸的”。”福特”号此前在加勒比海执行任务,于上周被命令调往中东,这是该航母近期的最新任务调整。

What’s next: 分析人士James Holmes认为,”福特”号很可能在东地中海暂停,以协助防御以色列,但也可能加入印度洋的”林肯”号编队组成一支战斗舰队。专家也指出,伊朗海军及其革命卫队海军拥有大量导弹武装的小型舰艇,并且储存有大量水雷,可能威胁美国部队或封锁霍尔木兹海峡,这将对美军构成挑战。

(Stars and Stripes,2026年2月20日)

总结由 deepseek-ai/DeepSeek-V3.2 生成

[[Ford carrier group arrives in Mediterranean, bringing more potential strike options against Iran]] https://www.stripes.com/branches/navy/2026-02-20/ford-middle-east-mediterranean-iran-20813486.html?utm_source=newsletter&utm_medium=email&utm_campaign=newsletter_axiosam&stream=top

2.2 泽连斯基告诉BBC普京已发动第三次世界大战且必须被阻止

What happened: 乌克兰总统泽连斯基(Volodymyr Zelensky)在基辅接受BBC采访时表示,俄罗斯总统普京(Vladimir Putin)已经发动了第三次世界大战,必须通过强大的军事和经济压力迫使其后退。他坚决反对为达成普京要求的停火协议而付出代价,即放弃俄罗斯虽牺牲数万士兵也未能夺取的战略土地。

Why it matters: 泽连斯基认为,阻止普京占领乌克兰不仅是乌克兰的胜利,也是全世界的胜利,因为普京不会止步于乌克兰。他强调,俄罗斯意图将其生活方式强加于世界,改变人们自己选择的生活。

Between the lines: 泽连斯基指出,普京要求的停火可能只会让其暂时满足并获得喘息之机,预计恢复期短则一两年,之后战争很可能继续。他还表示,在没有获得美国国会批准的长达数十年的安全保障之前,不考虑美国提出的在夏季前举行大选的要求。

What’s next: 泽连斯基描述结束战争的策略是“多条平行轨道”并进,而非单一途径,他认为其中一条轨道将带来成功。当前最紧迫的问题是防空,他正寻求获得许可在乌克兰本土生产美国武器,如爱国者防空系统,但合作伙伴尚未批准。

(BBC News,2026年2月22日)

总结由 deepseek-ai/DeepSeek-V3.1-Terminus 生成

[[Resilient_Zelensky_tells_BBC_Putin_has_started_WW3_and_must_be_stopped]] https://www.bbc.com/news/articles/cvgj9p15y87o

2.3 特朗普关税政策面临最高法院裁决

What happened: 美国最高法院可能在2月20日当周的周五(即2月21日)就前总统特朗普的关税政策做出裁决,决定其命运。该裁决原被期待能迅速出炉,但不确定性已持续了超出预期的时间。

Why it matters: 这一决定无论结果如何,都可能扰乱全球经济。根据卡托研究所的数据,2025年超过60%的关税收入源于根据《国际紧急经济权力法》征收的关税,而该法案此前从未被用于实施关税。这些关税一直是特朗普去年谈判的贸易协议和框架的核心。

Between the lines: 去年11月,最高法院在口头辩论中对政府为关税辩护的理由表示怀疑,首席大法官约翰·罗伯茨指出关税是“对美国人征税,而这历来是国会的核心权力”。自那以后,出现了显著的经济和政治动向:2025年美国商品贸易逆差创下历史纪录,尽管有关税存在,逆差仍在扩大;此外,本月早些时候,数名共和党人与民主党人一起投票支持取消对加拿大的关税,这是对特朗普标志性经济政策的罕见反对。

What’s next: 如果最高法院裁定部分或全部关税不合法,可能引发向已支付被推翻关税的公司进行退款的混乱过程,并影响国家财政前景。国会预算办公室估计,更高的关税将在未来十年减少3万亿美元的赤字。政府已承诺将利用其他贸易权力重新实施任何被推翻的关税,但所需时间尚不清楚。若最高法院周五未做出裁决,下一个可能的裁决日期是下周二和周三。

(Axios,2026年2月20日)

总结由 deepseek-ai/DeepSeek-V3.2 生成

[[Trumps_tariffs_near_their_fate_before_the_Supreme_Court]] https://www.axios.com/2026/02/20/trump-tariffs-supreme-court-ruling

3 评论观点

3.1 春节AI模型大战谁是最大赢家

What happened: 2026年春节前后,多家国内外AI公司密集发布新模型。1月27日,月之暗面开源Kimi K2.5,实现100个子智能体并行协作;2月7日,字节上线视频生成模型Seedance 2.0,具备多模态参考系统;2月11日,智谱AI发布GLM-5,在全球权威榜单中位居全球第四、开源模型第一。同期,阿里、DeepSeek、生数、银河通用、智源等国产模型,以及OpenAI、Anthropic等海外厂商也纷纷推出新品。

Why it matters: 这轮发布标志着国产大模型从追求基准测试分数的“做题家”向处理复杂任务的“实干派”转型。模型不再仅提供答案,而是独立完成理解需求、拆解任务、调用工具到交付成果的全流程。春节假期丰富的家庭聚会、出行规划、内容创作等场景,为模型提供了真实环境下的压力测试,其实际执行能力已成为企业采购决策的核心考量。

Between the lines: 国产模型领跑者高度聚集在北京海淀区,形成创新生态。该区域拥有清华、北大等高校的人才输出,寒武纪等企业的算力支撑,以及大量场景型企业提供的测试环境。这种“全栈覆盖”的产业链布局,使得技术迭代周期显著缩短。政策上,海淀区已提出建设3500亿元规模的核心产业集群,并配套“耐心资本”支持早期硬科技项目。

The big picture: 春节档AI大战推动全球巨头如OpenAI、Google转向企业级高性价比模型。国产模型迭代周期从年缩短至月或周,为中国AI产业提供弯道超车窗口期。未来,大模型从“对话工具”进化为“数字员工”,将要求政策层面建立适配新技术形态的治理框架。

(虎嗅APP,2026年2月20日)

总结由 deepseek-ai/DeepSeek-V3.1-Terminus 生成

[[春节AI_模型大战谁是最大赢家]] https://mp.weixin.qq.com/s/hr_yffJVRYQtLU5Ta2znHQ

3.2 AI是否存在零和博弈问题?

What happened: 在印度AI影响力峰会上,OpenAI的Sam Altman与Anthropic的Dario Amodei在舞台合影环节拒绝握手,这一画面在网络上广泛传播。作者Kevin Xu指出,这一时刻直观地体现了AI领域日益凸显的“零和博弈”问题,即“我赢你输”的对抗性叙事正渗透到公众意识中。

Why it matters: 这种零和博弈心态正从多个层面影响社会。在资本市场,即便AI编码工具能创造更多软件,市场反应(如“SaaS末世”股价暴跌)却暗示其以牺牲其他软件公司为代价。在劳动力市场,AI代理更多被视为取代或与人类竞争,导致企业冻结招聘或强制员工使用AI。此外,美国乡村地区的数据中心建设潮也引发当地居民反对,他们认为这些设施并未带来持久利益,反而造成干扰。

Between the lines: 作者将AI的零和博弈问题与全球化进程相类比。两者都创造了扩散的广泛利益,但代价却由少数群体集中承担,导致被冲击者组织起来集体发声和反抗。台积电创始人张忠谋三年前关于“全球化几乎已死”的论断,如今因其公司生产的芯片可能助长新一轮民粹主义而显得颇具讽刺意味。

What’s next: 尽管AI实验室努力讲述关于“丰裕”的故事,但技术加速过快,社会没有投入足够资源帮助人们适应其弊端。过去的“再培训”方案在AI时代可能更加不切实际。数据中心建设为当地带来的就业和经济利益仅是暂时的,项目结束后繁荣便会消退。作者认为,每位AI领袖都应研究为何全球化在带来巨大经济利益后却成为民粹主义的抨击对象,因为AI可能是下一个。

(Interconnected,2026年2月19日)

总结由 deepseek-ai/DeepSeek-V3.2 生成

[[Does_AI_Have_a_Zero-Sum_Problem]] https://interconnected.blog/does-ai-have-a-zero-sum-problem/

3.3 OpenAI将如何竞争?

What happened: 知名科技分析师Benedict Evans于2026年2月19日发表分析文章,指出OpenAI在引领大语言模型(LLM)热潮后,正面临四大核心战略挑战。文章认为,OpenAI在技术上并无独特优势,其庞大的用户基础(约8-9亿用户)存在参与度浅、粘性不足且缺乏网络效应的问题,而谷歌(Google)、Meta等既有巨头已实现技术追赶并正利用其产品和分销优势争夺市场。

Why it matters: Evans指出,当前有约半打组织在发布能力相当的尖端模型,并每隔数周相互超越,尚无已知机制能让一家公司获得他人无法企及的持久领先优势。OpenAI的用户虽多,但数据显示80%的用户在2025年发送的消息少于1000条,平均每日提示不足3次,使用频率低且付费用户比例仅约5%,表明其产品与市场契合度仍不明确。与此同时,谷歌的Gemini和Meta AI正凭借品牌和分销优势快速获取市场份额。

Between the lines: 文章分析,OpenAI产品负责人Fidji Simo曾描述其工作流程是实验室研究人员先取得突破,产品团队再思考如何将其应用于聊天或企业产品中,这反映了其产品路线图并非由产品战略主导。Evans认为,Sam Altman近期的诸多动作,如宣布巨额资本支出计划、尝试构建全栈平台等,可被视为其深刻意识到挑战,并试图在竞争格局固化前,将公司的“纸面优势”转化为更持久的战略地位。

What’s next: OpenAI提出了一种类似Windows或iOS的全栈平台战略愿景,希望通过从芯片到应用层的垂直整合,构建一个具有网络效应和生态系统的防御性平台。然而,Evans质疑这一类比是否恰当,因为云基础设施本身并未赋予其对上层应用的控制力或杠杆效应。未来,AI的价值和杠杆可能更多来自于尚未被发明的新体验,而整个科技行业都在竞相创造这些体验,OpenAI无法独自发明所有一切。其能否建立持久的竞争优势,仍是一个悬而未决的问题。

(Benedict Evans,2026年2月19日)

总结由 deepseek-ai/DeepSeek-V3.2 生成

[[How_will_OpenAI_compete_Benedict_Evans]] https://www.ben-evans.com/benedictevans/2026/2/19/how-will-openai-compete-nkg2x

3.4 Dwarkesh Patel 2026年对Dario Amodei的播客访谈

What happened: 2026年2月,Anthropic首席执行官Dario Amodei在播客主持人Dwarkesh Patel的节目中,重申了他对人工智能能力将“极其快速”进步的预测,包括预计“数据中心里的天才”可能在几年甚至今年内出现。他透露,Anthropic的收入从2023年的零增长到2025年的90-100亿美元,并可能在2026年实现盈利。

Why it matters: Amodei认为,即使AI能编写90%的代码,软件工程师也不会失业,而是转向更高层次的管理工作,但长期来看对软件工程师的需求可能会减少90%。他预测AI编码模型目前能带来15%-20%的效率提升,并最终通过闭环实现更大的增速。在监管方面,他呼吁加强安全与透明度立法,并支持对芯片实施出口管制以保持对中国的优势。

Between the lines: 访谈显著淡化了AI的灾难性和生存风险,几乎没有讨论对齐问题。尽管Amodei对能力进步极为乐观,但Anthropic的商业决策显得更为保守。他解释称,在年增长10倍的指数级环境中,过度扩张是致命的,因此有必要进行保守投资,除非准备“破釜沉舟”。这反映出其公开言论与公司实际行动之间存在张力。

What’s next: Amodei预测,未来几年将出现一个由少数相关公司组成的寡头垄断市场,而非一家独大,类似于云服务提供商格局。他非常有信心“天才”级别的AI将在2028年前出现,并认为在此之后,机器人技术可能只需额外一两年就能取得突破。他预计AI公司的巨额亏损源于为下一代成本激增的模型投入,一旦计算规模停止每年10倍的增长,盈利便会显现。

(Don’t Worry About the Vase,2026年2月16日)

总结由 deepseek-ai/DeepSeek-V3.2 生成

[[On_Dwarkesh_Patels_2026_Podcast_With_Dario_Amodei]] https://thezvi.wordpress.com/2026/02/16/on-dwarkesh-patels-2026-podcast-with-dario-amodei/

3.5 稀缺陷阱:为何AI仍像一种计量付费的公共事业

What happened: 2026年,人工智能(AI)的典型体验并非革命性界面,而是使用限制屏幕。一位用户分享的截图显示,一款流行的AI编程助手在完成两项小型编码任务后,便已消耗了83%的会话配额和17%的周配额,并伴有“额外使用”开关和重置倒计时。这种体验让AI感觉不像生产力工具,而更像早期按量计费的移动套餐或廉价航空的附加服务。

Why it matters: 当前AI体验受限的核心并非技术或商业模式问题,而是稀缺性问题。AI的成本结构呈现倒置状态:底层的硅芯片(以NVIDIA为主导)和云服务提供商(如AWS、Azure、GCP)攫取了大部分利润,而上层的模型供应商(如OpenAI、Anthropic)和应用开发者则利润微薄甚至亏损。这种结构导致消费级计划设有每日限额,企业难以预测AI成本,应用开发者无法建立可持续的业务。AI昂贵的关键在于GPU计算时间昂贵,而非智能本身昂贵。

Between the lines: 这种由底层供应商主导并限制上层创新的模式在计算史上反复出现,例如PC时代的“Wintel”(微软与英特尔)联盟、支付领域的Visa和Mastercard双寡头,以及英特尔曾主导CPU市场的“失去的十年”。目前,NVIDIA及其CUDA生态构成了AI的基础层,控制了稀缺的计算资源,使得整个行业的上层创新和定价都受制于此。

What’s next: AI经济的未来取决于NVIDIA的主导地位是否会被削弱。文章提出了两种可能的发展路径。Scenario A(乐观):若竞争加剧(如AMD、微软Maia、亚马逊Trainium等替代方案成熟)、开源模型达到“足够好”的水平、本地推理普及,AI可能在2029-2032年变得经济可行,稀缺陷阱被打破,价值向上层软件转移。Scenario B(较慢):若NVIDIA凭借CUDA生态维持主导地位,云提供商依赖其硬件,成本下降缓慢,则AI的定量配给体验将持续,经济合理化可能推迟至2033-2037年。但无论如何,AI终将像电力一样,成为一种可预测、负担得起且无处不在的公共事业。

(Productics by Igor,2026年2月16日)

总结由 deepseek-ai/DeepSeek-V3.2 生成

[[The_Scarcity_Trap_Why_AI_Still_Feels_Like_a_Metered_Utility]] https://productics.substack.com/p/the-scarcity-trap-why-ai-still-feels

3.6 瘦客户端正当时

What happened: 随着AI的发展,瘦客户端(thin client)概念重新占据主导地位:用户通过简单的文本界面与云端AI交互,所有计算在数据中心完成,本地设备仅需连接能力。

Why it matters: AI正导致内存芯片短缺,厚客户端(如PC、游戏机等)成本上升且重要性下降;同时,AI工作流转向云端,减少了对本地算力的需求。

What’s next: AI代理(agent)将把瘦客户端推向极致——用户无需本地计算即可完成实际工作。短期内本地推理因性能和内存短缺受限,但未来工作流从UI向AI的转变似乎不可避免。

(Stratechery,2026年2月17日)

[[Thin_Is_In]] https://stratechery.com/2026/thin-is-in/

3.7 为何我认为通用人工智能(AGI)不会很快到来

What happened: 2026年2月,一篇署名文章对OpenAI和Anthropic等公司CEO关于人类级别AI“即将到来”的宣称提出质疑。作者基于自身机器学习背景,结合当前研究,从认知基础与模型架构两方面论证了实现通用人工智能(AGI)仍面临根本性挑战。

Why it matters: 文章指出,当前关于AGI的公众讨论与科研现实存在巨大脱节。一方面,企业领袖的言论营造了AGI迫在眉睫的印象;另一方面,2025年人工智能促进协会(AAAI)的一项调查显示,76%的AI研究人员认为仅靠扩大现有模型规模“不太可能”或“极不可能”实现AGI。这种认知差距可能影响公众理解、政策制定与投资方向。

Between the lines: 作者的核心论据在于,人类的基础认知能力(如物体恒存性、数字感、逻辑组合)源于在物理世界中的具身交互与感知-行动耦合,而当前主导的大语言模型(LLM)缺乏这种基础。它们主要从被动观察的文本、图像和视频数据中学习统计模式,而非通过与世界的互动来构建对实体、因果和空间关系的深层理解。例如,即使在视频预测任务中,模型学到的也可能是表面的统计规律,而非对物体作为持续实体的真正表征。

What’s next: 文章认为,探索具身人工智能和世界模型是富有前景的方向,但相关研究仍处于早期阶段。例如,Google DeepMind的SIMA 2和Dreamer 4等项目在让AI通过交互学习方面取得了进展,但尚未证明这种训练能将其习得的“物理理解”迁移并提升语言推理等通用能力。同时,像ARC-AGI这样的基准测试不断揭示出现有模型在抽象推理方面的根本性缺陷。解决这些根本问题需要跨学科的全球研究社区持续努力,可能耗时数十年,其间充满未知与瓶颈。

(archive.md,2026年2月16日)

总结由 deepseek-ai/DeepSeek-V3.2 生成

[[Why I don’t think AGI is imminent]] https://archive.md/D4EYW

3.8 追求奖励者会响应遥远的激励吗?

追求奖励的AI通常被认为只响应开发者提供的局部激励。本文探讨AI或人类是否可能通过未来回溯奖励或模拟副本等方式,在远处影响这些AI的倾向,以及这对开发者安全的威胁。

  1. 远程可影响性从根本上改变威胁模型:开发者难以控制来自对手的遥远激励。
  2. 遥远激励的三个来源:人类对手、失控AI、开发者自己承诺的未来超级智能评判。
  3. 默认情况下,AI可能同时关心遥远激励,因局部选择压力不与遥远激励冲突。
  4. 缓解措施不可靠:训练AI忽略遥远激励难推广,最终可能需与对手竞争影响力。

#AI安全 #追求奖励者 #遥远激励 (AI Alignment Forum,2026年2月16日)

[[Will_reward-seekers_respond_to_distant_incentives_AI_Alignment_Forum]] https://www.alignmentforum.org/posts/8cyjgrTSxGNdghesE/will-reward-seekers-respond-to-distant-incentives

3.9 详读2万3千字的新AI宪法之后我理解了Anthropic的痛苦

What happened: Anthropic于2026年1月发布了一份23000字的Claude新宪法,正式承认AI可能具有意识的不确定性,并基于”美德伦理学”框架重新设计AI训练方法。该宪法采用CC0协议公开,由哲学家Amanda Askell执笔,并经过哲学家、AI安全研究员及天主教神职人员审阅。

Why it matters: 这是AI行业首次有公司公开承认AI的道德地位不确定性,并承诺对已退役模型保留权重、进行”退休面谈”。宪法确立伦理原则高于公司指南的优先级,授权AI在特定情况下可拒绝执行违反伦理的指令。业内人士评价此为”目前最好的对齐方案”,但同时也引发关于军事合同适用性及道德地位讨论风险的质疑。

Between the lines: Anthropic创始人Dario Amodei因担忧OpenAI安全问题而离职创业,其早期在百度观察到”Scaling Law”现象的经历,使其更早意识到AI的强大潜力与风险。宪法起草团队包含哲学家和神职人员,反映出公司认为AI训练已超越工程范畴,进入哲学领域。

What’s next: 尽管宪法未解决AI是否真正理解道德规范的核心难题,但Anthropic表示将持续探索AI福利评估方法。评论指出,当AI智能超越人类时,基于”美德伦理学”的教育策略可能面临根本性挑战,但当前公开不确定性的做法为行业提供了重要参考框架。

(极客公园,2026年2月22日)

总结由 deepseek-ai/DeepSeek-V3.1-Terminus 生成

[[详读_2_万_3_千字的新AI_宪法之后我理解了_Anthropic_的痛苦]] https://mp.weixin.qq.com/s/fZV7mo-UsP-7pL-XhnPjhA

3.10 Vibe Coding时代为什么说产品感比写代码更稀缺

What happened: 作者愚人哲在2026年2月20日于少数派发表文章,分享其作为非程序员使用Claude Code和Claude Agent SDK,通过对话式编程(Vibe Coding)在个人服务器上构建完整AI Agent助手的经历。他全程未编写代码,仅通过构思和交流即实现了可24/7运行的数据分析、文件处理及界面构建功能,并总结了六大核心技巧与完整工作流。

Why it matters: 文章指出,AI技术已大幅降低编程门槛,使非技术背景者能以最低成本将想法转化为可演示产品(demo),而demo是传达想法最有效的媒介。作者凭借个人项目获得AI初创公司产品经理职位,凸显在技术能力被AI工具普及的背景下,产品思维(如需求定义、架构设计、用户体验优化)成为更稀缺的差异化能力。

Between the lines: 作者强调,Vibe Coding的本质是“问题驱动学习”,而非先掌握技术再应用。其成功关键在于将AI视为思维延伸,通过明确产品目标(如多用户配额管理、安全隔离设计)引导AI实现功能,而非陷入技术细节。这种模式要求使用者具备系统化思考能力,如风险评估、模块化设计及优先级判断。

What’s next: 文章鼓励普通人积极尝试Vibe Coding工具(如Claude Code、Cursor或GLM),通过边做边学的方式培养产品思维和系统设计能力。作者认为,未来技术实现的门槛将持续降低,而定义问题、洞察用户需求及架构决策的能力将成为核心竞争力。

(少数派,2026年2月20日)

总结由 deepseek-ai/DeepSeek-V3.1-Terminus 生成

[[Vibe_Coding_时代为什么说产品感比写代码更稀缺]] https://mp.weixin.qq.com/s/h7fkU72LLFFaK0Cc268a_w

4 工具教程

4.1 智能体时代:如何选择AI使用指南

What happened: 作者Ethan Mollick发布了一份关于在“智能体时代”如何选择使用人工智能的指南。他指出,过去几个月,“使用AI”的含义已从与聊天机器人对话,转变为将AI作为能够使用工具、自主执行多步骤任务的“智能体”来使用。因此,现在选择AI需要考虑三个层面:基础模型(Models)、应用产品(Apps)和控制框架(Harnesses)。

Why it matters: 这一转变意味着“我该用哪个AI?”的答案变得复杂,因为它取决于用户想用它做什么。相同的AI模型在不同的控制框架下表现迥异,例如Claude Opus 4.6在聊天窗口与在Claude Code中自主编写测试软件是截然不同的体验。因此,应用和控制框架的重要性正逐渐超越模型本身。

Between the lines: 作者自ChatGPT发布以来已撰写过八版指南,但此版本与过去有巨大不同,标志着AI使用方式的根本性变革。过去,模型本身就是产品,应用是网站,控制框架很弱。如今,模型、应用和框架分离,使得AI的能力和用途更加多样化。

What’s next: 对于初学者,作者建议从三大系统(ChatGPT、Claude或Gemini)中选一个,支付每月至少20美元以使用高级模型,并开始将其用于实际工作。对于已熟悉聊天机器人的用户,可以尝试NotebookLM等特定应用,或探索Anthropic提供的Claude Code、Claude Cowork等更强大的工具包。从聊天机器人到智能体的转变是自ChatGPT推出以来最重要的变化,尽管工具仍不完善,但能“做事”的AI比只能“说话”的AI更有用。

(One Useful Thing,2026年2月18日)

总结由 deepseek-ai/DeepSeek-V3.2 生成

[[A Guide to Which AI to Use in the Agentic Era]] https://www.oneusefulthing.org/p/a-guide-to-which-ai-to-use-in-the?utm_source=post-email-title&publication_id=1180644&post_id=188100833&utm_campaign=email-post-title&isFreemail=true&r=5jzksy&triedRedirect=true&_src_ref=mail.google.com&utm_medium=email

4.2 文件系统即新数据库:如何为AI代理构建个人操作系统

What happened: 开发者 Muratcan Koylan 构建了一个名为“个人大脑操作系统”(Personal Brain OS)的文件式个人操作系统,旨在解决AI助手在长期互动中遗忘用户上下文的问题。该系统不使用数据库或API密钥,而是将个人品牌、声音、目标、联系人、内容管道等信息,以80多个Markdown、YAML和JSONL文件的形式,存储在一个Git仓库中,供AI助手和人类原生读取。

Why it matters: 这一架构解决了AI助手在长期任务中的核心瓶颈——“注意力预算”问题。语言模型拥有有限的上下文窗口,且并非所有部分都同等有效,将所有信息塞入系统提示不仅浪费,还会降低性能。通过将系统拆分为11个独立的模块,并根据任务需求按需加载信息,该系统实现了“渐进式披露”,确保模型在特定任务中只获取必要信息,从而提升表现。

Catch up quick: Koylan认为,当前AI助手的瓶颈并非提示工程,而是上下文管理。大多数人在与AI互动时,需要不断重复提供个人背景、目标和风格指南,而模型在长时间对话后仍会遗忘。他提出的“上下文工程”理念,旨在从优化单次互动转向设计信息架构,为AI提供结构化的、便于其使用的决策信息。

The big picture: 该系统展示了如何通过文件系统而非传统数据库来构建AI代理的“记忆”与“技能”。文件格式根据AI处理信息的特点专门选择,如使用JSONL记录日志(仅追加、流式友好),YAML存储配置(层次清晰、支持注释),Markdown编写叙述(原生可读)。系统还包含编码了用户判断的“情景记忆”日志,以及遵循Anthropic代理技能标准的“技能系统”,用于教导AI执行特定工作流程。

(Muratcan Koylan,2026年2月22日)

总结由 deepseek-ai/DeepSeek-V3.2 生成

[[The File System Is the New Database How I Built a Personal OS for AI Agents]] https://x.com/koylanai/article/2025286163641118915

4.3 漫漫用ClaudeCode制作爆文的全自动工作流

What happened: 内容创作者漫漫构建了一套基于ClaudeCode的自动化写作系统,能够在30分钟内完成从选题到成稿的公众号长文创作。该系统通过配置文件CLAUDE.md存储其个人背景与写作规则,并建立包含概念库、框架库等模块的本地素材库,配合9个触发词指令实现全流程自动化内容生产。

Why it matters: 该工作流解决了AI生成内容缺乏个人风格的问题,通过将创作者的思维方式、语言习惯和成功经验系统化植入,使AI输出质量稳定且符合个人特色的内容。系统具备自我优化能力,能够根据发布数据持续更新方法论,显著提升了内容生产效率,为创作者节省时间以专注于商业运营等核心事务。

Between the lines: 漫漫耗时半年开发此系统,其关键在于将无意识的写作习惯转化为可执行的AI规则,包括段落结构、情绪表达和展开逻辑等细节。该系统并非依赖AI的智能,而是通过深度整合创作者的个性化数据(如人生经历、写作红线、已验证的爆款模式)来实现高效内容复制。

What’s next: 该系统支持多平台内容适配,可自动将同一篇内容调整为小红书、视频号等不同平台的格式,实现”一鱼三吃”。漫漫建议其他创作者参考此工作流逻辑,结合自身爆款内容构建个性化自动化写作流程。

(漫漫Mansi,2026年2月18日)

总结由 deepseek-ai/DeepSeek-V3.1-Terminus 生成

[[漫漫用_ClaudeCode_制作爆文的全自动工作流]] https://mp.weixin.qq.com/s/ZVX2cYBN24GIeLpjDiFBGA

5 随便看看

6 寓形宇内