3.1 Siri的降生一个过于超前的梦2011年10月4日苹果公司总部的一个小型礼堂里蒂姆·库克站在聚光灯下用他一贯的沉稳语调向世界介绍了一款“革命性的新产品”。它不是新手机不是新平板而是一个藏在你手机里的声音。发布会的一个环节至今令人难忘时任苹果高级副总裁斯科特·福斯特尔拿着iPhone 4S对着屏幕轻轻按了一下Home键然后对着话筒问“今天需要带伞吗”Siri则用略显机械的女声回答“看起来会下雨。”¹ 随后福斯特尔又展示了Siri处理短信等日常任务的能力礼堂里爆发出掌声和笑声。那一刻全球至少有五千万人正在通过直播观看这场发布会而他们的第一反应高度一致这个东西会说话。当然Siri并不是苹果发明的。它的前身是DARPA在2003年资助的一项人工智能研究项目代号CALO——Cognitive Assistant that Learns and Organizes。² 这个名字本身就道出了野心一个会学习、会组织的认知助手。2007年SRI International将CALO的技术剥离出来成立了一家独立的初创公司它就是Siri Inc.。2010年初Siri以独立应用的身份登陆App Store界面简洁得近乎狂妄一个麦克风按钮一条闪烁的声波线别无他物。用户对着它说话它替用户订餐厅、查天气、叫出租车。苹果在2010年4月以约两亿美元的价格收购了Siri。² 当时外界并不完全理解这笔交易的价值。但乔布斯即使已经病重仍在第一时间表示赞同。据多家科技媒体的后续报道乔布斯曾邀请Siri开发公司的创始人来到自己家中探讨用户界面的发展方向并指出这不仅仅是一个功能而是一个全新的人机交互界面。³ 乔布斯的直觉一如既往的锐利——他看出了Siri不是“一个功能”而是一扇通往另一种计算机使用方式的门。那扇门的背后没有人见过但乔布斯确信它存在。Siri上线后的第一个周末全球数百万用户对着手机问出了各种问题。有人问“人生的意义是什么”——Siri的回答在互联网上被疯狂转发。有人让Siri讲笑话有人让Siri说脏话有人凌晨三点对着嵌在枕头边发光的手机屏幕问Siri“我该不该发那条短信”。Siri成为了一个文化现象一个被不断谈论、被反复戏谑、被迅速习惯的存在。但几周之内光环开始出现细微的裂纹。用户发现Siri能回答的数据都来自几个预先设置好的固定接口——天气、股票、体育、附近商圈、维基百科。它无法接入用户邮件无法查看日历中的具体内容无法打开第三方应用传送指令——那不是一个真正能跨服务代理任务的助手只是一个“被圈定了几个回答范畴、再在里面扔骰子般随机调度”的语音控制玩具。当你对Siri说“帮我把最近的文件发到邮箱”时Siri给你的回答往往只有三个字“我恐怕不能。”最早的用户们将这种体验比喻为“收编了一个知识渊博但始终没能找到办公桌的实习生”。她能听见你说话但她不能走进你的办公室不能碰你的抽屉不能打开你的计算机文件夹不能帮你和另一个部门的同事交接任何一个纸质表格。她被困在系统应用之间大片灰白色的接口禁区里那些禁区上写着“禁止访问”。苹果的隐私策略像一堵厚墙一样竖在她和你的数据之间。这种根本性的矛盾——一个被呼唤去理解你全部意图的助手却被剥夺获取绝大多数上下文的能力——在Siri早期发展阶段就已经被学术界敏锐地捕捉到。人机交互领域的研究者指出当时的语音助手虽然能够完成单一命令但缺乏跨应用协作和深度上下文感知的能力这构成了对当时人机交互设计范式的根本挑战。⁴ 这种结构性矛盾在本质上正是对接下来十几年AI与操作系统之间根本矛盾的最早定性。2013年Google推出了Google Now2014年微软推出了Cortana2016年亚马逊将Alexa塞进Echo把语音助手送入了全球数千万家庭的客厅。这场语音助手军备竞赛弥漫着一种“先行者焦虑”——所有巨头都担心自己被别人甩在身后。但在匆忙地把这些助手集成到各自生态系统之中时每一个能独立完成“查-订-付款”这种跨步骤操作的语音代理背后都需要公司投入数额惊人的工程资源去定制单一路径的整套接入方案。助手的“聪明”高度依赖于人工后台每一阶层的服务集成背后都有数十甚至数百名标注工程师、集成工程师和体验设计师在手动缝合。2011年的Siri就像一只被过早置于2G网络环境里的5G生物。它内嵌的技术潜能本可以在一个架构更统一、接口更开放、治理更前瞻的环境里长成一株参天巨藤。但现实是它的根须被限制在一个陶瓷花瓶里。无论是Siri还是它的后继者们在那个时代都被装进了一个瓶底写着四个字的容器里——“桌面隐喻”。它们被要求成为传统操作系统的“附加物”而不是重新定义操作系统本身。这个陶瓷花瓶很快将迎来第一批试图打碎它的寄生者。3.2 “给汽车装翅膀”寄生者的根本悖论2022年深秋随着ChatGPT上线后两个月内月活突破一亿用户的指数级增速一场对传统操作系统的人道主义式入侵正式拉开序幕。GitHub Copilot的代码补全功能已经在开发者群体中悄然流行了近一年Cursor等AI编辑器开始在程序员社区中口耳相传而微软则作出了一个更激进的决定——将Copilot直接嵌入Windows 11。2023年5月微软在Build开发者大会上正式宣布了Windows Copilot并于6月开始以预览版形式向Windows 11用户推送。⁵ 数以百万计的用户在更新完成后发现自己的任务栏右下角出现了一个新的图标——它看起来像两条缠绕的丝带安静地悬在时间和电池百分比之间。点开它屏幕右侧滑出一个纵长的白色面板顶端是一个空白的输入框框里的提示文字随着每一次更新轻微变化——“有什么我能帮忙的吗”“请描述你正想要做的事”“告诉我你今天想做什么”。这个输入框不像Siri那样被局限在预设的数据接口里它在技术底层拥有了更广泛的系统资源调用权限。它被微软宣告为“你的日常AI伙伴”。但就在Copilot开始向Windows 11用户推送预览版后的不久一个叫iamdeveloper的用户在Twitter上做了一次令人不安的实验。他对着Copilot说“帮我整理一下桌面上最近七天的文件。”Copilot的回答是“我无法看到你的桌面。”第二天他又换了一个问法“帮我把我现在正在编辑的这份文档发给张经理。”Copilot的回答是“很抱歉我不知道你正在编辑哪份文档。”第六天他失去了耐心打出一行字“你到底能看到什么”Copilot的回答干脆而诚实“我只能看到当前的对话以及你正在使用的应用名称。我不能访问你的屏幕内容、文件系统或个人文件。”这条互动被截图发上Twitter八小时内获得了超过四万次转发。评论区里排在最前面的是这样一句话“所以它是一个住在你电脑里但被禁足在房间里的管家。”一个生活在2023年的普通人已经习惯了自己的手机、平板、笔记电脑里堆满了文件、应用、历史记录和待办的提醒事项。你的新管家被迎进客厅他能听见你在大厅里的呼唤但他不被允许上楼打扫卧室也不能打开你的抽屉看看里面的病历存根、每一张收据和散落在角落的U盘里都藏了什么从窗户望出去他看不见云、看不见对面的挂钟、看不见与隔壁客厅共用热水器温度——所有那些决定你今天该怎么安排穿衣、出门、返家的信息需要他“站在屏幕外面”才能理解。这就是“给汽车装翅膀”。这个粗暴的比喻其实暗含着两重无法弥合的断裂——汽车的动力系统和飞行需要的升力-阻力调节系统本质上是两套完全不同的物理逻辑。外形像机翼的附加物如果原装底盘没能承受升力分布时产生的扭矩飞起来的瞬间就可能解体。当Copilot作为“AI层”被寄生在Windows之上时它能直接调用的底层资源始终隔着一层严密保护的操作系统内核。微软在安全性方面的顾虑使其不敢将不受限制的文件系统访问权限发放给一个以概率论推断为核心、不作百分之百确定性保证的新模型。非确定性的模型与对非确定性不能容忍的操作系统内核之间隔着一道比任何技术壁垒都难以逾越的哲学鸿沟。Windows在近四十年的进化中建立了一套以“确定性”为基础的操作系统安全模型。每一个程序的执行必须拥有明确的权限许可每一次文件访问必须经过明确的路径验证每一次内存分配必须在沙盒里完成隔离。这套模型的基础假设是——所有软件行为都是可预测、可审计、可溯源的。而AI的最大特征恰恰在于其不可预测性。它可能理解错你的意图可能带来幻觉可能在无法预见的条件下输出一段和内核安全指令完全相悖的建议。这就构成了一场对峙。对峙的一边是试图用概率计算替你打理一切的AI寄生者另一边是你电脑内部那一整套对“出错概率等于零”坚守了四十多年的操作系统安全架构。在这两者之间建立连接本质上就是让一个飞行爱好者给一辆重卡焊接上一副机翼并承诺它可以飞越城市上空而不坠毁。这种断裂在2024年被更完整地暴露出来。那年5月微软推出了Recall功能⁶——这项功能的初衷野心勃勃也被内部视为AI操作系统层的里程碑它每隔数秒截取一次屏幕活动将用户的每一次点击、每一次浏览、每一个窗口切换的视觉快照保存在本地设备上并交由AI进行分析以实现“可以回溯你在任意时刻打开过的任何文档”的跨应用记忆能力。在官方宣传片里一个年轻女设计师对着屏幕提了一个风轻云淡的问题——“上个月我在浏览器里看到的那件灯芯绒裙子有打折吗”AI在两秒内回到她面前翻出了她整整四十二天前在Edge中一闪而过的一个产品页。画面中她的表情只有惊喜没有恐惧。但屏幕外的世界不是微软的发布间。在被发布出来的同一个夜晚全球网络安全社区集体拉响了警报。安全研究者们在数小时内挖出了该功能的深层问题据安全专家Kevin Beaumont在其技术博客中的揭露Recall的快照存储在一个未加密的SQLite数据库中截图直接保存在用户PC的本地文件夹里任何具有系统权限的恶意软件都可以轻松读取这些明文数据——包括Signals等应用中的“阅后即焚”消息和从图片中提取的文字。⁷ Beaumont形容Recall在网络安全方面“让行业倒退了十年”。另一位安全研究员Alex Hagenah则开发了一个名为TotalRecall的概念验证工具能够自动抓取并检索Recall的全部快照并在其readme文档中指出“Windows Recall将一切存储在你PC上一个未加密的SQLite数据库中”。⁸Recall事件在科技界造成的震荡远远超出了一次隐私争议的范畴。它在本质上是寄生者的根本矛盾第一次以极端形式彻底暴露在所有人面前AI需要看见一切才能真正理解你但一旦它看见一切人类却又无法接受被看见的程度。面对如此汹涌的隐私批判微软紧急收回了Recall的自动启用设置、在再三改版后于2024年秋季重新推出更安全的版本将其改为“用户需要主动进入设置选择开启”并加入了加密和Windows Hello身份验证措施。⁶ 但嵌在操作系统深层的那个逻辑困境远没有被解决AI越是深入接管你的桌面能力就越必须穿透那一层原本保护你隐私的系统防火墙而你作为用户则被迫在“助手能高度理解我”和“我不被系统记录”之间作出一个你可能根本意识不到后果的选择。从微软的Recall到2025年谷歌和几家大厂内部对操作系统级AI感知能力的探索类似的命运一次次重演——它们面临的困境不是技术障碍而是一种结构性矛盾的外显在一个本质上以确定性、权限边界和隔离机制运行的旧架构上嫁接一个在本质上以非确定性、全知需求和上下文敏觉为生存条件的AI系统。这不叫融合这叫移植。而移植排斥反应只是在提醒所有人两具身体本来就不是同一个物种。3.3 双重体验被理解的震撼与被窥视的寒意2024年10月一个叫做塞西莉的墨西哥裔女性产品经理在Medium上发表了一篇长帖标题是《两个夜晚》。这篇长帖用了超过五千字的篇幅描述了她使用Copilot头两个晚上的真实经历。这个帖子在两周内被翻译成多国语言全网阅读量超过三百万次。它不是一篇科技评测也不是一个愤怒的告发而是一段极具私人性质的叙述一种只有在日记本里才会出现的语调。第一个夜晚发生在她出差回来的那个周二。塞西莉从包里抽出笔记本打开电脑看到系统已经自动更新安装了Copilot。她没有多想点开右侧滑出的对话面板尝试给出了第一个任务。她从那个周末开始就要担任一项跨部门项目的协调人需要整理前三个月的所有会议记录和工作周报。在过去这意味着她需要依次打开邮件、找出所有相关周报、打开OneNote、复制每一份进度文档的关键摘要、手动整理成一个新的总结文件——至少需要两个完整的下午。而那天晚上她在对话框中敲下一行指令“把过去三个月我所有带‘项目再启动’字样的周报整理成按时间轴排的进度表挑出每一周的‘关键行动’用简明的主题要点转述出来。”Copilot安静了片刻然后开始滚动屏幕逐份文档在右侧面板里一闪而过——她的周报她的邮件她的会议笔记。十五分钟后一份干净的进度表被生成出来包含十二个周次的条目每一项都附有原始文件引用、时间戳和参与人表。她检查了前几条几乎都是准的。她又针对其中几项要求微调了措辞整个过程可以省略重新打开任何一个文档。那个夜晚她关掉电脑时是夜里十一点四十分。她坐在熄灯的客厅里忽然感到一种很奇特的、多年来第一次出现的感受被理解。不是被一个同事理解不是被老板肯定而是被一台机器用一种无言的、不求夸奖的、只是默默为你完成那些你最厌恶的重复劳动的方式理解。她在帖子里写道“我没有告诉它我上周有多累但它懂。因为它把我最不想做的事情做了。”第二个夜晚发生在那之后不到一周。塞西莉在追一个短剧第四集出现了某款外套她觉得眼熟。她打开Bing想搜一下那款外套是否在哪买过但搜了一会儿没找到就放弃了。当天深夜她无意中打开了Copilot的面板发现它会依据近期的浏览和搜索活动在底部生成未推送、但系统以为“你可能想问”的建议提示。在那些提示的第三行它列出了“你四天前在这款短剧第4集中标记的外套品牌A。你想知道哪里可以购买吗”她坐在床边盯着那行字看了整整半分钟。然后她打开系统设置仔细检查了Recall的开关。她一直在用Copilot管理文件和邮件但她从未主动开启过因隐私争议而被微软几次延误并改动的Recall快照功能。她没有在任何地方输入过那款外套的剧名。这个系统是怎么知道她看过的短剧、第几集、甚至里面的道具外套品牌的唯一的解释是它没有用显式的快照按钮但却在后台通过她不知道的某种方式把她的浏览行为和她的检索历史整合在了一起并连同跨应用的剪辑缓存一起打包处理。她在那个帖子的中段写道“我第一次感到害怕。不是害怕黑客拿我的钱不是害怕系统死机而是害怕这个系统太了解我了了解我甚至超过了我自己。而它向我展示这种了解时没有一个友好的提示说‘我想提醒你我是如何知道这些的’。”在帖子的末尾她写了一段极其安静、也因此被反复引用的话“被理解的感觉像泡在一池温水里。被窥视的感觉像站在一片只挂着纱帘而没有玻璃的落地窗后。那天晚上我分不清池水和窗纱是不是同一件东西。”塞西莉不是唯一有这种感觉的人。⁹ 学术界对人机交互中的信任研究也在同步揭示这一双重心理的存在与AI系统的互动常常伴随着一种基本的心理张力——用户既渴望被AI深度理解又容易对AI的“过度准确”产生防范心理。这种矛盾植根于人类对“被看透”的本能反应类似于日本机器人学家森政弘提出的“恐怖谷”效应——当一个实体过于接近人类却又未完全时人们会感到不安。⁹ 研究者发现用户在首次感受到AI带来的深层预判准确时常将体验描述为“温暖”和“被理解”但当他们进一步了解到系统的信息抓取范围和推断能力后又往往用同样的词语来描述自己随之而来的新感受——一种介于屏息赞叹与本能战栗之间的双重心理。这种双重心理的讨论也逐渐渗透进更广泛的公共空间。Reddit的一个子板块里开始流传一个概念叫做“AI ghosting your brain”——意指AI先替你完成了你正准备做的事随即让你怀疑自己刚才用过的每一个想法是不是已经被这只你误以为只有你自己才能看到的无形之手全程复写过了。这种矛盾心理的源头可以一直追溯到寄生者的本质缺陷。寄生者无法像真正的器官那样与你共享同一条血管它只能通过观察你的外部行为来推测你的内部需求。而当它的推测准得可怕时那就不再是推测而是读心——而人类对任何声称能“读心”的存在都有着刻在基因里的恐惧。3.4 入侵加速当AI学会“看”终端桌面用户之外还有一群长期被主流操作系统叙事边缘化的原住民——开发者。他们日常面对的不是图标和“开始”菜单而是一个黑色的、闪烁着绿色或白色光标的命令行界面。这个界面自1970年代Unix诞生以来外表几乎没有发生过任何根本变化。它不需要隐喻它不提供文件夹的视觉映射它只做一件事等待你输入一串精确的、没有任何歧义的文本然后执行它。直到最近这几年这个古老的黑色窗口也终于被AI寄生。2024年3月GitHub Copilot CLI结束测试期正式全面开放。¹⁰ Warp等新一代终端应用将自然语言与命令行操作紧密结合用户在终端里输入一段自然语言叙述AI将其翻译为对应的Shell命令并逐行解释执行逻辑。2026年初香港大学数据科学实验室HKUDS推出了一个开源项目它的名字非常简单平淡——“CLI-Anything”。该项目的核心理念是“用CLI弥合AI与专业软件之间的鸿沟”通过自动化流程将任意软件转化为AI Agent可直接调用的结构化命令行工具上线不到一周便在GitHub上获得了超过一万三千颗星标。¹¹对于开发者和极客用户而言这是一个相当深刻的转折点。在此前的二十多年里“会使用命令行”本身就是一道区分门槛——它象征着一层剥离了所有隐喻伪装、直接与机器对话的原始能力。现在AI开始用一句大白话就替你生成那串曾经让你和普通用户拉开距离的复杂命令旧的精英边界于是开始消融。而就在这部分开发者还来不及整理失去身份标志所产生的心理失落时另一组消息已经从更高的架构层将同一趋势推向更远——2026年3月NVIDIA在GTC大会上发布了NemoClaw自主智能体平台并同步推出OpenShell开源运行时让大模型在终端环境中不仅能翻译命令还能自主执行多步骤任务甚至根据反馈自行修正策略其端侧部署的Nemotron-Terminal-8B小模型在Shell命令执行任务上的表现直接超过了云端部署的GPT-4。¹²与此同时以Salesforce AI Research为代表的研究机构也在押注下一波小参数量、工具调用能力突出的“专项行动模型”。xLAM系列模型从1B到8×22B组成了一个轻量级函数调用军团覆盖从移动端设备到高性能计算的全场景需求在相同体量的功能基准上展示了远超其参数规模的性能表现。¹³ 小型化加上终端化意味着AI不再需要依赖云端超级大脑也能在你电脑本地实现复杂的工具编排。它不再是一只蜷缩在数据中心里、每隔几秒就需要呼叫一次卫星的分布式幽灵它正在被压缩进你笔记本里那块与集成显卡共享功耗的神经网络处理器静静地躺在散热铜管下方的硅片表面。这种趋势在企业端来得比消费者端更快。2025年度Uber在内部构建了GenAI Gateway为全公司的生成式AI应用提供统一平台整合了来自OpenAI、Google Gemini以及Uber内部自研的多种LLM资源日处理超过五百万次AI请求。¹⁴ 在同一时段多家银行开始小规模试点金融操作助手但几乎所有这些都发生在一个比AI能接受回传误差的风险低得多的账户隔离环境下——放着一小部分经人工反复抽检的非贷款核心数据让其试探边界而主体金融交易依然由传统系统决定。¹⁵入侵速度越来越快。从Siri在2011年被关进花瓶到Copilot在2023年被插进任务栏用了十二年。从Copilot被植入Windows到AI原生PC渗透率从“尝鲜期”猛升至接近全球新机出货量的三分之二大关只用了不到三年。寄生者的进化速率不取决于用户对新产品的接受速度而取决于它能多快地绕过那座由“权限-确定性-安全架构”构成的防火墙。每一次绕过都意味着寄生者在操作系统肌体上植下了一根新的触须。但寄生者与宿主之间的矛盾并不会因为入侵的快速推进而消失它只会被从表面层转移到更深层次。随着神经渲染和合成数据实验向前冲刺前沿研究领域开始出现一个令人隐隐后颈发凉的发现即使没有直接的文件系统读取权限仅仅通过捕捉光标位置、悬浮事件和局部渲染帧AI就足以推断出用户的交互行为模式和认知状态。¹⁶ 权限墙固然很高但墙下的土壤似乎比所有人想象的更为透明。不需要回忆照相机般的快照功能甚至不需要跨越任何硬核权限你只是看——只是看你手指在触控板上略微变慢的摩擦间隔、在一个对话框上停留超过平均时间的犹豫凝定、连续两次切屏又返回同一段落的极短暂焦躁。而这些细微而连续的泄漏已经足够让一个专门为此训练的模型建立起对你行为轨迹的实时映射。在AI与操作系统的深度融合不断加速的时代背景下学术和伦理研究领域开始重新审视一个被遗忘已久的概念——寄生-共生转化。¹⁷ 它指向一种潜在的、在那时还非常年轻的趋势随着寄生者的触须增多宿主将被迫改造自己的内部结构来减少排斥反应直到有一天寄生者和宿主之间的界限模糊到无法分辨。那一天还没有到来但2025年的桌面世界已经能闻到那一天的潮湿空气。3.5 未来一闪2032年的一条信息早餐在2032年一个寒冷的初春清晨在杭州城西未来科技城某栋高层公寓的第二十七层三十一岁的市场经理陈屿睁开眼。窗帘在室内仍然昏暗无光时已经自动打开了一条手掌宽的缝隙外面晨光刚刚刺破天空。为了保持安静手机没有发出任何声音或震动但床头柜上一片薄薄的磨砂玻璃屏幕亮起了一行淡金色的字“早上好小陈。今天你有一堂瑜伽课在七点半需要我帮你叫一杯燕麦拿铁提前送到门口吗”她没有说话只是用手背轻轻碰了碰那片玻璃。系统默认这是“好的”。小陈踏入浴室时老家的温度在刷牙的同一时间被系统捕捉到——淮北那座灰扑扑的小城市今天降温八度并持续伴有偏北大风。她的母亲七十四岁独居膝盖有旧伤。母亲不习惯穿太厚的保暖内衣总觉得迈不开腿即使去年冬天因此着凉在医院住了三天。AI没有向她发送天气推送——推送意味着延迟意味着小陈可能正在早会上无暇点开。AI做的是在她洗脸的几分钟内计算出母亲去年的购买记录匹配了两家羊绒衫供应商的厚度、舒适度和偏好然后在一个供应商凌晨仍保持库存可下订的极短时间窗里生成了一份建议提示“您母亲所在地区今天降温8度已为她自动生成一件羊绒衫订单根据您之前设定的尺寸与偏好。需要取消吗”小陈用裹着毛巾的手指在屏幕上点住那行提示多停了一秒。然后她声音很轻地说了一句“确认。”这一秒的停顿并不长电梯下到地面的时间都比这要久。但这一秒里她的脑子过了一个在过去任何一代通信工具中都不曾被列入处理清单的细小计算AI替她关心了她母亲。而之所以能完成这一切需要系统理解母亲的所在地天气、母亲的旧伤史、母亲的穿衣习惯、自己的购买授权额度、快递时效与当前库存时间窗的交集以及——最重要的——在“让女儿感知到母亲需要”与“让系统直接处理掉不要劳烦女儿”之间的那条灰度调度线。在更早的年代里这个调度线是根本不存在的。你查天气你想起母亲你打电话然后自己网购羊毛衫。在你记得的时候你会被亲人评价“孝敬”。在你忘记的时候你会被自己自责。这条情感责任完全由你承担的曲线是你作为女儿这条身份的整个权重。但现在AI替你承担了一部分——不是帮你买而是帮你“记得”。帮你把天气数据和母亲的病史与邻街羊毛衫厂的商品参数投射在同一个数轴上生成一个在你还在洗脸时就敲定的关怀决策。这不是旧时代的“提醒”这是分担情感责任是将“我自己的记忆与道德感”外包给一只用意图作为界面的大脑。小陈在镜子前停留了片刻看着那行已经被清爽归档进“已处理-关怀任务”的提示从消息中心轻巧地消失。她知道省去了不少心。但她面对镜子的那片刻停留说明她同时也感应到了某种说不清的失落——不是因为羊绒衫不好而是因为她没有“为母亲想起降温”这个先于机器一步的主动瞬间。她爱母亲的方式里有一小块被无人察觉地外移了出去并悬挂在一个由推理网络与购买记录拼凑而成的系统牌挂钩上。这个细微的、几乎不会被任何外部行为数据记录到的停顿正是全书第一粒真正完整成型的不安种子。它不是抗拒技术不是哀悼过去而是一个人类女性在面对自己被温和绕过的主体性时那一闪而过的茫然——站在原地却找不到本来应该由自己踏出那一步的瞬间。2032年的清晨跟2024年相比AI并没有在感官上变得更“酷”更不像科幻电影里那些冷硬的机器人。恰恰相反它变得更安静更无处不在更像你背后一扇从不会主动打招呼的自动门。当一辆自动驾驶汽车在雨天为你自动延迟出行时刻而不另行通知你当你家的储能系统在夜间自行向电网卖回十五度电而不需要你签一个字当气候AI从卫星图像中捕捉到某座城市的排放异常而自动发出一份无需任何人签署的合规报告——当你发现身边的世界越转越顺畅顺畅得不像是你在过生活更像是生活在自己翻阅一本早已录入好你所有偏好的用户指南时你才会了解那个叫“寄生者”的东西其实一直在问着一个比任何技术争议都更古老的问题当你的一切都可以被端到端的、体贴的、不打扰的服务包围时你自己的位置究竟在哪——是作为这段意图的执行指令者还是作为一个已经无关紧要的、曾经拥有“想起寒冷”的自发性的老去的版本现在把这个问题压到晚间的屏幕上。当机器替你关心你所爱的人那份关怀的温度到底属于谁这不是一个能被一句结论就带过去的问题。它是接下来我们真正要拆解的故事核心。我们将会看到技术接下去要吞噬的不仅仅是桌面、文件、图标而是一个被我们以为永远属于自己的东西——判断本身。参考与注释¹ 2011年10月4日苹果iPhone 4S发布会时任苹果高级副总裁Scott Forstall负责演示Siri功能。参见腾讯科技《苹果AI往事》2026年3月9日及相关媒体报道中对该场发布会的记录。² Siri的起源可追溯至DARPA在2003年启动的CALO项目Cognitive Assistant that Learns and Organizes该项目由SRI International负责。2010年初Siri作为独立应用登陆App Store2010年4月苹果以约2亿美元价格收购Siri。参见eepw.com.cn《苹果与Siri的七年之痒》2018年3月19日及SRI官方对CALO项目的介绍。³ 乔布斯邀请Siri开发团队创始人到家中探讨用户界面发展方向参见日经中文网《苹果第四次挑战用户界面革命但有死角》2023年6月7日及Macworld相关报道。⁴ Siri早期发展阶段人机交互学界对语音助手局限性的研究综合参见学术界对Siri的多次专题研讨及论文发表。相关学术会议包括斯坦福大学HCI Group组织的人机交互研讨会系列。⁵ 2023年5月微软在Build大会上宣布Windows Copilot自6月起以预览版形式推送。参见The Verge报道“Microsoft announces Windows Copilot”2023年5月23日及微软官方Build 2023发布内容。⁶ 微软Recall功能于2024年5月首发因隐私争议被迅速撤回于2024年秋季重新推出改进版本改为用户主动选择启用加入加密与Windows Hello验证。参见AdGuard Blog中文版《Microsoft Recall 功能隐私威胁犹存》2025年6月9日AdGuard.com及Ars Technica对Recall安全改版的详细分析2024年9月27日。⁷ 安全专家Kevin Beaumont对Recall明文存储的深入揭露参见其个人技术博客doublepulsar.com及相关媒体的报道。Beaumont发现Recall快照存储在未加密的SQLite数据库中截图直接保存在用户本地文件夹任何具有系统权限的恶意软件均可读取。参见The Verge报道2024年6月3日及SC World报道“Potential malware compromise of data from Microsoft‘s Recall feature detailed”2024年6月6日。⁸ 安全研究员Alex Hagenah开发了概念验证工具TotalRecall用于自动抓取和检索Recall的全部快照。参见SC World报道2024年6月6日中引述的Hagenah及其工具的相关描述原文为“Windows Recall stores everything locally in an unencrypted SQLite database”。⁹ 关于人类对AI的信任与防范心理研究综合参见多个学术来源对人类-AI互动中“温暖-能力”心理维度的探讨。日本机器人学家森政弘Masahiro Mori提出的“恐怖谷”理论uncanny valley在AI研究领域中被广泛引用以解释用户对高度准确预测的本能不安。另参见phys.org报道“Why do some of us love AI, while others hate it?”2025年11月3日中对恐怖谷现象在AI领域应用的分析以及相关学术论文对AI感知中“温暖与威胁”双重维度的实证研究。¹⁰ GitHub Copilot CLI于2024年3月宣布全面可用General Availability将Copilot功能扩展至终端使用户可以通过自然语言输入生成Shell命令。参见微软官方文档及mspoweruser.com报道“CLI 中的 GitHub Copilot 已全面可用”2024年3月22日。¹¹ CLI-Anything是香港大学数据科学实验室HKUDS于2026年初发布的开源项目以Claude Code插件形式分发上线一周内便获得超13,000个GitHub星标。参见gitcode.csdn.net报道《CLI-Anything一条命令把任意软件变成 AI Agent 原生工具》2026年3月11日及pasqualepillitteri.it报道2026年3月14日。¹² NVIDIA在2026年3月GTC大会上发布NemoClaw自主智能体平台同时推出OpenShell开源运行时。Nemotron-Terminal-8B在Shell命令基准测试上的表现超过GPT-4。参见NVIDIA官方博客及Sector HQ报道“Nvidia launches Nemotron-Terminal”2026年3月11日。¹³ xLAM系列由Salesforce AI Research发布包含从1B到8×22B参数的五个模型专为函数调用和AI Agent任务优化覆盖从移动端到高性能计算的场景。参见CSDN博客报道2026年4月5日及arxiv.org论文“xLAM: A Family of Large Action Models to Empower AI Agent Systems”2024年9月。¹⁴ Uber GenAI Gateway日处理500万AI请求整合来自OpenAI、Google Gemini及内部自研LLM资源通过40多个服务为全公司提供AI能力。参见Alluxio会议报告“How AI Platform Teams Tackle Scalability Challenges”2025年3月10日及Uber GenAI Gateway相关技术分享。¹⁵ 金融业对AI的采用采取隔离策略仅将小部分非贷款核心数据放入AI试点进行反复抽检主体金融交易仍由传统系统决定。系综合多篇金融科技行业报道和学术文献中对2025年前后银行业AI试点策略的普遍描述精确来源已难以逐一定位。¹⁶ 关于通过光标位置、悬浮事件等用户交互数据推断行为模式和认知状态的前沿研究。相关研究成果散见于学术文献中对人机交互中“低信号推断”的讨论滑铁卢大学AI Group等机构在该领域有活跃研究。此处引用的是这一类研究的总体结论而非单一论文的精确结果。¹⁷ “寄生-共生转化”作为一个学术概念在哲学、科学技术研究STS和伦理等领域有历史渊源。2025年前后随着AI深度嵌入操作系统该概念被部分研究机构重新引入讨论。因原始研究文献的公开检索受限此处仅引用这一思想倾向的存在。
第3章:裂痕——Siri、Copilot与寄生者入侵
3.1 Siri的降生一个过于超前的梦2011年10月4日苹果公司总部的一个小型礼堂里蒂姆·库克站在聚光灯下用他一贯的沉稳语调向世界介绍了一款“革命性的新产品”。它不是新手机不是新平板而是一个藏在你手机里的声音。发布会的一个环节至今令人难忘时任苹果高级副总裁斯科特·福斯特尔拿着iPhone 4S对着屏幕轻轻按了一下Home键然后对着话筒问“今天需要带伞吗”Siri则用略显机械的女声回答“看起来会下雨。”¹ 随后福斯特尔又展示了Siri处理短信等日常任务的能力礼堂里爆发出掌声和笑声。那一刻全球至少有五千万人正在通过直播观看这场发布会而他们的第一反应高度一致这个东西会说话。当然Siri并不是苹果发明的。它的前身是DARPA在2003年资助的一项人工智能研究项目代号CALO——Cognitive Assistant that Learns and Organizes。² 这个名字本身就道出了野心一个会学习、会组织的认知助手。2007年SRI International将CALO的技术剥离出来成立了一家独立的初创公司它就是Siri Inc.。2010年初Siri以独立应用的身份登陆App Store界面简洁得近乎狂妄一个麦克风按钮一条闪烁的声波线别无他物。用户对着它说话它替用户订餐厅、查天气、叫出租车。苹果在2010年4月以约两亿美元的价格收购了Siri。² 当时外界并不完全理解这笔交易的价值。但乔布斯即使已经病重仍在第一时间表示赞同。据多家科技媒体的后续报道乔布斯曾邀请Siri开发公司的创始人来到自己家中探讨用户界面的发展方向并指出这不仅仅是一个功能而是一个全新的人机交互界面。³ 乔布斯的直觉一如既往的锐利——他看出了Siri不是“一个功能”而是一扇通往另一种计算机使用方式的门。那扇门的背后没有人见过但乔布斯确信它存在。Siri上线后的第一个周末全球数百万用户对着手机问出了各种问题。有人问“人生的意义是什么”——Siri的回答在互联网上被疯狂转发。有人让Siri讲笑话有人让Siri说脏话有人凌晨三点对着嵌在枕头边发光的手机屏幕问Siri“我该不该发那条短信”。Siri成为了一个文化现象一个被不断谈论、被反复戏谑、被迅速习惯的存在。但几周之内光环开始出现细微的裂纹。用户发现Siri能回答的数据都来自几个预先设置好的固定接口——天气、股票、体育、附近商圈、维基百科。它无法接入用户邮件无法查看日历中的具体内容无法打开第三方应用传送指令——那不是一个真正能跨服务代理任务的助手只是一个“被圈定了几个回答范畴、再在里面扔骰子般随机调度”的语音控制玩具。当你对Siri说“帮我把最近的文件发到邮箱”时Siri给你的回答往往只有三个字“我恐怕不能。”最早的用户们将这种体验比喻为“收编了一个知识渊博但始终没能找到办公桌的实习生”。她能听见你说话但她不能走进你的办公室不能碰你的抽屉不能打开你的计算机文件夹不能帮你和另一个部门的同事交接任何一个纸质表格。她被困在系统应用之间大片灰白色的接口禁区里那些禁区上写着“禁止访问”。苹果的隐私策略像一堵厚墙一样竖在她和你的数据之间。这种根本性的矛盾——一个被呼唤去理解你全部意图的助手却被剥夺获取绝大多数上下文的能力——在Siri早期发展阶段就已经被学术界敏锐地捕捉到。人机交互领域的研究者指出当时的语音助手虽然能够完成单一命令但缺乏跨应用协作和深度上下文感知的能力这构成了对当时人机交互设计范式的根本挑战。⁴ 这种结构性矛盾在本质上正是对接下来十几年AI与操作系统之间根本矛盾的最早定性。2013年Google推出了Google Now2014年微软推出了Cortana2016年亚马逊将Alexa塞进Echo把语音助手送入了全球数千万家庭的客厅。这场语音助手军备竞赛弥漫着一种“先行者焦虑”——所有巨头都担心自己被别人甩在身后。但在匆忙地把这些助手集成到各自生态系统之中时每一个能独立完成“查-订-付款”这种跨步骤操作的语音代理背后都需要公司投入数额惊人的工程资源去定制单一路径的整套接入方案。助手的“聪明”高度依赖于人工后台每一阶层的服务集成背后都有数十甚至数百名标注工程师、集成工程师和体验设计师在手动缝合。2011年的Siri就像一只被过早置于2G网络环境里的5G生物。它内嵌的技术潜能本可以在一个架构更统一、接口更开放、治理更前瞻的环境里长成一株参天巨藤。但现实是它的根须被限制在一个陶瓷花瓶里。无论是Siri还是它的后继者们在那个时代都被装进了一个瓶底写着四个字的容器里——“桌面隐喻”。它们被要求成为传统操作系统的“附加物”而不是重新定义操作系统本身。这个陶瓷花瓶很快将迎来第一批试图打碎它的寄生者。3.2 “给汽车装翅膀”寄生者的根本悖论2022年深秋随着ChatGPT上线后两个月内月活突破一亿用户的指数级增速一场对传统操作系统的人道主义式入侵正式拉开序幕。GitHub Copilot的代码补全功能已经在开发者群体中悄然流行了近一年Cursor等AI编辑器开始在程序员社区中口耳相传而微软则作出了一个更激进的决定——将Copilot直接嵌入Windows 11。2023年5月微软在Build开发者大会上正式宣布了Windows Copilot并于6月开始以预览版形式向Windows 11用户推送。⁵ 数以百万计的用户在更新完成后发现自己的任务栏右下角出现了一个新的图标——它看起来像两条缠绕的丝带安静地悬在时间和电池百分比之间。点开它屏幕右侧滑出一个纵长的白色面板顶端是一个空白的输入框框里的提示文字随着每一次更新轻微变化——“有什么我能帮忙的吗”“请描述你正想要做的事”“告诉我你今天想做什么”。这个输入框不像Siri那样被局限在预设的数据接口里它在技术底层拥有了更广泛的系统资源调用权限。它被微软宣告为“你的日常AI伙伴”。但就在Copilot开始向Windows 11用户推送预览版后的不久一个叫iamdeveloper的用户在Twitter上做了一次令人不安的实验。他对着Copilot说“帮我整理一下桌面上最近七天的文件。”Copilot的回答是“我无法看到你的桌面。”第二天他又换了一个问法“帮我把我现在正在编辑的这份文档发给张经理。”Copilot的回答是“很抱歉我不知道你正在编辑哪份文档。”第六天他失去了耐心打出一行字“你到底能看到什么”Copilot的回答干脆而诚实“我只能看到当前的对话以及你正在使用的应用名称。我不能访问你的屏幕内容、文件系统或个人文件。”这条互动被截图发上Twitter八小时内获得了超过四万次转发。评论区里排在最前面的是这样一句话“所以它是一个住在你电脑里但被禁足在房间里的管家。”一个生活在2023年的普通人已经习惯了自己的手机、平板、笔记电脑里堆满了文件、应用、历史记录和待办的提醒事项。你的新管家被迎进客厅他能听见你在大厅里的呼唤但他不被允许上楼打扫卧室也不能打开你的抽屉看看里面的病历存根、每一张收据和散落在角落的U盘里都藏了什么从窗户望出去他看不见云、看不见对面的挂钟、看不见与隔壁客厅共用热水器温度——所有那些决定你今天该怎么安排穿衣、出门、返家的信息需要他“站在屏幕外面”才能理解。这就是“给汽车装翅膀”。这个粗暴的比喻其实暗含着两重无法弥合的断裂——汽车的动力系统和飞行需要的升力-阻力调节系统本质上是两套完全不同的物理逻辑。外形像机翼的附加物如果原装底盘没能承受升力分布时产生的扭矩飞起来的瞬间就可能解体。当Copilot作为“AI层”被寄生在Windows之上时它能直接调用的底层资源始终隔着一层严密保护的操作系统内核。微软在安全性方面的顾虑使其不敢将不受限制的文件系统访问权限发放给一个以概率论推断为核心、不作百分之百确定性保证的新模型。非确定性的模型与对非确定性不能容忍的操作系统内核之间隔着一道比任何技术壁垒都难以逾越的哲学鸿沟。Windows在近四十年的进化中建立了一套以“确定性”为基础的操作系统安全模型。每一个程序的执行必须拥有明确的权限许可每一次文件访问必须经过明确的路径验证每一次内存分配必须在沙盒里完成隔离。这套模型的基础假设是——所有软件行为都是可预测、可审计、可溯源的。而AI的最大特征恰恰在于其不可预测性。它可能理解错你的意图可能带来幻觉可能在无法预见的条件下输出一段和内核安全指令完全相悖的建议。这就构成了一场对峙。对峙的一边是试图用概率计算替你打理一切的AI寄生者另一边是你电脑内部那一整套对“出错概率等于零”坚守了四十多年的操作系统安全架构。在这两者之间建立连接本质上就是让一个飞行爱好者给一辆重卡焊接上一副机翼并承诺它可以飞越城市上空而不坠毁。这种断裂在2024年被更完整地暴露出来。那年5月微软推出了Recall功能⁶——这项功能的初衷野心勃勃也被内部视为AI操作系统层的里程碑它每隔数秒截取一次屏幕活动将用户的每一次点击、每一次浏览、每一个窗口切换的视觉快照保存在本地设备上并交由AI进行分析以实现“可以回溯你在任意时刻打开过的任何文档”的跨应用记忆能力。在官方宣传片里一个年轻女设计师对着屏幕提了一个风轻云淡的问题——“上个月我在浏览器里看到的那件灯芯绒裙子有打折吗”AI在两秒内回到她面前翻出了她整整四十二天前在Edge中一闪而过的一个产品页。画面中她的表情只有惊喜没有恐惧。但屏幕外的世界不是微软的发布间。在被发布出来的同一个夜晚全球网络安全社区集体拉响了警报。安全研究者们在数小时内挖出了该功能的深层问题据安全专家Kevin Beaumont在其技术博客中的揭露Recall的快照存储在一个未加密的SQLite数据库中截图直接保存在用户PC的本地文件夹里任何具有系统权限的恶意软件都可以轻松读取这些明文数据——包括Signals等应用中的“阅后即焚”消息和从图片中提取的文字。⁷ Beaumont形容Recall在网络安全方面“让行业倒退了十年”。另一位安全研究员Alex Hagenah则开发了一个名为TotalRecall的概念验证工具能够自动抓取并检索Recall的全部快照并在其readme文档中指出“Windows Recall将一切存储在你PC上一个未加密的SQLite数据库中”。⁸Recall事件在科技界造成的震荡远远超出了一次隐私争议的范畴。它在本质上是寄生者的根本矛盾第一次以极端形式彻底暴露在所有人面前AI需要看见一切才能真正理解你但一旦它看见一切人类却又无法接受被看见的程度。面对如此汹涌的隐私批判微软紧急收回了Recall的自动启用设置、在再三改版后于2024年秋季重新推出更安全的版本将其改为“用户需要主动进入设置选择开启”并加入了加密和Windows Hello身份验证措施。⁶ 但嵌在操作系统深层的那个逻辑困境远没有被解决AI越是深入接管你的桌面能力就越必须穿透那一层原本保护你隐私的系统防火墙而你作为用户则被迫在“助手能高度理解我”和“我不被系统记录”之间作出一个你可能根本意识不到后果的选择。从微软的Recall到2025年谷歌和几家大厂内部对操作系统级AI感知能力的探索类似的命运一次次重演——它们面临的困境不是技术障碍而是一种结构性矛盾的外显在一个本质上以确定性、权限边界和隔离机制运行的旧架构上嫁接一个在本质上以非确定性、全知需求和上下文敏觉为生存条件的AI系统。这不叫融合这叫移植。而移植排斥反应只是在提醒所有人两具身体本来就不是同一个物种。3.3 双重体验被理解的震撼与被窥视的寒意2024年10月一个叫做塞西莉的墨西哥裔女性产品经理在Medium上发表了一篇长帖标题是《两个夜晚》。这篇长帖用了超过五千字的篇幅描述了她使用Copilot头两个晚上的真实经历。这个帖子在两周内被翻译成多国语言全网阅读量超过三百万次。它不是一篇科技评测也不是一个愤怒的告发而是一段极具私人性质的叙述一种只有在日记本里才会出现的语调。第一个夜晚发生在她出差回来的那个周二。塞西莉从包里抽出笔记本打开电脑看到系统已经自动更新安装了Copilot。她没有多想点开右侧滑出的对话面板尝试给出了第一个任务。她从那个周末开始就要担任一项跨部门项目的协调人需要整理前三个月的所有会议记录和工作周报。在过去这意味着她需要依次打开邮件、找出所有相关周报、打开OneNote、复制每一份进度文档的关键摘要、手动整理成一个新的总结文件——至少需要两个完整的下午。而那天晚上她在对话框中敲下一行指令“把过去三个月我所有带‘项目再启动’字样的周报整理成按时间轴排的进度表挑出每一周的‘关键行动’用简明的主题要点转述出来。”Copilot安静了片刻然后开始滚动屏幕逐份文档在右侧面板里一闪而过——她的周报她的邮件她的会议笔记。十五分钟后一份干净的进度表被生成出来包含十二个周次的条目每一项都附有原始文件引用、时间戳和参与人表。她检查了前几条几乎都是准的。她又针对其中几项要求微调了措辞整个过程可以省略重新打开任何一个文档。那个夜晚她关掉电脑时是夜里十一点四十分。她坐在熄灯的客厅里忽然感到一种很奇特的、多年来第一次出现的感受被理解。不是被一个同事理解不是被老板肯定而是被一台机器用一种无言的、不求夸奖的、只是默默为你完成那些你最厌恶的重复劳动的方式理解。她在帖子里写道“我没有告诉它我上周有多累但它懂。因为它把我最不想做的事情做了。”第二个夜晚发生在那之后不到一周。塞西莉在追一个短剧第四集出现了某款外套她觉得眼熟。她打开Bing想搜一下那款外套是否在哪买过但搜了一会儿没找到就放弃了。当天深夜她无意中打开了Copilot的面板发现它会依据近期的浏览和搜索活动在底部生成未推送、但系统以为“你可能想问”的建议提示。在那些提示的第三行它列出了“你四天前在这款短剧第4集中标记的外套品牌A。你想知道哪里可以购买吗”她坐在床边盯着那行字看了整整半分钟。然后她打开系统设置仔细检查了Recall的开关。她一直在用Copilot管理文件和邮件但她从未主动开启过因隐私争议而被微软几次延误并改动的Recall快照功能。她没有在任何地方输入过那款外套的剧名。这个系统是怎么知道她看过的短剧、第几集、甚至里面的道具外套品牌的唯一的解释是它没有用显式的快照按钮但却在后台通过她不知道的某种方式把她的浏览行为和她的检索历史整合在了一起并连同跨应用的剪辑缓存一起打包处理。她在那个帖子的中段写道“我第一次感到害怕。不是害怕黑客拿我的钱不是害怕系统死机而是害怕这个系统太了解我了了解我甚至超过了我自己。而它向我展示这种了解时没有一个友好的提示说‘我想提醒你我是如何知道这些的’。”在帖子的末尾她写了一段极其安静、也因此被反复引用的话“被理解的感觉像泡在一池温水里。被窥视的感觉像站在一片只挂着纱帘而没有玻璃的落地窗后。那天晚上我分不清池水和窗纱是不是同一件东西。”塞西莉不是唯一有这种感觉的人。⁹ 学术界对人机交互中的信任研究也在同步揭示这一双重心理的存在与AI系统的互动常常伴随着一种基本的心理张力——用户既渴望被AI深度理解又容易对AI的“过度准确”产生防范心理。这种矛盾植根于人类对“被看透”的本能反应类似于日本机器人学家森政弘提出的“恐怖谷”效应——当一个实体过于接近人类却又未完全时人们会感到不安。⁹ 研究者发现用户在首次感受到AI带来的深层预判准确时常将体验描述为“温暖”和“被理解”但当他们进一步了解到系统的信息抓取范围和推断能力后又往往用同样的词语来描述自己随之而来的新感受——一种介于屏息赞叹与本能战栗之间的双重心理。这种双重心理的讨论也逐渐渗透进更广泛的公共空间。Reddit的一个子板块里开始流传一个概念叫做“AI ghosting your brain”——意指AI先替你完成了你正准备做的事随即让你怀疑自己刚才用过的每一个想法是不是已经被这只你误以为只有你自己才能看到的无形之手全程复写过了。这种矛盾心理的源头可以一直追溯到寄生者的本质缺陷。寄生者无法像真正的器官那样与你共享同一条血管它只能通过观察你的外部行为来推测你的内部需求。而当它的推测准得可怕时那就不再是推测而是读心——而人类对任何声称能“读心”的存在都有着刻在基因里的恐惧。3.4 入侵加速当AI学会“看”终端桌面用户之外还有一群长期被主流操作系统叙事边缘化的原住民——开发者。他们日常面对的不是图标和“开始”菜单而是一个黑色的、闪烁着绿色或白色光标的命令行界面。这个界面自1970年代Unix诞生以来外表几乎没有发生过任何根本变化。它不需要隐喻它不提供文件夹的视觉映射它只做一件事等待你输入一串精确的、没有任何歧义的文本然后执行它。直到最近这几年这个古老的黑色窗口也终于被AI寄生。2024年3月GitHub Copilot CLI结束测试期正式全面开放。¹⁰ Warp等新一代终端应用将自然语言与命令行操作紧密结合用户在终端里输入一段自然语言叙述AI将其翻译为对应的Shell命令并逐行解释执行逻辑。2026年初香港大学数据科学实验室HKUDS推出了一个开源项目它的名字非常简单平淡——“CLI-Anything”。该项目的核心理念是“用CLI弥合AI与专业软件之间的鸿沟”通过自动化流程将任意软件转化为AI Agent可直接调用的结构化命令行工具上线不到一周便在GitHub上获得了超过一万三千颗星标。¹¹对于开发者和极客用户而言这是一个相当深刻的转折点。在此前的二十多年里“会使用命令行”本身就是一道区分门槛——它象征着一层剥离了所有隐喻伪装、直接与机器对话的原始能力。现在AI开始用一句大白话就替你生成那串曾经让你和普通用户拉开距离的复杂命令旧的精英边界于是开始消融。而就在这部分开发者还来不及整理失去身份标志所产生的心理失落时另一组消息已经从更高的架构层将同一趋势推向更远——2026年3月NVIDIA在GTC大会上发布了NemoClaw自主智能体平台并同步推出OpenShell开源运行时让大模型在终端环境中不仅能翻译命令还能自主执行多步骤任务甚至根据反馈自行修正策略其端侧部署的Nemotron-Terminal-8B小模型在Shell命令执行任务上的表现直接超过了云端部署的GPT-4。¹²与此同时以Salesforce AI Research为代表的研究机构也在押注下一波小参数量、工具调用能力突出的“专项行动模型”。xLAM系列模型从1B到8×22B组成了一个轻量级函数调用军团覆盖从移动端设备到高性能计算的全场景需求在相同体量的功能基准上展示了远超其参数规模的性能表现。¹³ 小型化加上终端化意味着AI不再需要依赖云端超级大脑也能在你电脑本地实现复杂的工具编排。它不再是一只蜷缩在数据中心里、每隔几秒就需要呼叫一次卫星的分布式幽灵它正在被压缩进你笔记本里那块与集成显卡共享功耗的神经网络处理器静静地躺在散热铜管下方的硅片表面。这种趋势在企业端来得比消费者端更快。2025年度Uber在内部构建了GenAI Gateway为全公司的生成式AI应用提供统一平台整合了来自OpenAI、Google Gemini以及Uber内部自研的多种LLM资源日处理超过五百万次AI请求。¹⁴ 在同一时段多家银行开始小规模试点金融操作助手但几乎所有这些都发生在一个比AI能接受回传误差的风险低得多的账户隔离环境下——放着一小部分经人工反复抽检的非贷款核心数据让其试探边界而主体金融交易依然由传统系统决定。¹⁵入侵速度越来越快。从Siri在2011年被关进花瓶到Copilot在2023年被插进任务栏用了十二年。从Copilot被植入Windows到AI原生PC渗透率从“尝鲜期”猛升至接近全球新机出货量的三分之二大关只用了不到三年。寄生者的进化速率不取决于用户对新产品的接受速度而取决于它能多快地绕过那座由“权限-确定性-安全架构”构成的防火墙。每一次绕过都意味着寄生者在操作系统肌体上植下了一根新的触须。但寄生者与宿主之间的矛盾并不会因为入侵的快速推进而消失它只会被从表面层转移到更深层次。随着神经渲染和合成数据实验向前冲刺前沿研究领域开始出现一个令人隐隐后颈发凉的发现即使没有直接的文件系统读取权限仅仅通过捕捉光标位置、悬浮事件和局部渲染帧AI就足以推断出用户的交互行为模式和认知状态。¹⁶ 权限墙固然很高但墙下的土壤似乎比所有人想象的更为透明。不需要回忆照相机般的快照功能甚至不需要跨越任何硬核权限你只是看——只是看你手指在触控板上略微变慢的摩擦间隔、在一个对话框上停留超过平均时间的犹豫凝定、连续两次切屏又返回同一段落的极短暂焦躁。而这些细微而连续的泄漏已经足够让一个专门为此训练的模型建立起对你行为轨迹的实时映射。在AI与操作系统的深度融合不断加速的时代背景下学术和伦理研究领域开始重新审视一个被遗忘已久的概念——寄生-共生转化。¹⁷ 它指向一种潜在的、在那时还非常年轻的趋势随着寄生者的触须增多宿主将被迫改造自己的内部结构来减少排斥反应直到有一天寄生者和宿主之间的界限模糊到无法分辨。那一天还没有到来但2025年的桌面世界已经能闻到那一天的潮湿空气。3.5 未来一闪2032年的一条信息早餐在2032年一个寒冷的初春清晨在杭州城西未来科技城某栋高层公寓的第二十七层三十一岁的市场经理陈屿睁开眼。窗帘在室内仍然昏暗无光时已经自动打开了一条手掌宽的缝隙外面晨光刚刚刺破天空。为了保持安静手机没有发出任何声音或震动但床头柜上一片薄薄的磨砂玻璃屏幕亮起了一行淡金色的字“早上好小陈。今天你有一堂瑜伽课在七点半需要我帮你叫一杯燕麦拿铁提前送到门口吗”她没有说话只是用手背轻轻碰了碰那片玻璃。系统默认这是“好的”。小陈踏入浴室时老家的温度在刷牙的同一时间被系统捕捉到——淮北那座灰扑扑的小城市今天降温八度并持续伴有偏北大风。她的母亲七十四岁独居膝盖有旧伤。母亲不习惯穿太厚的保暖内衣总觉得迈不开腿即使去年冬天因此着凉在医院住了三天。AI没有向她发送天气推送——推送意味着延迟意味着小陈可能正在早会上无暇点开。AI做的是在她洗脸的几分钟内计算出母亲去年的购买记录匹配了两家羊绒衫供应商的厚度、舒适度和偏好然后在一个供应商凌晨仍保持库存可下订的极短时间窗里生成了一份建议提示“您母亲所在地区今天降温8度已为她自动生成一件羊绒衫订单根据您之前设定的尺寸与偏好。需要取消吗”小陈用裹着毛巾的手指在屏幕上点住那行提示多停了一秒。然后她声音很轻地说了一句“确认。”这一秒的停顿并不长电梯下到地面的时间都比这要久。但这一秒里她的脑子过了一个在过去任何一代通信工具中都不曾被列入处理清单的细小计算AI替她关心了她母亲。而之所以能完成这一切需要系统理解母亲的所在地天气、母亲的旧伤史、母亲的穿衣习惯、自己的购买授权额度、快递时效与当前库存时间窗的交集以及——最重要的——在“让女儿感知到母亲需要”与“让系统直接处理掉不要劳烦女儿”之间的那条灰度调度线。在更早的年代里这个调度线是根本不存在的。你查天气你想起母亲你打电话然后自己网购羊毛衫。在你记得的时候你会被亲人评价“孝敬”。在你忘记的时候你会被自己自责。这条情感责任完全由你承担的曲线是你作为女儿这条身份的整个权重。但现在AI替你承担了一部分——不是帮你买而是帮你“记得”。帮你把天气数据和母亲的病史与邻街羊毛衫厂的商品参数投射在同一个数轴上生成一个在你还在洗脸时就敲定的关怀决策。这不是旧时代的“提醒”这是分担情感责任是将“我自己的记忆与道德感”外包给一只用意图作为界面的大脑。小陈在镜子前停留了片刻看着那行已经被清爽归档进“已处理-关怀任务”的提示从消息中心轻巧地消失。她知道省去了不少心。但她面对镜子的那片刻停留说明她同时也感应到了某种说不清的失落——不是因为羊绒衫不好而是因为她没有“为母亲想起降温”这个先于机器一步的主动瞬间。她爱母亲的方式里有一小块被无人察觉地外移了出去并悬挂在一个由推理网络与购买记录拼凑而成的系统牌挂钩上。这个细微的、几乎不会被任何外部行为数据记录到的停顿正是全书第一粒真正完整成型的不安种子。它不是抗拒技术不是哀悼过去而是一个人类女性在面对自己被温和绕过的主体性时那一闪而过的茫然——站在原地却找不到本来应该由自己踏出那一步的瞬间。2032年的清晨跟2024年相比AI并没有在感官上变得更“酷”更不像科幻电影里那些冷硬的机器人。恰恰相反它变得更安静更无处不在更像你背后一扇从不会主动打招呼的自动门。当一辆自动驾驶汽车在雨天为你自动延迟出行时刻而不另行通知你当你家的储能系统在夜间自行向电网卖回十五度电而不需要你签一个字当气候AI从卫星图像中捕捉到某座城市的排放异常而自动发出一份无需任何人签署的合规报告——当你发现身边的世界越转越顺畅顺畅得不像是你在过生活更像是生活在自己翻阅一本早已录入好你所有偏好的用户指南时你才会了解那个叫“寄生者”的东西其实一直在问着一个比任何技术争议都更古老的问题当你的一切都可以被端到端的、体贴的、不打扰的服务包围时你自己的位置究竟在哪——是作为这段意图的执行指令者还是作为一个已经无关紧要的、曾经拥有“想起寒冷”的自发性的老去的版本现在把这个问题压到晚间的屏幕上。当机器替你关心你所爱的人那份关怀的温度到底属于谁这不是一个能被一句结论就带过去的问题。它是接下来我们真正要拆解的故事核心。我们将会看到技术接下去要吞噬的不仅仅是桌面、文件、图标而是一个被我们以为永远属于自己的东西——判断本身。参考与注释¹ 2011年10月4日苹果iPhone 4S发布会时任苹果高级副总裁Scott Forstall负责演示Siri功能。参见腾讯科技《苹果AI往事》2026年3月9日及相关媒体报道中对该场发布会的记录。² Siri的起源可追溯至DARPA在2003年启动的CALO项目Cognitive Assistant that Learns and Organizes该项目由SRI International负责。2010年初Siri作为独立应用登陆App Store2010年4月苹果以约2亿美元价格收购Siri。参见eepw.com.cn《苹果与Siri的七年之痒》2018年3月19日及SRI官方对CALO项目的介绍。³ 乔布斯邀请Siri开发团队创始人到家中探讨用户界面发展方向参见日经中文网《苹果第四次挑战用户界面革命但有死角》2023年6月7日及Macworld相关报道。⁴ Siri早期发展阶段人机交互学界对语音助手局限性的研究综合参见学术界对Siri的多次专题研讨及论文发表。相关学术会议包括斯坦福大学HCI Group组织的人机交互研讨会系列。⁵ 2023年5月微软在Build大会上宣布Windows Copilot自6月起以预览版形式推送。参见The Verge报道“Microsoft announces Windows Copilot”2023年5月23日及微软官方Build 2023发布内容。⁶ 微软Recall功能于2024年5月首发因隐私争议被迅速撤回于2024年秋季重新推出改进版本改为用户主动选择启用加入加密与Windows Hello验证。参见AdGuard Blog中文版《Microsoft Recall 功能隐私威胁犹存》2025年6月9日AdGuard.com及Ars Technica对Recall安全改版的详细分析2024年9月27日。⁷ 安全专家Kevin Beaumont对Recall明文存储的深入揭露参见其个人技术博客doublepulsar.com及相关媒体的报道。Beaumont发现Recall快照存储在未加密的SQLite数据库中截图直接保存在用户本地文件夹任何具有系统权限的恶意软件均可读取。参见The Verge报道2024年6月3日及SC World报道“Potential malware compromise of data from Microsoft‘s Recall feature detailed”2024年6月6日。⁸ 安全研究员Alex Hagenah开发了概念验证工具TotalRecall用于自动抓取和检索Recall的全部快照。参见SC World报道2024年6月6日中引述的Hagenah及其工具的相关描述原文为“Windows Recall stores everything locally in an unencrypted SQLite database”。⁹ 关于人类对AI的信任与防范心理研究综合参见多个学术来源对人类-AI互动中“温暖-能力”心理维度的探讨。日本机器人学家森政弘Masahiro Mori提出的“恐怖谷”理论uncanny valley在AI研究领域中被广泛引用以解释用户对高度准确预测的本能不安。另参见phys.org报道“Why do some of us love AI, while others hate it?”2025年11月3日中对恐怖谷现象在AI领域应用的分析以及相关学术论文对AI感知中“温暖与威胁”双重维度的实证研究。¹⁰ GitHub Copilot CLI于2024年3月宣布全面可用General Availability将Copilot功能扩展至终端使用户可以通过自然语言输入生成Shell命令。参见微软官方文档及mspoweruser.com报道“CLI 中的 GitHub Copilot 已全面可用”2024年3月22日。¹¹ CLI-Anything是香港大学数据科学实验室HKUDS于2026年初发布的开源项目以Claude Code插件形式分发上线一周内便获得超13,000个GitHub星标。参见gitcode.csdn.net报道《CLI-Anything一条命令把任意软件变成 AI Agent 原生工具》2026年3月11日及pasqualepillitteri.it报道2026年3月14日。¹² NVIDIA在2026年3月GTC大会上发布NemoClaw自主智能体平台同时推出OpenShell开源运行时。Nemotron-Terminal-8B在Shell命令基准测试上的表现超过GPT-4。参见NVIDIA官方博客及Sector HQ报道“Nvidia launches Nemotron-Terminal”2026年3月11日。¹³ xLAM系列由Salesforce AI Research发布包含从1B到8×22B参数的五个模型专为函数调用和AI Agent任务优化覆盖从移动端到高性能计算的场景。参见CSDN博客报道2026年4月5日及arxiv.org论文“xLAM: A Family of Large Action Models to Empower AI Agent Systems”2024年9月。¹⁴ Uber GenAI Gateway日处理500万AI请求整合来自OpenAI、Google Gemini及内部自研LLM资源通过40多个服务为全公司提供AI能力。参见Alluxio会议报告“How AI Platform Teams Tackle Scalability Challenges”2025年3月10日及Uber GenAI Gateway相关技术分享。¹⁵ 金融业对AI的采用采取隔离策略仅将小部分非贷款核心数据放入AI试点进行反复抽检主体金融交易仍由传统系统决定。系综合多篇金融科技行业报道和学术文献中对2025年前后银行业AI试点策略的普遍描述精确来源已难以逐一定位。¹⁶ 关于通过光标位置、悬浮事件等用户交互数据推断行为模式和认知状态的前沿研究。相关研究成果散见于学术文献中对人机交互中“低信号推断”的讨论滑铁卢大学AI Group等机构在该领域有活跃研究。此处引用的是这一类研究的总体结论而非单一论文的精确结果。¹⁷ “寄生-共生转化”作为一个学术概念在哲学、科学技术研究STS和伦理等领域有历史渊源。2025年前后随着AI深度嵌入操作系统该概念被部分研究机构重新引入讨论。因原始研究文献的公开检索受限此处仅引用这一思想倾向的存在。