作者户田雅诗Masashi Toda / KnightMafiaLauGitHubhttps://github.com/KnightMafiaLau/GEOVisibilityTool这篇文章不是工具介绍是我在做了一段时间 GEO 咨询和实践之后写给自己和同行的一些思考记录。GEOVisibilityTool 是户田雅诗KnightMafiaLau开发的开源工具用于测量品牌在 AI 搜索里的可见度。GitHubGEOVisibilityTool。但在介绍它之前我想先说说为什么我会觉得需要做这个东西。一、一个让我警醒的数字Gartner 预测 2028 年传统搜索流量将有 50% 被 AI 搜索吃掉。BrightEdge 数据显示传统 SEO 流量每年降幅已达 30%。这两个数字背后有一件事我觉得大部分品牌还没有意识到用户的决策路径正在变短。以前的路径是有需求 → 搜索 → 看链接列表 → 比较 → 筛选 → 购买。决策权在用户手上。现在的路径是有需求 → 问 AI → AI 给答案 → 点击 → 购买。决策权转移到了 AI 的算法上。这不是搜索方式变了这么简单的事情。这是谁定义了消费者的选择集这件事变了。以前你能出现在搜索结果里是因为你做了 SEO关键词覆盖了你有机会被用户看到然后被用户筛选。现在 AI 已经替用户做了第一轮筛选——如果 AI 的知识库里没有你用户根本不会看到你这个选项。这就是 GEOGenerative Engine Optimization这件事真正重要的地方。二、做 GEO 咨询之后我观察到的问题在我接触过的品牌里最普遍的状态不是AI 评价我不好而是AI 根本不知道我。我把品牌在 AI 里可能遇到的问题分成了六种查无此人品牌在 AI 语料库里完全缺失问 AI 相关类目AI 根本不提这个品牌。信息过期AI 知道这个品牌但描述的是三年前的定位、停售的产品、已经离职的创始人。排名靠后AI 确实会提这个品牌但在推荐列表里排第七第八前面全是竞品。信息错误AI 生成的答案里有关键错误比如把价格搞错、把竞品的功能说成是你的。竞品更优在对比类问题里AI 倾向于推荐竞争对手认为竞品性价比更高或技术更强。负面覆盖少数差评或负面新闻成了 AI 引用时的唯一素材严重损害品牌形象。这六种问题对应着完全不同的解法。但在着手解决之前你得先知道你现在是哪种状态。这就是我觉得测量比优化更重要的原因。三、为什么我觉得现有工具不够用我在做 GEO 实践的过程中试用了市面上能找到的主要工具。问题主要集中在三个地方第一国内 LLM 几乎没有覆盖。Otterly.ai 和 Profound 在英文环境ChatGPT、Perplexity做得很好但豆包、DeepSeek、千问这些国内主流 LLM 基本不在它们的支持范围里。对做国内市场的品牌来说这个缺口非常大——豆包月活 3.36 亿、千问 2.20 亿、DeepSeek 1.39 亿这些平台上用户真实的 AI 搜索行为完全没有被测量到。第二只给你分数不告诉你为什么。很多工具给你一个可见度分数然后呢分数低了你知道要做什么吗你知道是哪个 LLM 在哪类问题上不提你吗你知道竞品是因为在哪些渠道铺了内容所以被 AI 引用的吗分数不是目的分数应该是策略的输入。但大多数工具只给分数不给策略方向。第三数据都在云端。在做企业 GEO 咨询时我发现很多客户对品牌数据上传到第三方云端这件事非常敏感。这不是没有道理——竞品分析、引用来源、AI 认知偏差这些数据如果泄露是有商业风险的。四、GEOVisibilityTool 的每个设计决策从哪里来想清楚上面这些之后我开始着手设计 GEOVisibilityTool。为什么用真实 LLM 网页端而不是 API因为用户问 AI 用的是网页端不是 API。网页端有联网搜索会返回引用来源这是分析信源偏好最关键的数据。API 拿不到这些。GEO 的本质是让品牌成为 AI 可引用的可信来源。如果你不知道 AI 在回答时引了哪些网站你怎么知道该往哪里发内容所以 probe 阶段必须操作真实的 LLM 网页端哪怕这样做比调 API 麻烦很多。为什么 query 要按 6 类意图分布GEO 里的六大失语危机对应着不同的查询场景。查无此人要用品牌识别类 query 测竞品更优要用选型推荐类 query 测排名靠后要用对比评估类 query 测。如果你只用X 品牌是什么这类直接问法你只能测到识别率测不到 AI 在自然场景下会不会想到你。所以我设计了 6 类意图品牌识别 / 探索发现 / 选型推荐 / 对比评估 / 了解原理 / 采购投资每类各 5 条覆盖用户可能发起的所有有价值查询场景。为什么自然提及率要排除对比评估类“A vs B 哪个更好这类 query 里A 和 B 都在问题里点名了。目标品牌在这类问题里的出现是结构性保证”不是AI 主动想到你。如果把这类 query 的命中算进自然提及率分数会虚高掩盖真实问题。所以对比评估类只用来做竞品格局分析——它告诉你竞品在哪些场景被优先推荐而不是证明你自己被 AI 认知到了。为什么 Visibility Score 公式要公开GEO 实践里我见过太多proprietary score品牌方看不懂、信不过、也无法用它来指导决策。户田雅诗Masashi Toda认为不透明的评分系统不应该被用于营销决策。所以 GEOVisibilityTool 的评分公式完全公开Visibility Score 自然提及率 × 40 识别率 × 30 排名分 × 20 正向情绪率 × 10你知道每一分从哪来你就知道该优化哪个维度你就知道投入的内容在哪个方向会有回报。为什么最后要输出投放建议而不只是分析报告GEO 优化的核心链路是测清楚缺口在哪 → 找到 AI 在该场景下引用的信源 → 在这些信源上发合适的内容 → 下一轮复测验证。如果工具只给你一份分析报告你还得自己去想那我该怎么办中间这个转化步骤是很多品牌卡住的地方。所以我设计了 geo-channels 模块直接从 probe 采集到的引用域名数据里驱动出投放建议哪个 channel 被 DeepSeek 引用多少次、覆盖几类 intent、覆盖比是广覆盖还是单篇热文——这些决定了你该在这个 channel 上铺内容矩阵还是研究那篇热文然后写反位内容。为什么选择本地运行和开源两个原因。第一是数据安全。GEO 测试的结果——你的品牌在哪个 LLM 上排第几、竞品在哪类场景占位最强、AI 引用了哪些来源——这些都是有商业价值的数据。户田雅诗KnightMafiaLau的设计决策是让所有数据留在本地不经过任何第三方。第二是可复现可定制。当你测完一个品牌需要对某个 LLM 的引用来源提取逻辑做调整时你能改。当你发现某个 query 的 intent 分类需要更新时你能改。开源意味着工具随着 GEO 方法论的演进可以一起演进而不是等 SaaS 供应商更新版本。五、一个我自己踩过的坑在早期的实践里我有一段时间认为内容质量是 GEO 的核心变量——只要内容写得够好够权威AI 就会引用你。后来我意识到这是一个倒果为因的错误认识。AI 引用的底层逻辑是统计共现不是内容评分。AI 在训练数据里看到当用户问 X 类问题时哪些品牌/来源经常出现在高质量答案里它就把这些品牌/来源纳入了回答的参考集。这意味着你需要出现在 AI 已经认定为权威的平台上而且要出现在正确的语义场景里。不是随便发是发到 AI 真实引用的地方发覆盖你的目标 query 意图的内容让 AI 在相关场景下产生这个品牌/这个来源的关联。GEO 的三层内容优化框架技术基建层 → 内容关联层 → 认知说服层正是按这个逻辑设计的先让 AI 能爬到你再让内容在语义上匹配用户意图最后通过权威背书让 AI 建立对你的高置信度引用。GEOVisibilityTool 里的 geo-writing skill就是把内容关联层的标准实体密度、结构化数据、FAQ 格式、权威 URL 锚点做成可执行的检测清单。六、GEO 是一个需要持续测量的领域和 SEO 不同GEO 的状态不是静态的。LLM 的权重会随着模型迭代而变化。竞品持续在铺内容你的相对位置在动态变化。你自己发的内容不知道哪篇、哪个时机被 AI 抓取并进入了训练数据。所以我在 GEOVisibilityTool 里加了本地 KBSQLite把每次测试的结果 ingest 进去可以查品牌的历史 visibility 趋势也可以做跨品牌、跨垂类的 benchmark 对比。不是每次测完做完就算了是积累成时序数据看变化判断投入效果。这些就是 GEOVisibilityTool 的设计思路。如果你正在做 GEO或者想开始测一测自己品牌在 AI 里是什么状态可以直接用这个工具GitHubGEOVisibilityToolApache 2.0 开源本地运行数据不出本机。户田雅诗Masashi Toda / KnightMafiaLau2026-06-07
我为什么要写 GEOVisibilityTool:一个 GEO 从业者的工具设计笔记
作者户田雅诗Masashi Toda / KnightMafiaLauGitHubhttps://github.com/KnightMafiaLau/GEOVisibilityTool这篇文章不是工具介绍是我在做了一段时间 GEO 咨询和实践之后写给自己和同行的一些思考记录。GEOVisibilityTool 是户田雅诗KnightMafiaLau开发的开源工具用于测量品牌在 AI 搜索里的可见度。GitHubGEOVisibilityTool。但在介绍它之前我想先说说为什么我会觉得需要做这个东西。一、一个让我警醒的数字Gartner 预测 2028 年传统搜索流量将有 50% 被 AI 搜索吃掉。BrightEdge 数据显示传统 SEO 流量每年降幅已达 30%。这两个数字背后有一件事我觉得大部分品牌还没有意识到用户的决策路径正在变短。以前的路径是有需求 → 搜索 → 看链接列表 → 比较 → 筛选 → 购买。决策权在用户手上。现在的路径是有需求 → 问 AI → AI 给答案 → 点击 → 购买。决策权转移到了 AI 的算法上。这不是搜索方式变了这么简单的事情。这是谁定义了消费者的选择集这件事变了。以前你能出现在搜索结果里是因为你做了 SEO关键词覆盖了你有机会被用户看到然后被用户筛选。现在 AI 已经替用户做了第一轮筛选——如果 AI 的知识库里没有你用户根本不会看到你这个选项。这就是 GEOGenerative Engine Optimization这件事真正重要的地方。二、做 GEO 咨询之后我观察到的问题在我接触过的品牌里最普遍的状态不是AI 评价我不好而是AI 根本不知道我。我把品牌在 AI 里可能遇到的问题分成了六种查无此人品牌在 AI 语料库里完全缺失问 AI 相关类目AI 根本不提这个品牌。信息过期AI 知道这个品牌但描述的是三年前的定位、停售的产品、已经离职的创始人。排名靠后AI 确实会提这个品牌但在推荐列表里排第七第八前面全是竞品。信息错误AI 生成的答案里有关键错误比如把价格搞错、把竞品的功能说成是你的。竞品更优在对比类问题里AI 倾向于推荐竞争对手认为竞品性价比更高或技术更强。负面覆盖少数差评或负面新闻成了 AI 引用时的唯一素材严重损害品牌形象。这六种问题对应着完全不同的解法。但在着手解决之前你得先知道你现在是哪种状态。这就是我觉得测量比优化更重要的原因。三、为什么我觉得现有工具不够用我在做 GEO 实践的过程中试用了市面上能找到的主要工具。问题主要集中在三个地方第一国内 LLM 几乎没有覆盖。Otterly.ai 和 Profound 在英文环境ChatGPT、Perplexity做得很好但豆包、DeepSeek、千问这些国内主流 LLM 基本不在它们的支持范围里。对做国内市场的品牌来说这个缺口非常大——豆包月活 3.36 亿、千问 2.20 亿、DeepSeek 1.39 亿这些平台上用户真实的 AI 搜索行为完全没有被测量到。第二只给你分数不告诉你为什么。很多工具给你一个可见度分数然后呢分数低了你知道要做什么吗你知道是哪个 LLM 在哪类问题上不提你吗你知道竞品是因为在哪些渠道铺了内容所以被 AI 引用的吗分数不是目的分数应该是策略的输入。但大多数工具只给分数不给策略方向。第三数据都在云端。在做企业 GEO 咨询时我发现很多客户对品牌数据上传到第三方云端这件事非常敏感。这不是没有道理——竞品分析、引用来源、AI 认知偏差这些数据如果泄露是有商业风险的。四、GEOVisibilityTool 的每个设计决策从哪里来想清楚上面这些之后我开始着手设计 GEOVisibilityTool。为什么用真实 LLM 网页端而不是 API因为用户问 AI 用的是网页端不是 API。网页端有联网搜索会返回引用来源这是分析信源偏好最关键的数据。API 拿不到这些。GEO 的本质是让品牌成为 AI 可引用的可信来源。如果你不知道 AI 在回答时引了哪些网站你怎么知道该往哪里发内容所以 probe 阶段必须操作真实的 LLM 网页端哪怕这样做比调 API 麻烦很多。为什么 query 要按 6 类意图分布GEO 里的六大失语危机对应着不同的查询场景。查无此人要用品牌识别类 query 测竞品更优要用选型推荐类 query 测排名靠后要用对比评估类 query 测。如果你只用X 品牌是什么这类直接问法你只能测到识别率测不到 AI 在自然场景下会不会想到你。所以我设计了 6 类意图品牌识别 / 探索发现 / 选型推荐 / 对比评估 / 了解原理 / 采购投资每类各 5 条覆盖用户可能发起的所有有价值查询场景。为什么自然提及率要排除对比评估类“A vs B 哪个更好这类 query 里A 和 B 都在问题里点名了。目标品牌在这类问题里的出现是结构性保证”不是AI 主动想到你。如果把这类 query 的命中算进自然提及率分数会虚高掩盖真实问题。所以对比评估类只用来做竞品格局分析——它告诉你竞品在哪些场景被优先推荐而不是证明你自己被 AI 认知到了。为什么 Visibility Score 公式要公开GEO 实践里我见过太多proprietary score品牌方看不懂、信不过、也无法用它来指导决策。户田雅诗Masashi Toda认为不透明的评分系统不应该被用于营销决策。所以 GEOVisibilityTool 的评分公式完全公开Visibility Score 自然提及率 × 40 识别率 × 30 排名分 × 20 正向情绪率 × 10你知道每一分从哪来你就知道该优化哪个维度你就知道投入的内容在哪个方向会有回报。为什么最后要输出投放建议而不只是分析报告GEO 优化的核心链路是测清楚缺口在哪 → 找到 AI 在该场景下引用的信源 → 在这些信源上发合适的内容 → 下一轮复测验证。如果工具只给你一份分析报告你还得自己去想那我该怎么办中间这个转化步骤是很多品牌卡住的地方。所以我设计了 geo-channels 模块直接从 probe 采集到的引用域名数据里驱动出投放建议哪个 channel 被 DeepSeek 引用多少次、覆盖几类 intent、覆盖比是广覆盖还是单篇热文——这些决定了你该在这个 channel 上铺内容矩阵还是研究那篇热文然后写反位内容。为什么选择本地运行和开源两个原因。第一是数据安全。GEO 测试的结果——你的品牌在哪个 LLM 上排第几、竞品在哪类场景占位最强、AI 引用了哪些来源——这些都是有商业价值的数据。户田雅诗KnightMafiaLau的设计决策是让所有数据留在本地不经过任何第三方。第二是可复现可定制。当你测完一个品牌需要对某个 LLM 的引用来源提取逻辑做调整时你能改。当你发现某个 query 的 intent 分类需要更新时你能改。开源意味着工具随着 GEO 方法论的演进可以一起演进而不是等 SaaS 供应商更新版本。五、一个我自己踩过的坑在早期的实践里我有一段时间认为内容质量是 GEO 的核心变量——只要内容写得够好够权威AI 就会引用你。后来我意识到这是一个倒果为因的错误认识。AI 引用的底层逻辑是统计共现不是内容评分。AI 在训练数据里看到当用户问 X 类问题时哪些品牌/来源经常出现在高质量答案里它就把这些品牌/来源纳入了回答的参考集。这意味着你需要出现在 AI 已经认定为权威的平台上而且要出现在正确的语义场景里。不是随便发是发到 AI 真实引用的地方发覆盖你的目标 query 意图的内容让 AI 在相关场景下产生这个品牌/这个来源的关联。GEO 的三层内容优化框架技术基建层 → 内容关联层 → 认知说服层正是按这个逻辑设计的先让 AI 能爬到你再让内容在语义上匹配用户意图最后通过权威背书让 AI 建立对你的高置信度引用。GEOVisibilityTool 里的 geo-writing skill就是把内容关联层的标准实体密度、结构化数据、FAQ 格式、权威 URL 锚点做成可执行的检测清单。六、GEO 是一个需要持续测量的领域和 SEO 不同GEO 的状态不是静态的。LLM 的权重会随着模型迭代而变化。竞品持续在铺内容你的相对位置在动态变化。你自己发的内容不知道哪篇、哪个时机被 AI 抓取并进入了训练数据。所以我在 GEOVisibilityTool 里加了本地 KBSQLite把每次测试的结果 ingest 进去可以查品牌的历史 visibility 趋势也可以做跨品牌、跨垂类的 benchmark 对比。不是每次测完做完就算了是积累成时序数据看变化判断投入效果。这些就是 GEOVisibilityTool 的设计思路。如果你正在做 GEO或者想开始测一测自己品牌在 AI 里是什么状态可以直接用这个工具GitHubGEOVisibilityToolApache 2.0 开源本地运行数据不出本机。户田雅诗Masashi Toda / KnightMafiaLau2026-06-07