
:
你好,我是曹犟,欢迎关注我的公众号。
在上一篇文章三个 40 岁老程序员决定用 AI 重新出发(一):开篇中,我介绍了我们三个“老”程序员决定用 AI Native 的方式从零开始做一个产品的背景和初衷。我们提出的核心方法论是“文档驱动的 Spec Coding”,而整个路径的起点,就是商业计划书。
这篇文章,我会详细分享我们是如何用 AI 来完成商业计划书的——从为什么要写,到写什么,再到用什么工具写。
PART01
为什么商业计划书是起点
很多人一提到商业计划书(BP),第一反应就是“这是给投资人看的”。这个理解没有错,但不完整。
对于我们这个小团队来说,BP 首先是给自己看的。
第一,BP 强迫你想清楚关键问题。
市场有多大?客户是谁?痛点是什么?竞争对手有哪些?你的差异化在哪里?商业模式怎么跑通?这些问题,在你激情满满地想要开始写代码之前,必须先想清楚。
作为一个业务一号位的最主要工作,也是应该持续思考这些问题,并在这个过程中迭代自己的认知。
第二,BP 是后续所有工作的“北极星”。
有了 BP,后续的产品设计、技术选型、市场推广,都有了一个可以参照的基准。当对某个决策有分歧时,可以回到 BP 来看:这个决策是否符合我们的定位?是否在解决我们定义的核心痛点?
第三,BP 本身就是一个验证过程。
写 BP 的过程中,你会发现很多自己原本没想到的问题。某个假设经不起推敲,某个市场数据和直觉不符,某个竞品的定位和你想象的不一样。这些发现,都是在真正投入大量资源之前就暴露出来的风险。
简单来说,BP 不是走形式,而是真正帮你把想法从模糊变清晰、从感性变理性的工具。
PART02
BP 到底要回答什么
我们这次做的依然是 2B 生意,所以 BP 的核心逻辑也围绕 2B 展开。
我对中国的 2B 软件行业有一个有趣的总结:所谓 2B,是“跟客户关系好,客户恰好有个问题觉得你可以解决,让你来解决”;而不是“做出一个产品到处问客户要不要”。
这背后代表的是 2B 生意的本质:你要回答的核心问题是,给什么客户解决什么问题,拿他的什么预算,整个链条上各方的利益关系是怎样的。
理解三种预算
在深入讨论 BP 的具体内容之前,我想先分享一个我自己过去几个月认知的一个重要迭代,对企业预算的三种类型的理解。
IT 预算:由 CIO 或 CTO 负责,本质上是成本中心(Cost Center)。决策时主要看合规与安全、稳定性与 SLA、可运维与可集成、以及降本的确定性。传统的企业软件,比如 ERP、CRM、数据平台,拿的都是这个预算。
BPO 预算:由业务、运营或共享服务中心负责,也偏向成本中心。通常按量或按结果付费,主要看 SLA。外包客服、代运营等业务拿的是这个预算。
营销预算:由 CMO 或增长负责人负责,是增长中心(Growth Center)。决策时主要看 ROI 和增量效果。广告投放、营销工具等拿的是这个预算。
这三种预算的规模和审批效率往往是数量级的差异:IT 预算审批最慢、金额通常最少;营销预算审批最快、金额通常最多。
传统 2B 软件的生意大多是拿 IT 预算,但在大模型时代,软件本身的价值正在被重新定义。我自己打过一个比方:“你妈妈做的饭,肯定比餐馆做的饭更符合你的胃口;自己公司研发的软件,肯定比任何公司研发的软件更符合本公司的实际需求,只不过成本更高。”但是,有了 AI,每个公司都可以用更低的成本来“自己做饭”了。这一方面意味着卖软件的拿 IT 预算的难度会大大提升,但反过来,也让我们可能有机会去拿营销预算——如果你能证明你的产品直接带来效果。
BP 要回答的八个核心问题
基于以上的思考框架,我们认为一份好的 2B 产品 BP 需要回答以下八个核心问题:
1. 产品定位
- 一句话说清你是什么
- 目标客户是谁
- 核心价值主张是什么(客户到底在为什么掏钱)
2. 市场空间
- TAM(Total Addressable Market)有多大
- 分阶段的市场边界是什么
- 估算的逻辑和数据来源是什么
3. 痛点分析
- 现状有多痛
- 现有方案为什么不够好
- 为什么现在是好时机
4. 竞品分析
- 直接竞争者是谁
- 替代方案有哪些
- 你的差异化在哪里
5. 生态位分析
- 你处于整个生态的什么位置
- 上下游分别是谁
- 他们对你是什么态度(支持、中立还是反对)
6. 核心竞争力
- 你有什么别人没有的
- 护城河是什么
- 进入这个领域的优势和劣势是什么(需要诚实自评)
7. 关键假设与验证
- 我们这个商业模式能够成立的前提假设是什么
- 每个假设的验证指标、验证时间和风险预案是什么
8. 实施路线图
- 每个阶段的目标是什么
- 每个阶段的核心工作是什么
- 成功标准是什么(需要可量化)
Agent 创业的陷阱
对于现在最火的 Agent 类产品创业,我觉得有一个特别需要警惕的陷阱:不要去做那种会被基础模型能力一升级就“顺手覆盖”掉的东西。
比如你做的是“帮用户做 PPT”的 Agent。那么一旦基座模型把“生成 PPT”这件事做得足够简单顺滑,用户很可能直接在基础模型里就把活干了,你的 Agent 就只是一个可有可无的壳。
所以,我们应该追求的是:当基础模型变强时,我们的 Agent 也会跟着变强。也就是说,你的 Agent 要建立在基座模型之上,充分吃到它进步带来的红利,而不是试图和它正面竞争、重复造轮子。
更进一步,尽量选择那些能积累知识、能形成闭环的场景:在真实服务过程中沉淀下来的行业经验、客户数据、决策规则、执行反馈,才是你真正的资产。长期来看,正是这些可积累的“组织记忆”,才是我们的 Agent 能够替代人类,并在和基模公司之间形成差异化的护城河。
除此之外,要尽量选择那些 token ROI 足够大的行业,否则就可能沦为 token 的转售商了。
PART03
市场调研:Google Deep Research
有了清晰的问题框架,接下来就是收集信息来回答这些问题。这里我们主要使用的工具是 Google 的 Deep Research 功能。
什么是 Deep Research
Deep Research 是 Google 提供的一个深度研究功能。与普通的搜索不同,它会自动进行多轮搜索、阅读多个网页、综合信息,最终生成一份结构化的研究报告。
简单来说,它像是一个会自己上网查资料、读文章、做总结的研究助理。
我们怎么用它
我们经常用 Deep Research 来回答以下几类问题
:
行业规模和增速:比如“全球社交媒体营销软件市场规模是多少?增速如何?主要玩家有哪些?”
竞争格局分析:比如“Hootsuite、Buffer、Sprout Social 这几个产品的定位是什么?主要功能差异有哪些?它们是如何定价的?目标客户有何不同?市场规模分别多大”
目标客户画像:比如“中小型电商企业在社交媒体营销上的主要痛点是什么?他们每年在这方面的预算是多少?他们目前用什么工具,有什么问题?预算大概是多少?”
这几类问题如果人来做,需要搜索查阅大量行业报告、对比多个产品的官网和评测、综合用户访谈和论坛讨论等多种来源的信息,工作量很大。Deep Research 可以帮我们快速完成初步的信息整合和汇总。
实操技巧
使用 Deep Research 有几个实操技巧:
提问要具体:不要问“社交媒体营销市场怎么样”,而是问“2024 年北美市场 SMB 企业在社交媒体管理工具上的年均支出是多少,过去三年的增速如何”。问题越具体,得到的答案越有价值。
要求给出来源:在提问时明确要求“请给出数据来源和链接”,这样你可以后续验证这些信息的可靠性。
交叉验证:Deep Research 给出的数据不一定准确,特别是一些细分市场的数据。我们通常会用多个来源交叉验证,或者直接去查阅它引用的原始报告。
局限性
Deep Research 也有明显的局限性:
数据时效性:它能搜索到的信息取决于 Google 的索引,最新的数据可能还没有被收录。
中文信息不足:对于中国市场的信息,Deep Research 的覆盖度明显不如英文市场。
需要人工判断:它给出的信息只是基于网上已有内容的综合,无法给出原创性的洞察。市场机会的判断、趋势的预测,最终还是需要人来做。
我们的经验是:把 Deep Research 当作一个高效的信息收集工具,而不是决策工具。它能帮你快速建立对一个领域的基本认知,但最终的判断还是需要靠你自己。
PART04
头脑风暴:SuperClaude 的 Business Panel
收集完信息之后,下一步是对这些信息进行分析和讨论。这里我们使用的工具是 SuperClaude 框架中的 sc:business_panel 功能。
什么是 SuperClaude
SuperClaude(https://github.com/SuperClaude-Org/SuperClaude_Framework) 是一个开源的 Claude Code 增强框架,它通过一系列预设的 Prompt 和工作流,让 Claude 能够更好地完成特定类型的任务。我们在整个开发过程中大量使用了这个框架。
sc:business_panel 的作用
sc:business_panel 是一个模拟商业专家小组讨论的功能。当你输入一个商业问题或方案时,它会通过模拟知名商业思想家组成的专家小组来审视这个问题,给出不同角度的反馈。

简单来说,它像是一个能够从多个视角来挑战你想法的“虚拟董事会”。
我们怎么用它
我们主要用来做以下几件事:
商业模式讨论:当我们对定价模式、目标客户、价值主张等核心问题有初步想法时,会用 business_panel 来做压力测试。它会从不同角度提出质疑,帮我们发现自己没想到的问题。
竞争策略验证:当我们制定了差异化策略后,会用 business_panel 来检验这个策略是否站得住脚——我们的差异化是否真实存在?客户是否真的在意这个差异?这个优势能持续多久?
风险识别:我们会把自己的商业计划书草稿输入给 business_panel,让它扮演一个挑剔的投资人,尽可能找出计划中的漏洞和风险点。
价值与局限
在与它交流的过程中,会发现,它会提出一些我们之前的确没有想到过的问题,找到我们的思维盲区。这就是 business_panel 的最大价值:提供多元化的视角,避免我们陷入创业者常见的“自嗨”陷阱。
但它也有局限:它的反馈是基于通用的商业知识,而不是对特定市场的深入了解。所以它更适合用来发现问题,而不是给出答案。最终的判断,还是需要你结合自己对市场的了解来做。
PART05
文档撰写:结构化的人机协作
在有了充分的调研和讨论之后,我们就需要把这些内容整理成一份正式的商业计划书。这里我们主要使用的是 SuperClaude 的 sc:document 命令提供的结构化文档生成能力。

我们的工作流
我们的 BP 撰写流程是这样的:
第一步,人来定结构。我们先确定 BP 要包含哪些章节、每个章节要回答什么问题。这个结构是基于前文提到的“八个核心问题”框架,但会根据我们产品的特点做一些调整。
第二步,人来填核心观点。对于每个章节的核心观点和结论,我们会先用简短的文字写下来。比如“目标客户是北美市场的中小型电商企业,年营收在 100 万到 1000 万美元之间”。
第三步,AI 来扩写。有了结构和核心观点,我们用 sc:document 让 Claude 帮我们把这些要点扩展成完整的段落,补充必要的论证和数据支撑。
第四步,人来审校和调整。AI 生成的内容,我们会仔细审校,调整不准确的地方,补充 AI 没有覆盖到的信息,确保整体逻辑自洽。
人机协作的边界
在这个过程中,我们逐渐摸索出了人和 AI 各自擅长什么:
AI 擅长的事情:
- 结构化:把零散的想法整理成有条理的文档
- 文字润色:让表达更清晰、更专业
- 信息整合:把多个来源的信息综合在一起
- 格式规范:确保文档格式统一、美观
人擅长的事情:
- 洞察:发现市场中被忽视的机会
- 判断:在多个选项中做出取舍
- 审美:决定产品的调性和风格
- 偏好:确定什么对我们来说最重要
简单来说,AI 帮我们解决了“怎么写”的问题,但“写什么”的决定权始终在我们手里。
Single Source of Truth
还有一点很重要:文档驱动的项目必然会产生大量文档——BP、Use Case、Requirements、技术设计、API 文档等等。这些文档之间往往有重复的内容,比如产品定位、目标客户这些信息,在 BP 和 Use Case 中都需要。
虽然 AI 很擅长维护文档,但为了节省上下文、减少工作量,我们的做法是:把重复的内容抽取出来,形成唯一来源,其他文档只保持引用。
比如产品定位,我们只在 BP 中详细描述一次,Use Case 文档需要用到时就引用 BP 的相关章节,而不是再写一遍。这样做的好处是:当产品定位需要调整时,只需要改一个地方,所有引用它的文档自动保持一致。
PART06
人的不可替代性
在这个过程中,我们也在持续探索,在与 AI 的协作中,人还有什么价值?
有些决策只能人来做
战略方向的选择:我们要做公域营销还是私域运营?要做海外还是国内?要拿 IT 预算还是营销预算?这些战略层面的选择,AI 可以帮你分析利弊,但最终的决定必须由人来做,因为这本质上代表团队的价值判断和风险偏好。
价值观和审美的取舍:产品的调性是严肃专业还是轻松友好?UI 是简洁克制还是功能丰富?这些问题没有标准答案,取决于创始人的审美和品味。
对市场的直觉判断:有些机会,数据上可能根本体现不出来,但是你凭借多年的行业经验,就是觉得“这个事情能成”。这种直觉和“任性”,也是任何 AI 都无法替代的。
AI 是放大器,不是替代者
AI 放大了我们的执行能力:原来需要一周才能写完的文档,现在一天就能完成。原来需要一个人花三天做的市场调研,现在两个小时就能有初步结论。
但它无法替代我们的思考。如果本来就不知道要做什么,AI 也帮不上忙。如果对市场没有洞察,AI 也只会给一堆正确但没用的废话。
我总喜欢说,“优秀的程序员,会因为有了 AI 而变成更优秀的程序员;水货程序员,有了 AI 也只会变成一个更大的水货。”
AI 确实大幅提高了执行效率,但思考的时间是省不掉,或者说,也不应该省的。好的 BP 不是写出来的,是想出来的。AI 能帮忙检索和汇总各种信息,能帮忙给出需要回答的问题,能够把想法变成文字,但想法本身,还是得靠人自己。
PART07
写在最后
总结一下,商业计划书是整个项目的起点,它不是写给投资人的“作业”,而是让我们把想法从模糊变清楚的思考框架。对于 2B 业务,最重要的就是说清楚,解决谁的什么问题,拿他的什么预算。Google Deep Research、SuperClaude 这些工具,能够大幅度帮我们提升效率,但是,人的深度和持续的思考,人的评委与审美,人的“任性”与决策,依然是 AI 所无法替代的。
在下一篇文章中,我会分享在有了 BP 之后,我们是如何设计 MVP 的 Use Case 的。为什么我们会选择 Use Case 驱动而不是传统的 PRD?在这个过程中我们如何用 Claude 和 Gemini 配合完成业务细节的讨论?敬请期待。
以上都是一家之言,仅供参考。欢迎大家与我交流讨论。