数据×场景飞轮（EV02）

解决什么问题

没有这个方法时，企业做AI的常见错误：

数据囤积：先大量收集数据，再想怎么用→数据有了但没价值
场景空转：有AI场景但没有数据回路→模型越用越差
飞轮不转：知道飞轮概念但不知道摩擦力在哪

这个方法帮你找到飞轮的启动点、识别摩擦力、设计加速策略。

核心框架

        ┌──────────┐
        │  核心场景  │ ← 起点：不是数据，是场景
        └────┬─────┘
             │ 产生
             ▼
        ┌──────────┐
        │   数 据   │ ← 场景自然产生的数据
        └────┬─────┘
             │ 训练
             ▼
        ┌──────────┐
        │  AI模型   │ ← 数据喂养的智能引擎
        └────┬─────┘
             │ 优化
             ▼
        ┌──────────┐
        │ 更好的场景 │ ← 模型提升场景体验
        └────┬─────┘
             │ 产生更好的数据
             └────────→ 回到顶部 🔄

飞轮启动逻辑：不是先有数据再有AI，而是先有场景→场景产生数据→数据驱动AI→AI优化场景。场景是起点，不是数据。

怎么用

Step 1：定义核心场景

选择飞轮启动的场景，三个条件：

数据丰富：场景中自然产生大量有价值数据
决策频繁：每天/每周都有高频决策需要AI辅助
反馈闭环：决策结果能被快速验证（对/错、好/坏）

Step 2：绘制数据回路

回答四个问题：

数据从哪来？（用户行为/业务操作/外部接入）
数据怎么存？（结构化标准、存储方式）
数据怎么流？（从场景到模型到反馈的完整路径）
数据怎么用？（模型训练、实时推理、效果评估）

Step 3：定义智能引擎

在哪个环节嵌入AI模型？

推荐引擎（给用户推什么）
预测引擎（会发生什么）
决策引擎（应该怎么做）
生成引擎（自动产出什么）

Step 4：识别摩擦力

飞轮转不起来一定有阻力：

摩擦力类型	表现	解决方案
数据质量差	噪声太多，模型训练不出来	数据治理，提高数据采集标准
反馈延迟	决策结果要很久才能验证	缩短反馈周期，用代理指标
模型更新慢	数据变了但模型没更新	自动化训练管道
场景割裂	多个场景数据不互通	统一数据平台

Step 5：设计飞轮启动策略

飞轮冷启动需要外力——靠自然转动太慢：

人工标注种子数据
规则引擎先跑起来（不等AI模型完美）
找到"转速最快"的场景先突破

诊断分级

等级	特征
S级	核心场景有明确定义，数据回路有架构设计，摩擦力有排查清单，冷启动策略有具体方案
A级	场景和飞轮逻辑清晰，但摩擦力分析不够
B级	知道飞轮概念但没有具体绘制数据回路
C级	"我们有数据"——没有飞轮思维

案例

场景：球球老师的对话数据飞轮

核心场景：儿童与AI的对话交互
数据产生：每段对话自然产生（对话内容、情绪信号、追问模式、停留时长）
模型训练：用对话数据训练"更好的提问策略"模型
场景优化：模型让对话更深、更准、更个性化
更好数据：更深入的对话产生更有价值的认知数据

摩擦力：目前最大摩擦是"数据没有结构化存储"——对话散落在各session里，没有统一管道。需要先把数据回路搭起来，飞轮才能真正转。

常见陷阱

场景选错：选了数据少或反馈慢的场景，飞轮转不动。纠偏：三个条件（数据丰富、决策频繁、反馈闭环）缺一不可。
只有数据没有飞轮：数据在积压但没有回流到场景。纠偏：画出完整的数据回路——如果回路不闭合就不是飞轮。
冷启动依赖：等着飞轮自然转动。纠偏：飞轮初期需要外力——人工标注、规则引擎、种子用户。

方法关系

前置：ST16 智能密度评估（判断哪个场景最适合启动飞轮）、DC01 场景价值矩阵（筛选高价值场景）
后续：CG06 L2-L4跃迁诊断（飞轮转起来后需要人机协作成熟度匹配）、EV01 AARRR（飞轮效果用增长指标衡量）
并行：ST10 流程三阶进化论（飞轮加速的过程也是流程重构的过程）