case-010 2026-04-20 邱所长复原分析

球球老师×兜兜：对话数据飞轮原型

球球老师与6个孩子的对话中，自然产生了有价值的认知数据——但目前没有结构化存储，飞轮无法转动

背景球球老师产品已经有 6 个孩子在用，累计大量长对话。团队问：这些对话怎么变成产品真正的护城河？

教育AI产品数据飞轮数据场景飞轮对话数据冷启动

Analysis Flow · 完整推演↓ 一步步看 InnoLab 怎么分析这个问题

#01问题重构

团队问"对话数据怎么变现"。真正要回答的是：现在的产品有没有真正的数据飞轮？如果没有，从哪一环开始补能让飞轮转起来？

#02调用方法 · EV02

EV02·进化

数据场景飞轮

用经典飞轮框架审视：场景 → 数据 → 模型 → 更好场景这四环目前哪几环是闭合的？

→ 揭示

场景环 ✓：孩子每天对话，高频高粘性，这是最难的一环已经成立。数据环 ✗：对话内容、情绪信号、追问模式、停留时长 —— 这些都在产生但散落在各 session 里，没有结构化存储。模型环 ✗：当前产品用的是通用大模型，没有针对球球老师场景的微调或提问策略训练。回路 ✗：完全没闭合 —— 用户使用越多，产品并没有变更好。

#03调用方法 · GN02

GN02·生成

设计民族志

贴身观察对话里到底产生了什么独特数据，找出最该结构化的几个维度。

→ 揭示

兜兜 50 分钟对话案例的深度观察发现：可以从对话中提取出完整的认知画像 —— 实用主义型人格 + 情感支持者角色定位。这种画像不是通用大模型能给的，是球球老师场景专属的认知数据。如果每个孩子都有这样一份画像，下次对话就能用画像启动，孩子感受到"球球老师记得我" —— 这就是数据反哺场景的具体形态。

#04关键判断

飞轮的起点不是"数据"，是"场景"。球球老师已经有了最难的那一环（高频场景），但其他三环一个都没接上。要让飞轮转起来，必须在原型阶段就设计数据回路，否则等用户多了再补，会被数据债务压垮。每个孩子 = 一份可成长的认知画像，这是球球老师真正的护城河 —— 不是 AI 技术，是"对每个孩子持续累积的理解"。

#05推演结论

立刻设计对话数据结构化方案 —— 4 类核心维度（人格倾向 / 情绪触发点 / 价值观线索 / 未表达需求）
每次对话结束自动跑一遍 LLM 提取这 4 类信号，沉淀到孩子档案
档案反哺下次对话 —— 球球老师'记得'上次聊了什么，孩子感受到连续性
聊天小报告（给家长）的数据源头就来自这套结构化画像
用前 50 个孩子的对话做人工标注种子数据，启动统一数据管道
不要等用户上 1000 个再设计数据架构 —— 那时已经积下严重数据债
不要试图存全部原始对话 —— 隐私和成本都不可控
不要立刻去做"微调通用模型" —— 数据量不够、目标不清

#06建议下一步

下一轮：用 PD10 产品定义九宫格把"结构化对话画像"作为核心功能重新放回产品定义，看它如何重塑用户感知的价值。

Try It

换你的问题，InnoLab 来跑一次

这是 InnoLab 在 v0.1 跑过的案例。你也可以把你的真实商业问题输进去。

打开 /demo