球球老师×兜兜:对话数据飞轮原型
球球老师与6个孩子的对话中,自然产生了有价值的认知数据——但目前没有结构化存储,飞轮无法转动
背景球球老师产品已经有 6 个孩子在用,累计大量长对话。团队问:这些对话怎么变成产品真正的护城河?
团队问"对话数据怎么变现"。真正要回答的是:现在的产品有没有真正的数据飞轮?如果没有,从哪一环开始补能让飞轮转起来?
用经典飞轮框架审视:场景 → 数据 → 模型 → 更好场景 这四环目前哪几环是闭合的?
场景环 ✓:孩子每天对话,高频高粘性,这是最难的一环已经成立。数据环 ✗:对话内容、情绪信号、追问模式、停留时长 —— 这些都在产生但散落在各 session 里,没有结构化存储。模型环 ✗:当前产品用的是通用大模型,没有针对球球老师场景的微调或提问策略训练。回路 ✗:完全没闭合 —— 用户使用越多,产品并没有变更好。
贴身观察对话里到底产生了什么独特数据,找出最该结构化的几个维度。
兜兜 50 分钟对话案例的深度观察发现:可以从对话中提取出完整的认知画像 —— 实用主义型人格 + 情感支持者角色定位。这种画像不是通用大模型能给的,是球球老师场景专属的认知数据。如果每个孩子都有这样一份画像,下次对话就能用画像启动,孩子感受到"球球老师记得我" —— 这就是数据反哺场景的具体形态。
飞轮的起点不是"数据",是"场景"。球球老师已经有了最难的那一环(高频场景),但其他三环一个都没接上。要让飞轮转起来,必须在原型阶段就设计数据回路,否则等用户多了再补,会被数据债务压垮。每个孩子 = 一份可成长的认知画像,这是球球老师真正的护城河 —— 不是 AI 技术,是"对每个孩子持续累积的理解"。
- 立刻设计对话数据结构化方案 —— 4 类核心维度(人格倾向 / 情绪触发点 / 价值观线索 / 未表达需求)
- 每次对话结束自动跑一遍 LLM 提取这 4 类信号,沉淀到孩子档案
- 档案反哺下次对话 —— 球球老师'记得'上次聊了什么,孩子感受到连续性
- 聊天小报告(给家长)的数据源头就来自这套结构化画像
- 用前 50 个孩子的对话做人工标注种子数据,启动统一数据管道
- 不要等用户上 1000 个再设计数据架构 —— 那时已经积下严重数据债
- 不要试图存全部原始对话 —— 隐私和成本都不可控
- 不要立刻去做"微调通用模型" —— 数据量不够、目标不清
下一轮:用 PD10 产品定义九宫格把"结构化对话画像"作为核心功能重新放回产品定义,看它如何重塑用户感知的价值。
换你的问题,InnoLab 来跑一次
这是 InnoLab 在 v0.1 跑过的案例。你也可以把你的真实商业问题输进去。