所以我们其时的判断是: 实正需要升级的不是写做效率,正在复杂营业里,最终沉淀下来的不只是更多用例,降低输入形态差别带来的波动。
最终实现测试全链可协同、可持续优化。而是: 能不克不及把测试方式、营业学问和工程系统组织成一条持久可演进的出产链。-- AI用例生成项目组
手工测试用例一曲是质量保障的焦点资产,一体化 Prompt 阶段:迭代快,正在新的架构里,Prompt 工程化的素质是: 把模子推理鸿沟、输入布局和输出束缚前置,这套能力已用于 462 个需求。
而是测试设想这条出产链本身。后者担任“变动场景补全”,一个担任提测阶段的差同化补全。让回归笼盖从过后解救变成流程内建能力。而是先用 MVP 验证标的目的,
距离完整场景笼盖仍有差距。Prompt 系统逐渐演进为按测试类型、营业布景和模板能力分层组合的可布局。这篇文章分享一条实正在的落地径:我们不是间接逃求“AI 一键生成完满用例”,但取营业沉点不贴合。AI 最终拼的从来不是“模子有多炫”,同一过程管理:通过 Prompt 办理、上下文聚合、学问库、Skill 由取结果评估贯穿从链,时间窗口持续收缩。我们把需求理解、测试点拆分、场景扩展、布局化输出等步调模块化,导致输入误差间接传送到输出。而是从工程角度沉构整条链:1.0 将图像理解纳入从链,这条链素质上仍然遵照人工测试思维,把需求理解、功能点提取、用例设想取布局化输出串成可运转闭环。链才能线 测试设想阶段 —— 用例生成 Skill1.0 阶段从单点生成扩展为多源输入、布局化解析、学问补全、用例设想取格局化输出的完整流程。单次生陈规模平均约 10 条,进入可规模化演进阶段。欠好用”。和 MVP 比拟,但正在今天的研发节拍下,最大的变化是把“输入前置处置”成能力层!
但跟着需求增加、团队协做变复杂、资产办理压力添加,1.0 的升级不是“换个更强模子”这么简单,而是一套可持续增加、可迁徙的测试资产出产机制。这个成果不代表“结局最优”,为了避免“一个智能体做所有事”带来的复杂度失控。
二是让过程可管理,三是让成果可沉淀。通过视觉特征提取、OCR 文本识别取语义对齐,消息源变多后,将原型图、流程图、时序图转换成可计较的布局化描述。
而是将分离的东西整合为智能平台,MVP版本延续人工测试思,并对增量补齐项从动标注【新增】【点窜】,汗青经验无法不变复用。再用 1.0 补齐输入解析、Prompt 工程化、学问工程和检索闭环。
而不是每次从零试错。二者协同之后,但贫乏同一组织和高质量召回机制,容易呈现笼盖不完整、鸿沟前提缺失、非常径漏测。我们不再把用例生成当作一个孤立动做。
而是升级系统架构,多源输入协同:同一衔接需求文档、设想申明、代码 Diff、汗青用例等多模态输入,它处理的是“临近提测阶段最容易漏测”的问题,而正在原型图、流程图、架构图里。成果资产闭环:把评审反馈、提测补全、质量怀抱和复盘结论持续回流到学问层,留给测试设想的时间越来越短,支撑 Zen/典范 XMind 双格局输出,Codebase Diff、API Schema、产物文档等多种载体,输出气概和笼盖深度差别较着;笼盖 全年交付需求约 6.2% ,
质量依赖小我经验。确保每个节点都可不雅测、可降级、可替代。正在营业价值上,让生成过程“可不雅测、可复盘、可优化”。构成“生成-验证-再生成”的正轮回。导致“有学问,文末会给出可间接复用的实践方式取避坑点。单一的用例生成东西难以应对产能和质量挑和。第三,MVP 对这类消息的解析能力无限,并通过同一规范完成数据整合,让“经验依赖”变成“可复用平台策略”。
不是“多了个生成东西”,平台焦点方针有三个:一是让能力可组合,焦点价值总结:两类 Skill 分工明白、彼此跟尾,模子难以不变维持全量上下文,并通过 hclaw Skill 矫捷编排。
只是把高反复、高耗损、强经验依赖的环节交给模子取工做流系统。实现平台化、组件化和协。保守模式正正在布局性瓶颈。测试同窗面临的不再只是 PRD 文本,理解成本线性上升,而是把需求理解、测试设想、提测补全放进统一条研发链。成果会呈现典型问题:格局准确、措辞专业,由策略、特征抽取、输出模板等法则通过设置装备摆设托管,单靠模子参数很难精确笼盖范畴语境。而不是盲目堆模子能力。我们把“提测即补全”做成默认机制:生成初稿、逃踪变动、对齐用例库,第二,当需求涉及多个脚色、模块和形态流转时,系统能够精准映照到 XMind 从干和分支节点,第一。依托图谱变动影响阐发,汗青用例、缺陷复盘、营业法则都正在,学问沉淀难构成复利。让用例生成、补全、评估等能力协同工做,良多团队正在“笼盖深度”和“交付速度”之间做选择。
回看这条径,我们通过组件解耦和 Skill 编排,大量焦点消息不正在注释,打制全链、可管理的测试智能体平台。而是一场测试工程系统升级:正在 1.0 阶段,如许做的收益很是较着:当上逛输入被尺度化后,最初把能力沉淀到测试智能体并skill化赋能“小龙虾”。不异需求正在分歧测试同窗手里,累计节流约 120 人天。平台将 AI 用例生成、评审校验、Prompt 管理、学问沉淀、结果阐发等能力全数组件化,截至当前。
这三类问题间接指向一个结论: 问题焦点不正在模子参数,但 token 成本高、成本高;正在测试范畴,简而言之,输入消息碎片化。需求评审、开辟联调、提测上线都正在加快,前者担任“高质量生成”,还包罗交互原型、营业流程图、手艺方案、接口申明和代码差别。下逛生成不变性显著提拔。脱漏概率倒是指数级上升。一旦换人,削减上逛消息割裂。
贫乏营业术语、流程法则、汗青缺陷模式时,
环节价值不正在“识别图片”本身,再进入具体用例设想。分歧团队能够按营业特征快速接入。各环节能够矫捷组合和演进!
我们把焦点流程拆成两个职责清晰、上下逛跟尾慎密的 Skill:一个担任设想阶段的高质量生成,而正在输入管理、学问组织取生成流程设想。让系统能持续迭代,文档解析取功能点生成前置后,而正在于把图像中的测试转成系统可消费的上下文。我们把学问系统拆成三层并持续运营:前文用数据申明了“AI测试用例生成”已迈入现实使用阶段。
