为某大型制造业集团做大模型选型咨询——覆盖 5 类技术路线、3 种部署模式,输出选型报告与首期 POC 部署架构,整体周期 6 周。
客户在过去一年里,从研发、制造、售后三个事业部各自萌生了想用大模型的需求——研发想做设计辅助与图纸智能检索、制造想做产线异常的根因分析、售后想做服务工单自动归类与备件推荐。
三个事业部各自看了不同的厂商方案,最后争议焦点变成了"集团到底应该统一选型还是各自为政"——而在选型层面又有一堆分歧:
客户的 CTO 团队尝试自己做对比,但各厂商提供的 demo 数据都是"过家家",跑不到真实业务数据上;公开 benchmark 又和制造业场景脱节,最终无法形成有说服力的决策依据。
6 周咨询评估,输出《大模型选型评估报告》+《Benchmark 测试集与脚本》+《首期 POC 部署架构图》三份核心交付物。
1. 反对"All-in 单一厂商" · 客户最初希望"全集团一个模型一个厂商解决所有问题"。我们建议在基础平台层做统一(统一向量库、统一 MLOps、统一权限),但在具体模型选择上保持多模型策略——研发场景适合一类模型,制造产线适合另一类——锁死单一厂商对长期议价权和技术演进都不利。
2. 推迟海外工厂的统一选型 · 海外工厂的合规、延迟、网络环境差异极大,强行统一会导致国内方案被严重妥协。我们建议海外工厂在二期单独评估,国内先完成首期上线,避免"为了 1 个海外场景拖累 5 个国内场景"。
3. 不接受厂商的"打包优惠" · 评测过程中有厂商主动联系,提出"如果选我们的方案可以打包送 GPU 算力"。我们建议客户拒绝此类条件——选型决策应当基于技术与业务匹配度,而非商务捆绑,否则两年后被锁死时算总账更不划算。
他们最大的价值不是"告诉我们选哪个",而是给我们建立了一套评估框架和测试集——三年后我们想重新评估新出现的模型,可以直接用这套体系自己跑一遍,不用再请第三方。这种"留下能力而不是留下依赖"的做法,是我们最看重的。
— 某制造业集团 CTO
无论是单一场景还是集团级选型,我们都坚持"基于你的真实数据评估"。聊聊你的具体卡点。
聊聊你的场景 →