作者|betway西汉姆官网科技研发中心
文章导读:
本文从银行焦点系统 AI 转型的挑战出发,,,,,,分享了betway西汉姆官网科技基于银行焦点系统多年履历积淀给出的破局思绪,,,,,,提出在“N+M”大模子协同战略支持下探索人机协作新范式的渐进式路径,,,,,,并展示了在 DeepSeek-R1 加持下,,,,,,智能化需求剖析场景中的手艺实践阶段效果。。。。。未来,,,,,,betway西汉姆官网科技将从深化智能体协作和拓宽多场景应用两方面入手,,,,,,打造银行智能化焦点系统研发新范式。。。。。
01
新焦点挑战
在金融业智能化厘革的临界点上,,,,,,银行焦点系统正履历从"功效引擎"向"认知中枢"的质变。。。。。尤其是近两年,,,,,,大模子手艺的迅猛生长,,,,,,一直重塑行业对 AI 落地的想象空间,,,,,,为银行焦点系统的智能化转型带来新的可能性。。。。。
然而,,,,,,银行焦点系统作为银行的 “大脑” 和 “心脏”,,,,,,在准确性、高可用性以及合规性方面有着极为严苛的要求,,,,,,使大模子手艺在银行焦点系统中的应用面临诸多挑战。。。。。主要问题集中在:
1、通用知识专业性局限:通用大模子缺乏银行焦点辖档挽域的专业营业知识,,,,,,面临焦点系统重大的专业场景需求时,,,,,,效果通常缺乏预期。。。。。
2、大模子落地逆境:大模子安排和运行所依赖的高算力资源,,,,,,以及模子调优的专业度要求,,,,,,增添了落地难度。。。。。
3、重大系统的跨域协同挑战:银行IT架构重大,,,,,,焦点系统往往需要跟上百个外围系统交互,,,,,,对大模子能力提出严肃挑战。。。。。
针对这些问题,,,,,,betway西汉姆官网科技提出以下破局思绪:构建"N+M"大模子协同战略,,,,,,通过N个通用大模子与M个场景小模子的有机组合,,,,,,周全提升金融领域的大模子应用效果,,,,,,拓宽大模子应用场景。。。。。
“N”:精选适配银行焦点场景的通用大模子
基于betway西汉姆官网科技深入的通用大模子能力评估和适用性研究,,,,,,针对银行焦点系统 AI 赋能场景的详细需求,,,,,,甄选通用大模子组合,,,,,,实现价值快速落地。。。。。
“M”:构建专业场景小模子
聚焦银行焦点营业高价值高重大的细分场景,,,,,,深度融合betway西汉姆官网科技焦点产品知识和行业最佳实践,,,,,,打造轻量级的场景小模子。。。。。

这种立异的“N+M”大模子协同战略,,,,,,可以凭证使命特征无邪适配,,,,,,通过大模子、小模子甚至古板 AI 手艺的无邪组合,,,,,,有用实现焦点系统重大场景的智能化作业,,,,,,提高 Al Agent 输出效果的准确性和可靠性,,,,,,从而精准知足银行焦点领域 AI 赋能的深度应用需求,,,,,,加速价值落地。。。。。
02
新范式探索
基于“N+M”大模子协同战略的破局思绪,,,,,,betway西汉姆官网科技以打造银行智能焦点一体化计划为目的,,,,,,制订了三阶段研发妄想:

模子试水:验证通用大模子,,,,,,探索场景小模子
? 目的:探索通用大模子在差别场景下的能力界线和适用性。。。。。
? 战略:选择多个通用大模子快速验证其原子能力,,,,,,针对特定场景实验微调场景小模子举行增强,,,,,,保存要害能力,,,,,,降低安排门槛。。。。。
? 实践:从领域知识问答、文档修订等场景入手,,,,,,接纳 Copilot 模式快速验证知识检索、结构化文本和代码天生等原子能力,,,,,,为构建领域专家智能体提供须要条件。。。。。
领域深耕:构建领域专家智能体,,,,,,自主完成使命
? 目的:构建专家智能体,,,,,,验证模子分工组合战略。。。。。
? 战略:凭证差别场景和大模子能力特征,,,,,,设计模子分工战略,,,,,,如 DeepSeek-R1+DeepSeek-V3 组合,,,,,,划分认真推理妄想和执行。。。。。通过微协调知识蒸馏等手艺,,,,,,进一步提升场景小模子执行专项使命的能力。。。。。
? 实践:重构需求、设计、开发、测试端到端事情流,,,,,,打造 AutoBA、AutoDesign、AutoTest 等领域专家智能体,,,,,,即能自主完成各领域事情使命,,,,,,也能与专家职员协作完成笔直领域重大使命。。。。。
生态构建:从 AI4SE 到 AI4Biz,,,,,,打造银行智能焦点一体化计划
? 目的:构建多智能体协作生态,,,,,,打造智能化焦点系统。。。。。
? 战略:完善“N+M”大模子系统,,,,,,构建全场景多智能体协作生态,,,,,,打造银行智能化焦点系统研发新范式。。。。。
? 实践:买通银行焦点系统研发全链路,,,,,,优化人机协作模式,,,,,,周全提升重大使命执行效率和质量。。。。。
03
新手艺实践
betway西汉姆官网科技从银行焦点系统研发场景和部分营业场景入手,,,,,,率先完成了第一阶段通用大模子能力验证的目的,,,,,,现在已迈入第二阶段,,,,,,正聚焦银行焦点系统智能化研发提效,,,,,,构建 AutoBA、AutoDesign、AutoTest 等多个领域专家智能体,,,,,,这些智能体将笼罩接口差别剖析、需求问答、代码解读、测试案例等多个场景。。。。。
DeepSeek-R1 的泛起,,,,,,无疑为betway西汉姆官网科技的手艺实践历程按下了加速键。。。。。下文将以需求剖析智能体AutoBA为例,,,,,,向各人先容betway西汉姆官网科技的手艺实践效果。。。。。
AutoBA 先容
需求剖析智能体AutoBA,,,,,,与betway西汉姆官网科技需求剖析平台买通,,,,,,实现智能感知使命场景、提取关联资产、挪用需求剖析工具、多角色Agents协作和交互式人机协作反。。。。。,,旨在为焦点系统需求剖析全场景赋能。。。。。
AutoBA 事情使命示例
使命1:找到要改动的需求差别点(满分10分,,,,,,期望分数≥8分)
- 基础评分:凭证文档改动点数目平均分派基础分值
- 扣分项:过失识别(-2分/处),,,,,,无效修改(-1分/处)
- 加分项:识别出标准谜底规模外的有用内容(+2分/处)
使命2:准确天生需求修改指令(满分6分,,,,,,期望分数≥5分)
- 天生准确的指令(1分)
- 准确找到目的文件(1分)
- 准确定位修改位置(1分)
- 做出了准确的操作(1分)
总体评价
- 整体准确率60%以上(1分)
- 指令完全准确(2分)
AutoBA 效果展示
1. AutoBA自力完成需求差别剖析
a. 使命妄想:AutoBA 制订了剖析妄想,,,,,,可跟踪详细使命执行
b. 深度推理:通过检索需求文档,,,,,,剖析系统现状剖析,,,,,,识别需求差别,,,,,,并给出解决计划建议
c. 修改操作:天生修改指令,,,,,,对识别到有需求差别的需求文档举行针对性内容修改

2. 人机协作交互式反响
a. 智能标注:基于对需求变换内容的明确,,,,,,AutoBA 自动完成需求改写,,,,,,并在需求文档中以色块形式标注修改内容
b. 快速决议:提供"接受修改"和"拒绝修改"的按钮,,,,,,利便用户快速决议

AutoBA 效果评测
betway西汉姆官网科技选取了 DeepSeek-R1、DeepSeek-R1-Distill-Qwen-32B和Qwen2.5-32B-Instruct 三个候选模子作为 AutoBA 的底层支持,,,,,,旨在更好的实现大模子在重大需求剖析场景的应用效果。。。。。

评测效果剖析:
? 引入 DeepSeek-R1 后,,,,,,智能体的深度思索能力和推理能力获得提升,,,,,,使 AutoBA 在焦点系统需求剖析历程中,,,,,,不但能更清晰地展示剖析的思索历程,,,,,,还能提升剖析质量,,,,,,辅助BA更高效地完成需求剖析事情。。。。。
? DeepSeek-R1 推理能力可通过知识蒸馏方法迁徙至小尺寸模子上(如上表 DeepSeek-R1-Distill-Qwen-32B),,,,,,证实晰增强小尺寸模子推理能力、思索能力以知足 AutoBA 场景需求的可行性。。。。。
04
新场景展望
未来,,,,,,在大模子系统构建的历程中,,,,,,betway西汉姆官网科技将一连聚焦银行焦点系统研发重大场景,,,,,,依据多智能体跨领域协作优化模子分工战略,,,,,,重点增强种种协作场景小模子的能力,,,,,,从而周全提升重大使命执行效率和质量,,,,,,进一步降低安排门槛。。。。。同时,,,,,,betway西汉姆官网科技将团结多种人机协作模式建设一连学习机制,,,,,,使场景应用中爆发的新知识一直反响到模子训练中,,,,,,形成知识积累的良性循环。。。。。
在应用场景的拓展层面,,,,,,betway西汉姆官网科技在继续富厚软件工程全场景智能体生态的同时,,,,,,还将团结自身在焦点系统营业建模、实验工艺等领域沉淀的专家履历和数字资产,,,,,,推动 “N+M大模子协同战略” 的手艺和应用最佳实践,,,,,,从软件工程领域向银行焦点系统更多营业场景迁徙,,,,,,最终打磨形成为银行业数字化转型赋能的 AI4Biz 一体化解决计划,,,,,,助力银行迈入越发智能、高效、无邪的新时代。。。。。
参考资料:
1.中国信息通讯研究院人工智能研究所, & 华为云盘算手艺有限公司. (2024.9). 智能化软件开发落地实践指南.
http://www.caict.ac.cn/kxyj/qwfb/ztbg/202409/t20240919_493348.htm?S0OMlgNm0r2m=1740013164777
2. DeepSeek-AI. DeepSeek-R1: Incentivizing Reasoning Capability in LLMs via Reinforcement Learning. URL
https://arxiv.org/pdf/2501.12948
3. Sail-sg. There May Not be Aha Moment in R1-Zero-like Training — A Pilot Study. URL
https://github.com/sail-sg/oat-zero
4. Zichen Liu*, Changyu Chen*, Wenjun Li*, Tianyu Pang, Chao Du, Min Lin. There May Not be Aha Moment in R1-Zero-like Training — A Pilot Study. URL
https://oatllm.notion.site/oat-zero#192dba9c0091817491e3fc3a217ee7ea
5. YueWang?,1,2 ,QiuzhiLiu?,1 ,JiahaoXu?,1 ,TianLiang?,1 ,XingyuChen?,1,3 ,ZhiweiHe?,1,3 , LinfengSong1 ,DianYu1 ,JuntaoLi2 ,ZhuoshengZhang3 ,RuiWang2 , ZhaopengTu?1 ,HaitaoMi1 ,andDongYu1. Thoughts Are All Over the Place: On the Underthinking of o1-Like LLMs. URL
https://arxiv.org/pdf/2501.18585
6. Niklas Muennighoff*134 Zitong Yang*1 Weijia Shi*2 Xiang Lisa Li*1 Li Fei-Fei1 Hannaneh Hajishirzi23 Luke Zettlemoyer2 Percy Liang1 Emmanuel Candès1 Tatsunori Hashimoto1. s1: Simple test-time scaling. URL
https://arxiv.org/pdf/2501.19393