Z银行成立于1987年,是中国境内第一家完全由企业法人持股的股份制商业银行,也是国家从体制外推动改革的第一家试点银行,现已发展成为沪港两地上市,拥有商业银行、金融租赁、基金管理、人寿保险、境外投行等金融牌照的银行集团。至2021年末,Z银行总资产规模达9.25万亿元,全年营业收入3312.53亿元,位列英国《银行家》全球银行1000强榜单第11位,连续五年位居前20强。
Z银行于2018年创立银行业首个AI实验室,目前对人工智能的研究已经涵盖自然语言处理、生物识别、机器学习、大数据等多个领域,并在支付、风控、营销、消费金融等诸多应用场景下进行实践。
随着AI在金融科技领域的广泛应用,金融机构对AI的依赖度逐渐增强,覆盖营销、风控、智能识别、智能客服和量化交易等核心业务流程。这种依赖对服务连续性、业务响应速度和运营成本收益比提出了更高的要求。特别是在AI应用迅速扩展的背景下,GPU资源的紧张问题日益凸显,如何高效利用和管理这些资源成为AI在金融行业全面推广的关键挑战。
同时,考虑到AI在风控、投研、防欺诈和智能客服等关键业务中的核心作用,金融机构对平台的高可用性和容灾能力提出了严格的标准。不仅要求平台能够在正常业务场景下稳定运行,还需要具备快速恢复和应对突发情况的能力。
此外,随着AI应用的广泛部署,如何确保资源使用效率,避免资源浪费和成本超支,也成为金融机构面临的重要议题。
通过利用灵雀云的GPU虚拟化技术和标准化产品,Z银行AI实验室成功构建了一个基于GPU虚拟化技术的人工智能平台;
• 通过GPU虚拟化技术,将单张GPU卡进行碎片化切分,并按照业务需求灵活调度给不同的应用程序使用。这有效避免了应用程序长时间独占GPU,提高了GPU卡的利用率,使得GPU资源利用率提升30%至50%。
• 该平台能够统一管理深圳、上海两个不同地点的三个中心机房的服务器,并通过应用调度策略,如节点标签、亲和性等配置来完成应用的多中心发布,从而实现了关键应用的多活或主备容灾部署。
• 通过将平台和K8s集群直接运行在裸金属服务器上,避免了传统虚拟化技术带来的性能损失,保证了在保障应用程序性能的同时,提高了CPU计算资源的利用率。
• 该平台还具备按天为单位频率的上线能力,并保证生产环境资源的充分利用和应用的高可用性要求。
此外,协助Z银行制定了平台使用规范,并且提供平台实施、应用迁移、应用安全加固及详细的云原生相关技术培训,同时为Z银行运维人员定制了相关功能组件,使平台操作更符合Z银行的运维流程和规范,以提供更好的使用体验。
已建成的平台正在支撑一个规模庞大的容器集群,超300个物理机节点,支持调度1400多张GPU卡,为全行超过3000个AI类应用提供支持,这些应用涉及风险控制、信用卡、AI实验室等多个部门。并达成以下预期效果:
• 通过灵雀云先进的GPU虚拟化技术,显著提高了行业内的GPU资源使用效率,实现了高达30%-50%的提升。此技术进一步释放了GPU资源的潜能,提高了整体计算性能。
• 借助灵雀云的云原生能力,极大地减轻了开发与运维部门的工作负担。通过自动化部署和一键式快速测试,使得开发测试过程更加高效流畅,提升了开发团队的工作效率。
• 实现应用版本以“日”为单位的上线频率,充分保证了生产环境资源的充分利用,以及应用的高度可用性。这一创新性解决方案为各行各业带来了前所未有的优势。
• 在AI实验室的推动方面,灵雀云助力其在行业内快速普及,并成功提升了AI技术在众多关键领域的占比。通过引入机器学习、自然语言处理和知识图谱等核心技术,推动AI技术在更多场景的落地应用。这一举措不仅提高了风险识别的准确性和效率,还为信用卡、投研等业务领域带来了实实在在的利益。