杏彩体育全国服务热线: 400-600-2092

杏彩体育:专题 算力基础设施高质量发展实践与探索

  党的二十大报告指出,要加快新型基础设施建设,推动数字经济和实体经济融合发展。当下,算力以一种生产

订购热线:400-600-2093

返回列表

产品参数

  党的二十大报告指出,要加快新型基础设施建设,推动数字经济和实体经济融合发展。当下,算力以一种生产力形式,成为经济社会高质量发展的重要驱动力。算力基础设施作为算力的主要载体,是支撑数字经济发展的重要资源,对实现数字化转型、培育未来产业等方面具有重要作用。为明确未来3年算力基础设施领域发展目标、重点工作和实施保障计划,工业和信息化部、中国人民银行等6部门联合印发《算力基础设施高质量发展行动计划》(下称《行动计划》)。农业银行全面贯彻新发展理念,积极主动融入和服务构建新发展格局,以《行动计划》为指南,积极推进全行算力基础设施高质量发展的实施落地和技术探索。

  《行动计划》结合算力基础设施产业现状和发展趋势,明确了“多元供给,优化布局;需求牵引,强化赋能;创新驱动,汇聚合力;绿色低碳,安全可靠”的基本原则,在算力规模、存储总量、运载能力等方面制定了未来3年的发展目标。对于金融领域,提出了创新应用、并行分布、高效管理、多地多活、精准高效的指导意见。农业银行结合自身在国家经济发展中的定位和作用,根据自身发展现状和发展规划,积极响应政策号召,制定发展规划,完善算力基础设施建设,强化支撑基础性技术研究与应用,全面提升数字经营战略支撑水平。

  对大型商业银行而言,其本身用户数量大、业务复杂度高、需求变化快,并且随着金融业数字化转型步入深水区,业务产品和服务模式持续快速创新,对研发效率、算力资源交付、算力资源弹性伸缩能力及基于业务连续性保障的运行服务质量提出更高要求。同时随着国际经济秩序调整,我国面临的信息安全和风险进一步加剧,金融监管对金融行业关键算力基础设施的要求也越来越高。近5年来,农业银行全行算力累计增长7.8倍,新型算力从无到有,占比超过15%;存力规模累计增长3.4倍;新型网络支持能力日趋完善。为满足日渐增长的算力基础设施规模对管理水平、资源利用效率提出的新要求,全面加强和提高农业银行算力基础设施发展质量,是全行信息化高质量发展的必经之路。

  近年来,农业银行站在落实国家战略和防范金融系统性风险的角度,为满足国家监管业务连续性与信创的要求,支持全行业务发展和数字化转型,提出在长三角、京津冀、西部建设“三地六中心”的数据中心总体布局架构,并明确各中心的业务部署定位及容量规划。按照国家“东数西算”战略规划,将对网络传输时延要求高、面向客户服务的业务,部署在长三角、京津冀等金融消费的一线城市,提供针对关键业务的高可用性、高可靠性和高运行效率的高质量运行服务,形成同城双活+异地容灾的业务连续性保障机制;将离线分析、后台计算、存储备份类的大数据业务部署在西部地区,充分发挥西部资源优势、环境气候特点,实现高等级的能效管理和充分发挥算力优势。

  农业银行信息化建设按照“1251”关键路径全面开展:夯实一个一体化云平台底座;跑好信创、非信创两条赛道;健全容灾、安全、运营、研发和数据五大能力体系,提升供给和安全服务水平,充分释放算力潜能;建设组织、人员、资源、合规协调统一体,构建适应新生产力的一整套IT治理体系。

  一体化云平台作为算力供给的基础平台,在算力资源层面,建成“一云多芯”的金融云平台,实现英特尔、鲲鹏、海光多芯纳管能力,CPU、GPU异构算力发放能力,并具备关键应用承载能力。逐步实现基础资源的全集团统一供给能力,形成充分并池混合、算力拆借的资源池算力网。算力供给层面,将算力借助云原生技术封装成用户友好的公共服务,用户随用随取、按用度量,赋予计算程序弹性伸缩能力,提升应用开发和部署效率,保障关键业务服务水平的同时优化云资源利用率,实现降本增效有机结合。算力支撑层面,一体化云平台算力服务贯通研发体系、运维体系和容灾体系,完成流程和技术对接,自动开展资源交付、运行数据采集、容量评估,实现应用资源效能全景可视化。算力安全层面,一体化云平台通过了零信任、安全左移、持续监测与响应以及可观测四大安全评估体系,达成基础设施安全、云原生基础架构安全、云原生应用安全、云原生研发运营安全和云原生安全运维5个能力域,近400个细分指标要求。

  在金融企业数字基础设施建设中,存力已越来越成为算力产能释放的基石。农业银行围绕数据的“采、建、管、用”不断优化存力结构,赋能数字化转型。

  在存力形态上,农业银行根据不同业务和应用架构对存储系统的需求差异,构建了多种数据存储底座,使用分层解耦的存算分离建设模式,提供模块、文件和对象存储等多样化的存储服务。在技术演进上,一方面利用全闪存设备高性能、高可靠、高密度的优势,有效整合数据中心存储资源,持续优化存储性能和运行效率。另一方面对于服务器本地存储,推进新型NVME设备适配使用,满足对低延迟、高吞吐的核心应用场景需求。在生命周期管理上,结合实际用数场景,依照访问需求,划分热温冷数据类别;依据重要程度及容灾要求,划分重要、次要、一般数据等级;分领域、分条线合理设置不同数据的生命周期和存储规则,实现精准化、细致化管理策略。在存力布局上,通过大数据平台搬迁工程,成功在具有能源和运营成本优势的区域扩充存力规模,调整存力布局,优化存力结构。

  农业银行网络架构按照“三地六中心”的数据中心总体布局规划设计建设,全面构建“三地三平面”的骨干网架构,全面部署基于SRv6的IPv6+智能网络技术,全面实施云网融合策略,建设平稳、高效、安全、精准、敏捷、简单的算力网络基座。

  架构层面,进一步简化网络层级,实施全辖网络扁平化,边缘网络从网点直连省域中心,实现一跳入云,骨干网络围绕“三地六中心”打造“三地三层面”的容灾架构,保障任意一点失效均能快速收敛和重建网络通信。基座层面,行业内创新应用基于SRv6的IPv6+智能网络技术,通过云网协同实现骨干网与云网络之间的无缝衔接,通过云间协同实现数据中心之间的资源共享和灵活调度,通过云端协同实现端到端的网络服务贯通和服务质量保障。云网融合层面,从硬SDN逐渐向软SDN迁移,支持算网协同的分布式网关技术,提供无状态和有状态应用的无差异服务,简化云上与云下互联路径,实现云网无缝融合。

  随着全球气候变化问题日益严峻,减少碳排放、提高能源利用效率已成为各行业共同的责任。农业银行坚定“双碳”策略,积极探索建设绿色数据中心。总分行新建数据中心建筑上要求符合绿色建筑三星标准,设计PUE至少要达到《数据中心能效限定值及能效等级》(GB40879—2021)中二级能效要求(PUE≤1.3)或满足当地政府更高的能效要求,存量数据中心持续探索降碳措施和提升PUE水平,到2030年总体PUE至少降低10%以上。

  在建设态,积极采用新的节能技术。一是采用效能比更优的产品和技术,如在水泵和风机中均采用变频调速等技术,选择高效能变压器、间接蒸发冷却、磁悬浮冷水机组、一体化电力模组等产品持续降低非IT设备能源消耗;二是机房设计采用风液混合架构或预留向全液冷演进的空间和能力;三是在IT产品选型中,优先选择能效等级更高的产品。在运行态,多措并举提升节能水平。一是持续开展制冷系统的运行工况调优,提高运行效率;二是采用智能照明、余热回收等技术节流开源;三是在适宜网点和办公场所推广光伏技术解决区域供电不足或备用电源问题;四是根据运维实践经验,建立节能工具箱并在全行推广应用。

  为强化安全保障能力,农业银行已建成覆盖边界、内网、系统、终端以及安全运营中心的“四横一纵”安全防护体系,强调整体安全,补齐“木桶短板”。边界防线方面,按照“纵深防御”理论划分外联应用接入区和外联应用服务区,实现应用落地和边界隔离,大幅增加外部风险进入内网的难度,打造边界安全护城河。内网及系统防线方面,实现内网间分区隔离和主机及容器级防护,筑牢内部安防堡垒。终端防线方面,通过网络接入强管控,定制用户终端防病毒、防泄漏等终端安全全家桶,扎紧每一户篱笆。安全运营中心作为整个安全防护体系的中枢神经统一纳管四类防线,提供整体安全视图,提升风险发现和处置能力。

  为确保供应链安全,保障算力基础设施平稳发展,避免受到外部因素对供应能力的影响,农业银行积极开展国芯设备试点替代。在生态结构、供应商选择上均采取并行互备的策略。在主供应商覆盖主用场景的基础上,同步选择部分应用对备选供应商做全链条验证,保障某一产品出现供应链风险时,另一产品直接替代使用。

  金融科技创新本质上是借助数字技术,通过新理念、新应用、新模式重塑业务格局,从而带动银行业务的结构优化和提质增效。近年来,农业银行继续牢牢把握技术这一“支点”,结合自身业务实际,在异构计算、隐私计算、边缘计算、NoF网络等算力基础设施技术领域持续深化探索,落地一批新试点应用,打造多个新技术平台,为未来谋篇布局。

  近年来,算力发展呈现多样化、跨体系的发展趋势。新型算力不断涌现,成为提升计算和能效的重要手段。算力架构逐渐突破以CPU为中心的整体结构,多算力引擎协同发展,在各自领域发挥关键作用,为提升算力整体效能,日渐发挥不可替代的作用。

  在AI智算领域,统筹数据、算法和算力支撑,持续探索架构、模型和算力的场景应用,推进资源复用、模型复用、特征复用,构建全行统一的人工智能服务平台,实现行内各个业务条线AI应用相关资产多层次高效积累、沉淀、共享与复用。在软硬件协同领域,探索基于DPU的解决方案,将通用计算与专用服务卸载进行分离,平衡计算、I/O、网络之间的性能差异。在此基础上,持续探索新型数据中心绿色高效计算架构。

  面对数据爆炸式增长和人工智能的快速发展,网络作为数据流动和转发的桥梁,支持更高速度、更低时延、更少抖动的网络技术成为存算发展的迫切需求和重要纽带。以NoF、RDMA、RoCE为技术核心的无损以太网络应运而生,其在支撑存算分离架构、支持AIGC大模型训练方面表现出来较好的资源和投入的平衡。一是通过“NOF+网络”,以及端到端的NVME技术,探索“分布式数据库+全闪存”存算分离架构的部署解决方案,构建统一的计算和存储网络;二是探索支持金融AIGC应用场景的网络架构,选择与需求相匹配的集群规模和架构模型,做到算力规模、网络性能和能源消耗之间的平衡;三是探索和扩展边缘计算的应用场景,在智能缓存服务、智点创新中,通过云、边、端、网协同,促进精准响应,降低网络带宽和时延,增强用户体验。

  金融行业积累的大量高质量、高价值的数据,使同业或其他行业机构有着迫切的联合计算意愿。但是大型金融国有企业作为关键信息基础设施的运营者,也需要履行相关法律责任,确保网络安全和数据安全。一是探索利用隐私计算技术解决数据隐私保护和多方共享数据之间的矛盾及可能存在的数据跨境风险,安全合规地发挥数据要素倍增作用,打造金融数据新生态。二是探索利用CPU中集成的可信安全模块,在特定场景实现内存加密、容器加密和数据库加密,构建安全的用数环境。

  当前,数字化转型已经成为中国产业高质量发展的重要实现路径,而算力基础实施作为数字化转型的重要基石,其自身的发展也已从量变走向质变的重要关口。农业银行在算力基础设施的建设中持续以实践促创新,以创新促发展,最终推动企业数字化转型不断迭代升级。