数字中国万里行
2018年,“数字中国万里行”正式启动。经过一个多月的时间,我们探寻了腾讯、阿里巴巴、百度、字节跳动、华为云、京东云、中国联通、中国移动等8大数据中心,见证了中国互联网、云计算带领下数据中心的蓬勃发展。
2019年,“数字中国万里行”再度扬帆,这次我们将探索的区域放大,分为京津冀、长三角、珠三角和西南地区等四大区域,触达金融、制造等传统行业,造访的数据中心多达20家,聚焦基础设施的上层应用,通过“小区域、多采集”的方式,继续用“行“的模式,挖掘新技术的价值。
互联网上的全民狂欢对相对“传统”的关系型数据库提出了更为全面的要求,并且在数据分析服务上催生出新的应用。2019年“双11”阿里巴巴再创多项交易记录,阿里云与腾讯云推出多款数据库服务和数据分析业务,无需另起炉灶,在他们普遍使用的英特尔架构基础设施上,已经有大量开源或商业版本的数据库和数据分析应用可供选择。
阿里云 :数据库成就双十一
自从电商火爆之后,每年双十一就成为了各大平台竞争的主战场。
“相比销售数字,我更关心技术的峰值。”——阿里巴巴董事局主席兼CEO张勇
这位财务出身的阿里巴巴掌门人之所以对技术峰值如此看重,恰恰说明数据库处理交易的能力事关电商业务的成败,高效、稳定、实时响应的数据库是电商运营的核心。
作为国内云计算的领军者,阿里巴巴自研了多款关系型数据库,2019年双十一期间,阿里云旗下的POLARDB和蚂蚁金服旗下的OceanBase分别处理8700万、6100万笔/秒峰值请求,实时计算处理峰值每秒25.5亿笔、计算平台单日处理970PB数据、12亿笔物流智能化等……打破了诸多技术记录。
除了出色的软件架构和算法,关系型数据库的性能表现也离不开计算和存储等底层硬件的支持。
在架构层面,POLARDB和OceanBase采用不同的技术路线。OceanBase采用share-nothing架构,各个节点之间完全对等,每个节点都有自己的SQL引擎和存储引擎。
OceanBase的这一特性使其可以直接部署在基于阿里云定制版本英特尔至强可扩展处理器和NVMe SSD本地盘的i2实例上,由204 个数据节点组成的OceanBase集群OceanBase集群以超过6000万tpmC的成绩创下数据库联机交易处理系统(OLTP)权威基准测试标准TPC-C的性能记录,这也是该测试基准历史上第一个分布式关系数据库获得认可的测试成绩。
之前TPC-C榜单上的前两名都采用小型机+共享存储的传统数据库架构,OceanBase以实际行动表明基于x86架构的云服务在保有同等事务能力的前提下具有更高的扩展潜力。
OceanBase支持三地五中心容灾架构,即单区域3可用区、三区域5可用区部署,前者的典型例子就是数字中国万里行团队多次参观过的阿里云张北数据中心,其由3个相距20公里左右的数据中心园区(可用区)组成阿里云华北3区,跨这3个可用区部署的多个副本可以在其中一个可用区发生故障时自动切换,保证数据库系统的高可用性。
图:位于河北省张家口市张北县的阿里云华北3区,是国内云计算企业首个采用同城三中心布局的数据中心集群。上图分别是1号园区和2号园区的局部
在阿里云对外提供的商业级云托管关系型数据库POLARDB上,阿里云大量将英特尔傲腾DC固态盘P4800X系列和英特尔3D NAND固态盘相结合,在软件层实现了一个混合型存储层,不仅使POLARDB每秒查询数(QPS)提升30%,改善了客户体验,还将POLARDB第95百分位延迟降低76%,进而实现低延迟、高吞吐量、高QoS。如今,POLARDB可以实现高达一百万每秒输入/输出(IOPS),而且只有毫秒级的延迟。
阿里云平台还全面上线了基于英特尔第二代至强可扩展处理器的第六代实例c6 、gg6 和rr6,睿频从上一代的2.7Ghz提升到3.2Ghz,计算性能有3~15%的提升,用于加速工作负载处理和服务交付,使Redis读写实测性能、Nginx每秒请求数和MySQL查询qps有20%以上的提升,MySQL查询延迟降低20%,明显改善了用户体验。
腾讯云:灵活反应打造全功能数据库服务
腾讯同样有多款数据库服务,比如TBase。这是一款腾讯自主研发的分布式国产数据库,提供领先的HTAP能力,在提供NewSQL便利性的同时完整支持分布式事务并保持SQL兼容性,支持RR、RC、SSI三种隔离级别,同时兼容Oracle语法。
对于日益多元化的企业客户,TBase能够满足他们对业务融合、场景融合、管理融合的更高诉求。强大的安全和容灾能力,让TBase已经成功应用在腾讯内部的微信支付,以及外部众多金融、政府、电信、医疗等行业的核心业务系统。
另一款腾讯自研的数据库架构TDSQL则应用于腾讯云中。作为定位于金融云服务的数据库,TDSQL符合金融行业的严格标准,在数据强一致性、高性能、高安全性、高可用性、高兼容性等方面表现卓越,并可部署在公有云、公有云独享物理集群、腾讯金融专区、用户自有数据中心等多种场景中。
当然,要在分布式数据库架构上实现高性能和数据的强一致性,计算、网络和存储的性能输出就不能掉链子。在腾讯金融云的实践中,全新英特尔至强可扩展处理器就发挥出了它高频、多核、多线程的优势,这些优势均能充分转化为TDSQL各模块处理速度的显著提升,例如它集成的英特尔高级矢量扩展512(英特尔AVX-512)技术输出的强大并行计算能力,就能为分布式数据库的任务处理提供更佳的支持,让用户能以更低的延时访问数据。
与该处理器搭配的英特尔Omni-Path架构,则能帮助TDSQL数据库系统在内部构建端到端的高带宽、低延迟数据通道,大大缓解高并发数据处理带来的压力。英特尔固态盘更是各种云数据库服务的标配存储介质,能满足从高到低的差异化存储需求。
总结
﹀
﹀
﹀
从云服务商的选择来看,将计算、网络和存储技术融合在一起,一个高效的数据云服务平台就已初现雏形,互联网公司只是“敢为天下先”,他们对于技术的渴求最为迫切,对于新技术带来的成果也最为认可。、
无论是阿里还是腾讯,都积极拥抱了第二代至强可扩展平台,从至强处理器到傲腾数据中心可持久内存再到傲腾DC固态盘和英特尔3D NAND固态盘,这一系列从计算到存储的结果方案帮助互联网巨头们优化数据库应用,进而也让互联网用户们的体验获得了提升。网络方面,主要是指英特尔10Gb、25Gb和40Gb以太网适配器,以及英特尔Omni-Path架构(英特尔OPA),它们可以为数据在不同设备间的传输提供尽可能高的带宽和更低的延迟。
图:英特尔傲腾技术为高性能存储带来了更多选择,其最新产物是内存型态的Optane DC Persistent Memory,它可以为常驻内存(In-Memory)的应用,特别是内存数据库和内存数据分析带来更具性价比的承载平台
而且这样的的组合,还不仅仅是简单的拼接,英特尔开发的一些创新技术特性和软件,还能让它们实现的优势加成。例如:通过配备英特尔智能存储加速库(英特尔ISA-L)软件,Ceph存储方案可以利用英特尔至强处理器来更好地执行数据保护、数据完整性和数据安全型任务;通过英特尔高速缓存加速软件(英特尔CAS),Ceph方案也可使用智能缓存来提高性能;借助至强可扩展处理器平台集成的英特尔X722 10GbE网络适配器所支持的iWARP(Internet Wide-Area RDMA Protocol)RDMA功能,海量数据在传输中也可以进一步降低延迟并减少对处理器资源的占用。
未来十年,数据的创建和应用将加速增长,并且所有的行业都在面临数字化转型的问题。在底层硬件平台上实现革新和加速,英特尔第二代可扩展平台也不仅为阿里、腾讯这样的超大型互联网公司,也为百行百业提供了最佳的选择。