告别一刀切进入专用数据库时代,为具体场景找到合适的数据库
[摘要]今天,几乎所有的企业都将数据视为核心资源。企业依靠数据库来存储和组织数据,从银行到零售,从电信、互联网到制造业,数十年来,各种各样...今天,几乎所有的企业都将数据视为核心资源。企业依靠数据库来存储和组织数据,从银行到零售,从电信、互联网到制造业,数十年来,各种各样的应用都依赖于数据库这种强大技术的发展、创新。
在数据库领域,两大发展趋势不容忽视:
目前创新互联已为上千多家的企业提供了网站建设、域名、雅安服务器托管、网站托管、企业网站设计、石柱土家族网站维护等服务,公司将坚持客户导向、应用为本的策略,正道将秉承"和谐、参与、激情"的文化,与客户和合作伙伴齐心协力一起成长,共同发展。伴随着商业数据库市场发展所形成的巨大许可成本压力,开源数据库因倡导群策群力、免费应用而日益壮大。根据DB-Engines相关统计数据,目前商用数据库与开源数据库所占的市场份额日渐趋近对半分的成度,分别接近50%的份额。
开源数据库不但对商业数据库的市场地位提出挑战,而且也把数据库应用的成本降下来了,让更多的企业能够用得起数据库。如果用户的技术力量够强的话,可以使用这些免费的开源数据库产品。
相对于本地部署的数据库,数据库上云成为另一大发展趋势。云服务商提供的数据库服务在成本上大大低于商业数据库,性能上也得到了优化,最为关键的是降低了用户使用的门槛,用户只需专注于业务,维护等技术工作交给云服务商就可以了。
随着应用场景的增多,用户需要基于不同模型的数据库产品。目前市场上已经出现了十几种数据库类型,显然一家或者几家商用数据库企业很难满足用户的需求。
统一采用传统的关系型数据库解决用户所有场景的应用需求,是不现实的,一是性能和效率达不到要求,二是成本太高。
现代化应用需要专用的数据库,具体场景需要合适的数据库,是时候告别一刀切进入专用数据库时代。
1.应用需求催生专用数据库
专用数据库(The purpose-built database)就是为专门的场景需求设计的数据库。将应用迁移到云计算,采用专用数据库,是迈向云数据库时代的第一步。
一旦进入云端,用户就会发现有众多的基于不同数据模型的数据库可供选择,满足用户创新应用的需求,为业绩提升和商业成功打下基础。
先看看几个简单的例子。
在印度所有民事法院案件中,约有三分之二涉及土地所有权纠纷。在这些纠纷中,纸质文件、当事人间的记录验证等仍然很普遍。
随着技术的发展,纸质记录系统已被传统关系数据库所取代,这一技术进步有助于解决文件遗失、损坏、不完整等挑战。
但是这样的数据库仍然为“非法”的数据处理打开了方便之门,因为现有记录可以被覆盖而不会留下痕迹。
适应这一场景的一个不变的、可验证的分类帐数据库就诞生了。该数据库利用加密技术来证明在事实发生之后,没有对记录进行修改等操作。
AWS就为用户提供在区块链技术应用场景下的一种数据库服务,即Amazon Quantum Ledger数据库,简称Amazon QLDB。
区块链等新技术的应用,必然创造新的应用场景,也需要与之贴合的数据库。分类帐数据库就确保历史记录准确、透明、不变,可验证且高度可扩展的。
于2019年9月全面上市的Amazon QLDB是一个专用数据库,可为需要任何形式记录保存的企业提供透明、不可变和可加密验证的交易日志,适合金融、制造业、保险、人力资源和薪资、零售和供应链等行业应用。
宝马集团就利用Amazon QLDB,建立数字车辆护照应用,提供车辆数据的完整记录,如加油、检查、换油、诊断、维修、轮胎更换等,提供集中信任的验证数据。
另一家汽车公司——丰田赛车发展公司(TRD),多年来积累了大量的数据。但是在每个应用中查找关键信息如发动机数据、比赛图像和制动数据等消耗了TRD很多时间。
为此,TRD将所有数据迁移到数据库中,从而可以利用AWS提供的工具轻松快速地执行分析。TRD使用Amazon DynamoDB键值数据库,并与Amazon KDS和Amazon Kinesis Data Firehose配对,以构建用于竞速比赛的实时流数据分析工具。Amazon KDS收集的数据以毫秒为单位可用,以启用实时分析。Amazon Kinesis Data Firehose是将流数据可靠地加载到数据湖、数据存储和分析服务中的最简单方法。团队使用Amazon Athena来查询核心数据平台中的数据。
其中,键值数据库Amazon DynamoDB具有高吞吐量、低延迟读写、无限扩展等特性,特别适用于实时竞价、购物车、社交、产品目录、客户选择等应用场景。
通过快速的数据分析,TRD现在可以提供更好的洞察力,以制定关键的比赛时间决策,从而使该公司在竞争中脱颖而出。“我们可以在物理上尽可能快地获取数据,按需要进行处理,并以可视化方式呈现,从而使人们可以快速做出决策。”
中国的虎牙直播是一家发展非常迅速的以游戏为核心的直播平台。在其数据库后台,就根据应用的不同,选择不同类型的数据库。如动态信息采用了键值类数据库Amazon DynamoDB,处理包括支付状态、好友状态等信息;静态的信息则存储在关系型数据库Amazon Aurora上,如用户的基础信息等。
随着这些新应用模式越来越流行,更多的公司用户越来越意识到,如果只能为应用选择一种关系型数据库,那么这种 “一刀切”的解决方案很难是任何特定应用的解决方案。
企业用户正在为特定的应用寻找最贴合的专用数据库。开发人员越来越拒绝采用“一刀切”的方法,而是合并了更多专门构建的数据库来处理特定需求。
随着文档、图形、搜索、时间序列等数据库取代了较早的通用关系数据库,专用数据库市场将迎来高速增长。
2.数据库选择超越“一刀切”
关系数据库是为具有一致结构的表格数据和固定架构设计的,可以解决一开始就有明确定义的数据问题。
ERP、CRM和电子商务等传统应用特别适合采用关系数据库,记录交易并存储结构化数据,数据量通常以GB为单位,偶尔也有TB量级的。
几十年来,应用设计一直由关系数据库模型驱动,无形中限制了数据存储与应用的创新。
尽管关系数据库仍然必不可少。实际上,它们仍在增长,但在当今世界,仅有“关系型”数据模型,显然无法适应发展的需求。
第一,数据的快速增长不仅体现在数量和速度上,而且在多样性、复杂性和互连性等方面,都对数据库提出了新需求。许多具有社交、移动、物联网和全球访问权限的新应用需求不能仅在关系数据库上运行。
第二,这些应用需要的数据存储量已经达到TB级,有些甚至达到PB级。
第三,对数据处理的性能要求也不断提高,提供毫秒级延迟的数据访问,处理数百万甚至数千万个请求,能迅速扩展,以支持世界各地的数百万用户。
为具体的工作选择正确的工具。要创建满足这些需求的应用程序,开发人员必须选用许多新兴的专用数据库模型。
为响应客户的需求,AWS提供了针对特定工作负载和访问模式而优化的各种专用数据库。
目前,AWS 拥有15个数据库引擎,未来还会不断增加,能够提供最齐全的商业级专用数据库,让开发团队能够构建任意规模的任何应用使用,并更快速地创新。
AWS提供三种关系型数据库服务,包括:
Amazon Aurora是一种与 MySQL和PostgreSQL兼容且专为云构建的关系数据库,兼具商业级数据库的性能和可用性,但成本只有它的十分之一。
Amazon RDS让用户可以在云中设置、运行和扩展关系数据库,同时支持六个常用数据库引擎,包括 Amazon Aurora、PostgreSQL、MySQL、MariaDB、Oracle 和 SQL Server。
Amazon Redshift是受欢迎且增长最快的云数据仓库,能够针对 PB 级结构化数据运行复杂的分析查询,以及直接针对S3中存储的EB级数据运行SQL查询。
在上文介绍的键值数据库上,AWS Amazon DynamoDB可以在任何规模的环境中提供延迟不到10毫秒的性能,每天处理超过10万亿请求,并支持每秒超过2000万个请求的峰值。
在文档数据库,Amazon DocumentDB兼容MongoDB,是一种快速、可扩展、高度可用且完全托管的文档数据库服务,支持 MongoDB工作负载。
Amazon ElastiCache内存数据库提供完全托管的Redis 和 Memcached,让用户可以无缝部署、运行和扩展常见的开源、兼容内存中数据存储。
Amazon Neptune是一种快速、可靠且完全托管的图形数据库服务,可帮助您轻松构建和运行使用高度互连数据集的应用程序。
作为一种快速、可扩展且完全托管的时间序列数据库服务,Amazon Timestream适用于IoT 和运营应用程序,每天可以轻松存储和分析数万亿个事件,其成本仅为关系数据库的十分之一。
在上文所说的分类账数据库方面,Amazon Quantum Ledger Database (QLDB) 是一种完全托管的分类账数据库,提供了一个透明、不可变、可以加密方式验证的事务日志。
目前,不同的云服务商,包括微软、谷歌云、阿里云、腾讯云等都开始提供多种数据库服务。作为云服务行业市场份额高的AWS,能提供15个数据库引擎,比其他提供商都多,数十万客户使用AWS数据库推进创新。
AWS 的专用数据库产品组合支持各种数据模型,让用户可以构建具备高可扩展性的分布式应用。通过选择最合适的数据库来解决具体的问题,可以摆脱存在诸多限制的通用大型数据库,并专注于构建应用来满足业务需求。
3.省钱、省时间最要紧
数据库管理系统的部署和创新越来越成为云优先或仅云的。
根据Gartner的调查,在数据库业务增长中,本地部署数据库只占32%,而且增长通常是由于价格上涨和进行强制升级以避免风险带来的,云数据库收入比例达到了68%。
Gartner数据显示,到2022年,75%的数据库将被部署或迁移到云平台,只有25%的考虑部署到本地。
那么,为什么用户纷纷选择云数据库服务呢?
数据是每个组织的战略资产。随着数据继续以指数级增长,数据库对理解数据并将其转化为有价值的见解至关重要。
在数据库的选型上,一般企业用户最关心的无非是成本、性能、可用性、可扩展性,以及运维、效率等。
其中的运维成本包括监控告警是否完善、是否有备份恢复机制、升级和迁移的成本是否高、社区是否稳定、是否方便调优、排障是否简易等;
扩展性则是如果业务的需求不确定,是否容易横向扩展和纵向扩容。
如果在本地运行数据库,用户可能会发现,操作、扩展和管理数据库是繁琐的、耗时的,而且成本高,技术要求高。
云服务商的数据库服务可以在成本、性能、可用性、可扩展性,以及运维等多方面提供比本地部署数据库更好的体验,优势是在成本、效率方面。
将本地数据转移到为云构建的托管数据库,就会帮助用户减少部署时间和成本。一旦数据库在云上,用户可以将主要精力放在更快的创新和构建新应用上,而数据库的维护包括扩容、性能优化、迁移等读交给云服务商来完成。
据悉,AWS 数据库的成本是商用数据库的十分之一,以极低的成本提供商用数据库具有的可扩展性、性能和可用性。
利用Amazon数据库,用户将无需担心数据库管理任务,如服务器预置、修补、设置、配置、备份或恢复等。AWS 会持续监控用户集群,以自我修复存储和自动扩展保证工作负载正常运行。
据悉,通过 AWS Database Migration Service (DMS) 数据库迁移服务,已经完成了20多万个托管型数据库的迁移。十万客户通过迁移到AWS托管型数据库服务实现了成本节省,这些服务融合了开源数据库的灵活性和低成本,以及商用数据库稳健的企业功能集,帮助团队摆脱耗时且无差别的繁重数据库管理工作。
4.性能优化,可扩展性增加
云上数据库服务不仅在成本和效率上赢了本地部署的数据库,而且在性能和可扩展性上,甩本地部署几条街。最根本的原因是云上的资源本身就是弹性可扩展,按需使用。
首先在性能上,云上数据库服务基本上都是云原生的,能适应云上应用,因而性能表现出色。
如AWS数据库是全新设计的,用于支持具有微服务架构的现代全球分布式应用的规模、性能和可用性需求。
因此,AWS数据库能够提供的性能是常用数据库的3~5 倍,同时能扩展以支持每秒超过 2000万请求和存储数PB的数据。
其次,在可扩展上,用户可先从小规模起步,再按应用的发展情况酌情扩展。AWS可以轻松扩展数据库的计算和存储资源,满足用户应用的需求。
由于专用数据库针对用户需要的数据模型进行了优化,相比使用商用数据库,您的应用可以具备更好的可扩展性和性能,费用只需商用数据库的1/10。
第三,AWS 数据库针对关键业务型企业工作负载构建,提供了高可用性、可靠性和安全性。
多达15种数据库引擎,支持多区域、多主复制,并且可用于完全监管数据的多级安全保护,包括使用 Amazon VPC进行网络隔离、使用通过AWS Key Management Service (KMS) 创建和控制的密钥对静态数据进行加密,以及对传输中的数据进行加密。
AWS作为无服务器技术Serverless的最早提出企业,可以满足数据库应用的按需扩展。
其中,Amazon Aurora Serverless 是一种针对 Amazon Aurora的按需自动扩展配置,其中,数据库将根据应用需求来自动启动、关闭以及扩展或缩减。它是一种简单且更具成本效益的选择,适用于不频发的、间歇性的或不可预测的工作负载。
其优势包括简单,消除了管理数据库实例和容量的复杂性;可扩展,可按需无缝扩展计算和内存容量,同时不会中断客户端连接;经济高效,您只需按秒为使用的数据库资源付费等。
诚然,传统数据库不会很快消失,但是随着数据库技术的发展,会出现更多贴合不同场景的新的数据库选择,满足用户的需求,还能在性能、成本、效率、可扩展等方面,带来更好的体验,何乐而不为呢?
分享题目:告别一刀切进入专用数据库时代,为具体场景找到合适的数据库
URL地址:http://scyanting.com/article/cgdjpj.html