什么是数据库?

数据库是计算机系统的三大核心基础软件之一。数据是数据库中存储的基本对象,包括数字、图像、音频等形式,在进行逐级抽象后存储在数据库中,通常由数据库管理系统 (DBMS) 来控制,DBMS充当数据库与其用户或程序之间的接口,允许用户检索、更新和管理信息的组织和优化方式。

SQL在1970年被提出,是目前关系数据库标准的结构化查询语言。SQL的范围包括数据插入、查询、更新和删除,数据库模式创建和修改,以及数据访问控制。

数据平台分类

数据仓库(Data Warehouse):自上世纪80年代末出现以来,伴随MPP架构的出现,也使得系统能够处理更大规模的数据量。但是随着大量的非结构化、半结构化数据产生,数据仓库劣势显现出来;

数据湖(Data Lake):数据湖自2010年末出现,可以存储各类格式的原始数据存储库,但是企业对数据访问灵活性、高性能的需求从未降低,因此多系统共存是企业常态,如一个数据湖,加上多个数据仓库等,架构复杂性也为运维带来困难;

湖仓一体(Lakehouse):湖仓一体构自2020年出现,其建在数据湖低成本的数据存储架构之上,又继承了数据仓库的数据处理和管理功能。

数据库市场空间广阔

国内数据库市场占全球市场较小,未来发展空间较大。目前根据信通院的统计数据,2020年国内的数据库规模为240.9亿元,占全球数据库市场规模的比例为5.2%,未来到2025年的时候,国内的数据库规模将占到全球数据库规模的12.5%(这一数据基本与中国IT总支出占全球IT总支出的比例较为接近)。

数据库的发展趋势:国产化

国产数据库的企业主要成立于2000年和2015年前后。根据中国信通院的统计(截止到2021年6月),我国的数据库公司主要成立时间分别集中在2000年和2014-2017年左右,一方面是因为2000年前后是我国数据库发展的萌芽阶段,当时成立的传统数据库厂商有达梦、人大金仓、南大通用、神舟通用等,另一方面在2014-2017年之间,我国由于互联网时代的到来数据量激增以及去IOE趋势盛行,所以成立的数据库国产厂商较多。

经过十几年的发展,我国的数据库研发水平逐步提升。VLDB、SIGMOD、ICDE三大会议是公认的数据库领域权威会议,根据信通院的统计来看,我国的数据库发展水平逐步提升,2018-2020年的三大会议的平均论文贡献度分别为22.14%、23.74%、23.81%。同时,从全球各国数据库领域的发论文数量和质量来看,美国和我国发文数量较高,分别达到1319、1141篇,领先其他国家,但是在质量层面还有待加强。

资料来源:国信证券《大数据系列专题(2):国产数据库百花齐放,崛起正当时》

大数据ETF(159739)秉承着云算一体、数据为主的理念,跟踪云计算指数,是未来的重要发展趋势。如果你看好大数据云计算以及数据库的国产替代,请点击下方产品卡片,关注大数据ETF。

  $大数据ETF(SZ159739)$ 

(基金投资需谨慎)

追加内容

本文作者可以追加内容哦 !