环球最新:广州南沙“独角兽”巨杉数据库“实时”能力全球领先,“湖仓一体”推动数字化发展
发布日期: 2022-07-29 22:38:56 来源: 新快报

新快报讯 查询更实时,所有数据可毫秒级访问;存取更实时,吞吐量提升30%以上;诊断更实时,业务问题分钟级定位;全量数据生命周期管理,提升人效及能效……7月29日,落户广州市南沙区的“独角兽”企业巨杉数据库举行线上发布会,发布基于“湖仓一体”架构的v5.2版本,提升多项“实时”能力,诠释公司“释放全量数据价值”的全新价值主张。

“湖仓一体”是大数据深化发展的方向

“面对企业海量大数据场景下的实时处理、非结构化数据治理的需求,以及数据仓库/数据湖独立建设的架构局限,湖仓一体架构成为各厂商探索的方向。”发布会上,工信部下辖赛迪顾问股份有限公司解读了国内首份《湖仓一体技术研究报告》,详细介绍湖仓一体架构的兴起与未来发展方向,巨杉数据库SequoiaDB作为三家国产代表之一,入选这份报告。


(资料图)

“巨杉成立之初,就坚持100%数据库内核自研,立志打造自研国产数据库。” 巨杉数据库相关负责人表示,由中金资本领投,专注分布式数据库技术的巨杉数据库于2021年将总部落户南沙,凭借南沙区位及发展优势,深耕数据沃土。近日《广州南沙深化面向世界的粤港澳全面合作总体方案》发布,明确提出要加快建设南沙(粤港澳)数据服务试验区,巨杉数据库的落户,势必将为南沙的数字经济发展带来更好的数据基础服务能力及上下游人才资源。

“各行各业都在加速数字化发展,行业不但需要基于信息化的传统交易核心,更需要面向数据价值的数据核心,形成以数据为纽带的双核心架构。”据巨杉数据库相关介绍,目前,巨杉基于数据湖的实时能力已经达到全球领先,技术实力得到金融头部客户的认可。成立以来,其产品已在超过100家金融银行客户规模化生产上线。在单一客户中SequoiaDB所支持的最大数据量,已经达到1.4万亿行、服务器规模超过400台、数据容量达数PB。

四大实时能力提升,SequoiaDB v5.2释放全量数据价值

“我们实现了面向企业全量数据的高并发对客服务,让全量数据的价值从‘内部离线分析’向‘对客实时查询’进一步释放。基于巨杉分布式数据库的‘湖仓一体’架构,所有数据可对客提供高并发毫秒级访问。”发布会上,巨杉数据库介绍了四大实时特性的能力提升。

其中,查询更实时,所有数据可毫秒级访问。面向结构化数据,SequoiaDB v5.2版本提供深度的Join优化及列存微分区技术,在多个查询场景下,性能达到了毫秒级实时返回;分析场景中,性能更获得了10倍以上提升,让数据湖的查询分析更实时。

存取更实时,吞吐量提升30%以上。面向非结构化数据,巨杉通过“分片并发”及“可变分区大小”的技术,相比原有版本,SequoiaDB v5.2版本吞吐量提升30%以上,让数据湖的非结构化数据存取更实时。

诊断更实时,业务问题分钟级定位。发布会上,巨杉数据库发布SAC运维管理工具的重要特性更新,运行监控方面提供了全GUI的性能及故障分析能力,SAC基于分布式架构的实时诊断,可实现业务问题分钟级定位。

全量数据生命周期管理,提升人效及能效。部署架构方面,支持多配置硬件的混合部署,针对高并发数据与低并发数据,做到按需调度;面向横跨结构化、非结构化数据,提供一体化的开发及管理能力,提升人效及能效,在成本可控的前提下,实现全量数据实时可用。

厚植数据沃土,打造产学研生态链

数据库的发展不但需要技术的创新迭代,同时也需要建立良好的技术生态。在过去的一年间,巨杉数据库积极打造产学研生态链。通过分布式人才培养、高校协同、上下游企业赋能等,携手客户、合作伙伴、高校共同推进分布式技术的发展。目前,通过巨杉数据库培训认证的技术工程师已经超过一万人。

在高校协同方面,巨杉数据库先后在华南理工大学、深圳大学设立长期的“巨杉数据库奖学金”,推动中国分布式数据库人才培育。在产业生态方面,巨杉积极推动行业标准、团标及生态联盟的建设,致力于建设一个开放的基础软硬件企业级生态,特别是已经与鲲鹏、飞腾、海光、麒麟、统信等厂商的200多款信创上下游产品完成互认证。

目前,巨杉数据库产品已在超过100家金融银行客户规模化生产上线。除了金融行业,其产品也广泛应用于政务、能源等行业,如支持“粤省事”平台的医保、社保数据查询,这些数据也助力新冠核酸检测,帮助政府匹配核酸检测情况。

凭借过硬的自主研发能力、科技创新能力,2021年巨杉数据库成功入选广州市“专精特新”扶优计划培育企业首批名单,并荣获广州首批“隐形冠军”企业、信创产业独角兽100强、广州创新力大奖、广州未来独角兽创新企业等殊荣,同时,巨杉也是最早进入Gartner数据库魔力象限报告的中国厂商,并连续多年进入Gartner、IDC、福布斯、毕马威等国际知名权威报告。

未来,巨杉数据库SequoiaDB将持续聚焦于分布式特性,通过“湖仓一体”架构为客户打造“数据核心数据库”,打造数字化时代坚实的数据基础设施。在信创产业中,坚持践行信息技术应用创新的理念,服务于企业全量数据实时业务场景,与各类集中式及分布式交易核心数据库成为上下游合作伙伴,驱动数字化的业务的创新发展,释放全量数据价值。

采写:新快报记者 朱清海

标签: