DataCell

产品简介

随着信息化的不断发展,信息成为企业战略资产。企业越来越需要长期保存各类数据,以进行用户行为分析、市场研究等。大数据时代的来临对数据的存储、查询和分析提出了新的挑战:
1、 各种不同类型、不同特征、以PB甚至EB计的海量数据,需要高效的存储和查询。传统关系数据库无论是存储容量还是并发访问能力都非常有限,而纵向扩展代价高昂。
2、 业务快速响应要求实时或准实时的数据分析。受技术架构以及存储设备IO能力所限,传统关系型数据库在进行大数据分析时,效率较低,无法满足实时性要求。
3、 不断增加的数据量和访问请求,提出了弹性、可扩展的要求。传统的关系型数据库受限于其关系数据模型,横向扩展艰难,无法满足这一要求。
友友系统的DataCell是一款支持结构化、半结构化数据统一存储、高效查询,并提供离线和在线分析框架的分布式数据库。存储能力强,并发性能高,兼容性好,适应性强,满足各行业海量数据存储、查询和分析的需求。
DataCell构建在大规模普通硬件之上,存储容量可弹性扩展,延长了存储系统的生命周期,降低了总拥有成本(TCO)。DataCell提供了和Map/Reduce、HDFS、Pig、Hive、Impala兼容的API,支持JDBC/ODBC访问,由此可以很容易的将基于Hadoop和SQL的应用程序迁移过来。DataCell还提供图形化的控制台简化系统的安装、部署、配置、监控和访问控制,降低了系统的运维成本。另外,具有自主知识产权,能够按需提供定制化服务。

逻辑架构

产品优势

高性能

响应速度快,并发处理能力强,适合高并发低延迟的数据访问,支持数据实时流转、快速决策,让企业更有效地挖掘大数据价值。

兼容性好

1.与Apache Hadoop兼容(包括HDFS、MapReduce、Hive、Pig和Impala),可以直接将基于Hadoop的应用移植到DataCell上。

2.SQL兼容,可以作为MySQL的存储引擎插件,基于SQL的应用基本不用修改即可实现数据分布存储。

易扩展

无中心节点的分布式架构,支持通过在线增加节点提升存储和处理能力,支持在线升级,使得客户的架构方案可以持续不断演进,满足不断增长的需要。

高易用性

对管理数据的平台提供可视化的运维管理工具,使得系统运行的更加稳健、降低系统的运维难度。

典型应用

日志存储分析
企业IT系统往往都有日志存储的需求。日志属于结构化、半结构化流式数据或归档数据,具有数据量大且持续增长的特点,有些情况下对并发写入也有较高要求。一般来说,日志存储的目的不简单是把数据存起来,而是要做后续的查询分析。DataCell不仅可以为各种格式的日志数据提供弹性可扩展的统一存储,而且通过Hadoop兼容的分析框架,支持对日志进行深度地挖掘分析。

电话详单查询

电信运营商的通话详单、手机上网详单的在线查询和统计分析。详单属于结构化数据,数据量大,要求高并发实时写入、高速数据加载、秒级低延时查询。DataCell凭借其极高的并发处理能力和兼容Impala的实时分析框架,可以很好地满足详单数据在线存储、在线查询的业务需求,并可以进一步对历史数据挖掘、流量分析、用户行为分析等业务进行有力支撑。

大规模网络监控、管理

电信网、电力网、铁路网、物联网等网络规模庞大、设备众多,要想实时把握网络的整体服务状态,就需要在大量的节点上采集大量的数据,如流量信息、设备状态、链路状态等。这些数据采集源头多、数据量大,属于大规模结构化流式数据。这些数据的存储对并发能力、吞吐量、低时延有很高的要求。DataCell可以很好的满足这一场景下的要求。