华为云数据库GaussDB(for Influx)与开源企业版性能对比

爱科技的清欢前端 2022-12-01

“你们的数据库性能怎么样？”

“能不能满足我们的业务？”

“和其他数据库对比性能有优势么？”

......

客户在使用数据库时常有这样的担心和疑问。

本文从测试方案、测试工具、测试场景、测试结果等方面详细介绍了GaussDB(for Influx)和开源InfluxDB集群在X86架构下的性能测试情况。测试结果显示，GaussDB(for Influx)较企业版InfluxDB集群能提供更高的写入性能、更低的访问延迟以及更高的数据压缩率。

1 测试方案

1.1 资源配置

服务端配置

产品名称	规格	存储	架构
GaussDB(for Influx)	4U16G 2节点	100G	集群架构
开源企业版InfluxDB	4U16G 3节点	100G	集群架构

1.2 测试工具

测试工具为开源性能工具TS-benchMark。

2 测试设计

2.1 测试模型

本次测试采用风力发电数据模型，每个风场50个设备，每个设备50个传感器，1个风场1个线程，通过load数据的线程数来控制时间线的大小，通过收集时间的长短来控制数据量。

模型每条数据大小约为24字节，具体的类型如下：

Timestamp | farm | device | sensor | value

2.2 测试数据量

测试数据分为两个场景，大数据量和小数据量，具体数据量如下：

场景	时间线	数据量
小数据量	5000	4亿
大数据量	250万	GaussDB(for Influx) 150亿企业版InfluxDB 47亿

注：企业版InfluxDB在插入到47亿数据时OOM，以下性能对比都基于此数据量。

2.3 测试场景

2.3.1 数据写入场景

l batch_size(每个批次写入的数据量) 固定为50，线程数分别从1、2、4、8、16、32、64、128、256、512 递增；

l 线程数（客户端并发请求的连接数）固定为8， batch_size分别从50、100、150、200、250、300 递增。

2.3.2 数据查询场景

单线程进行不同语句的查询，并统计其时延信息。

第一类查询：

select *

from sensor

where f='f1' and d='d2' and s='s1' and time>=1514768400000000000 and time<=1514772000000000000

第二类查询： + VALUE查询

select *

from sensor

where f='f1' and s='d2' and value>=3.0 and time>=1514768400000000000 and time<1514854800000000000

第三类查询：

select mean(value)

from sensor

where f='f1' and s='s1' and time>=1514768400000000000 and time<=1514854800000000000 group by f,d,s,time(1h)

第四类查询：

select *

from sensor

where f='f1' and (s='s1' or s='s2' or s='s3' or s='s4' or s='s5') and time>=1514768400000000000 and time<=1514769150000000000

第五类查询：AG查询

select *

from sensor

where f='f1' and time>=1514768400000000000 and time<=1514769150000000000

3 测试结果分析