HBase写入性能及改造——multi-thread flush and compaction(续:详细测试数据)

本文通过详细测试数据对比分析了HBase在不同配置和代码修改下的写入性能,包括原始情况、配置项修改、代码修改以启用多线程flush和compaction,以及启用GZ压缩。结果显示,代码修改和多线程启用显著提升了写入速度,减少了表的大小。启用GZ压缩后,10亿行数据的写入时间增加至3小时5分钟,但表大小压缩至原数据的17%。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

接上文啊:

测试机性能
CPU
16* Intel(R) Xeon(R) CPU           E5620  @ 2.40GHz
MEMORY 48GB
DISK 12*SATA 2TB
NET  4*1Gb Ethernet

测试数据:

类型 国内某视频网站近半年用户访问日志
结构 一行九列,包括用户访问页,关键词及其它用户信息。对应HBase一个family下9个column,一行120到180字节
数据量 每次测试写入10亿条数据,原始数据约110GB,写到HBase中一张不加压缩的表里HDFS中单副本约480GB (dus结果)

集群结构

RegionServer 1个 hostname: data2
DataNode  5个hostname: da
评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值