数据集简介
-
数据集收集的是28个机器连续5周的数据,相邻两组数据间间隔一分钟。
-
总共收集28个机器的数据,每个机器收集38个维度(变量)的信息。
-
训练集与测试集的数据量是1:1的,训练集无label,测试集有label。
-
时间信息是隐匿的
数据文件中内容说明
-
-
文件名采用machine-x-y.txt的形式,其中x代表组,y是组里的index,每一个machine-x-y代表一个具体的机器。
-
train:包含数据的前半部分,作为训练集,无标签。
-
test:包含数据的后半部分,作为测试集,有标签。
-
test_label: 测试集标签,表明某一时间节点处是否处于异常状态。
-
interpretation_label:该数据集给出异常点的具体异常
-
数据展示
数据集分享:
链接:https://pan.baidu.com/s/1fgMz1m50vNQaECscT11DRA
提取码:loix
--来自百度网盘超级会员V6的分享
鉴于很多兄弟们询问该数据集的每个通道的具体含义,我做了一些调查,在作者那里找到了回复,现做补充。
补充:
cpu_r,load_1,load_5,load_15,mem_shmem,mem_u,mem_u_e,total_mem,disk_q,disk_r,disk_rb,disk_svc,disk_u,disk_w,disk_wa,disk_wb,si,so,eth1_fi,eth1_fo,eth1_pi,eth1_po,tcp_tw,tcp_use,active_opens,curr_estab,in_errs,in_segs,listen_overflows,out_rsts,out_segs,passive_opens,retransegs,tcp_timeouts,udp_in_dg,udp_out_dg,udp_rcv_buf_errs,udp_snd_buf_errs
每一行都在同一时间间隔内采样。