DBA
该算法是用来求序列数据集 S 的一致序列(平均序列)。由Franc-ois Petitjean提出的。目前,该方法求得的平均序列是最准确的。
假设一元组为
avg=s1+s2+⋯+snn(1)
如果 S 的元素为序列的时,如
上图是对前三个序列求平均序列,采用传统的方法(上面的公式(1))求得的第四个序列出现原序列不存在的峰点,显然我们希望得到的平均序列是最下面的序列。为什么式(1)求得的平均序列会出现不存在的模式?主要是因为(1)是分别对序列对应位置上的点值求平均(点对点匹配),但是,在时间序列相似性度量我们知道点对点匹配求得的相似性容易受到序列的移位、错位等影响。同时我们了解动态时间规划(DTW)的思想很容易处理这种情况。举个例子:
上图是欧式距离的思想,点对点匹配。下图是DTW思想,序列的一个点对应另一个序列的一个或多个点。
可以换一个角度理解DTW算法,就是求序列 B 和序列
序列 Anew 可以包含子序列,序列 B 和序列