时间序列表示是时间序列挖掘的一个基础和关键问题。对当前出现的各种典型的时间序列表示方法进行了综述,对各自的特点从多个角度进行了比较研究。结果说明,大部分时间序列表示方法将时间序列降维,且都与应用领域紧密相关,在实际构建系统时仍需对各种表示方法按照实际需求进
列出发,而是选取时间序列中的若干特殊的数据点,从而完成时间序列的表示。
文献[6]中提出一种称为Landmarks的时间序列表示方法,将时间序列中的极值点、弯曲点识别出来,并在这些点上建立模型,从而完成原时间序列的近似表示。
文献[21]中提出一种类似的Important point的时间序列表示方法,定义时间序列的局部最大点和局部最小点,并用这些点的相邻连线作为时间序列的表示。
这些取若干点的方法的问题主要是:1)需要被选中的点能够突出序列中数据的主要特征;2)选取的点的数量、范围以及特征要求比较严格。
4 各种时间序列表示的比较
在这一节,我们对典型的时间序列表示方法进行比较。
由于数据挖掘过程是一个需要用户参与的不断交互的过程,而且时间序列数据经常以流序列的形式存在,所以结合我们的项目需求,我们从以下方面进行:
(1) 是否进行时域-频域变换;
(2) 是否有效降维;
(3) 是否线性计算复杂度;
(4) 是否符号化;
(5) 能否处理变长序列;
(6) 能否动态插入/删除;
(7) 结果用户是否容易理解;
(8) 局部特征是否保持。
比较结果如表1所示。 表1 时间序列表示方法比较(Y:Yes, N:No)
(1)(2)(3)(4)(5)(6)(7)(8) 表示方法
YYNNDFT YNDWTYYNNNNSVDYYNNYNNYYNPAA YYAPCA NYNNYY N YNYNNPLA YYNYYNYN N PRA YNYNNNN N 多项式拟合 YClipper Data NNYYY N YYSAXNYYYYYYYNNYYYYYYY Y Y N Y Y Important point N5 结论 总结以上出现的时间序列不同表示方法,可以得出结论如下:1)由于实际中不同应用对于时间序列数据的关注角度不同,对于时间序列的表示的方法也不同,时间序列表示与应用相关;2)大部分时间序列的表示方法都围绕降维展开,千方百计地降维而不至于大量地丢失原有数据的信息和特征。 本文中我们对当前出现的比较典型的时间序列表示方法进行了综述和比较研究,进一步的工作是这些方法进行实际转化和改造,并应用到我们的项目中,并且对于新的时间序列表示方法,特别是时间序列流环境下的时间序列表示方法进行探索和研究。
- 4 -
百度搜索“77cn”或“免费范文网”即可找到本站免费阅读全部范文。收藏本站方便下次阅读,免费范文网,提供经典小说教育文库时间序列表示进展及比较研究时间序列挖掘建模环境(4)在线全文阅读。
相关推荐: