时间序列表示是时间序列挖掘的一个基础和关键问题。对当前出现的各种典型的时间序列表示方法进行了综述,对各自的特点从多个角度进行了比较研究。结果说明,大部分时间序列表示方法将时间序列降维,且都与应用领域紧密相关,在实际构建系统时仍需对各种表示方法按照实际需求进
时间序列表示进展及比较研究:时间序列挖掘建模环
境1
李俊奎,王元珍,刘城成,曹忠升
华中科技大学数据库与多媒体研究所(430074)
email:jkltk2000@
摘 要:时间序列表示是时间序列挖掘的一个基础和关键问题。对当前出现的各种典型的时间序列表示方法进行了综述,对各自的特点从多个角度进行了比较研究。结果说明,大部分时间序列表示方法将时间序列降维,且都与应用领域紧密相关,在实际构建系统时仍需对各种表示方法按照实际需求进行转化和改造。
关键词:数据挖掘 时间序列 表示 建模
1.引言
时间序列是一种重要的高维数据类型,它是按照时间顺序观察所得到的一串数据。时间序列的应用日益广泛,其涉及天文、地理、生物、物理、化学等自然科学领域,图像识别、语音处理、声纳技术、遥感技术、机械工程等工程技术领域,以及市场经济、金融分析、人口统计、地震检测等社会经济领域,当前对于时间序列挖掘的研究正得到越来越多的重视
[18][15]。
本文的背景是国家发展与改革委员会“安全智能整合平台开发及产业化”项目,该项目的一个重要目标是以人工智能、数理统计等先进的数据挖掘技术为基础,满足用户的智能化知识发现和趋势分析的需求,为用户战略决策提供服务。在项目进行中,构建时间序列挖掘子系统时,我们面临首先必须解决的一个重要而基础的问题是对时间序列进行建模表示。经过大量深入细致的相关研究和文献查阅,我们发现当前对于时间序列的表示问题虽然取得了部分进展,但是如果需要将研究成果应用于实际系统构建过程,仍然需要深入考察以及对各种表示方法进行实际转化和处理。
本文综述了当前时间序列挖掘研究领域中出现的各种时间序列的建模表示方法,指出在构建实际系统时,这些表示方法都存在各自的问题。并且指出时间序列表示方法是一种与应用领域和应用需求相关的方法,为实际的时间序列表示和建模提供了参考。
本文的其余部分如下组织:第2节讨论时间序列表示的相关背景;第3节对当前已经出现的时间序列的表示方法进行综述,陈述各自的不足;第4节对各种时间序列表示方法进行比较;第5节总结全文,并指出未来的进一步工作。
2.时间序列表示的相关背景
为了说明的严谨,我们首先给出时间序列的相关定义。
定义1 时间序列(Time Series) 时间序列T=t1,t2,...,tn是一串有序的n实数变量。
定义2 时间序列长度(Length of Time Series) 对于有限长时间序列T=t1,t2,...,tn,T的长度为组成T的实数个数,记为|T|,即|T|=n。对于无限长时间序列,T的长度定义为|T|=∞。
无限长时间序列一般在数据流的建模中使用,有限长时间序列则在时间序列数据库中使用。
定义3 时间序列区段(子序列) (Segment, Subsequence) 给定长度为n的时间序列T,T1本课题得到国家发展与改革委员会“安全智能整合平台开发及产业化”项目(项目编号[2005]538号)资助
- 1 -
百度搜索“77cn”或“免费范文网”即可找到本站免费阅读全部范文。收藏本站方便下次阅读,免费范文网,提供经典小说教育文库时间序列表示进展及比较研究时间序列挖掘建模环境在线全文阅读。
相关推荐: