Tel:400-888-8888

Aluminum Blinds

本文摘要:[摘取 要]数据挖掘技术近年来被普遍用作时间序列分析,时间序列挖出技术主要还包括关联分析、序列分析、分类分析、聚类分析和出现异常检测等五类。由于领域的时间序列具备一些最重要的特征,因此将各种挖出方法与金融时间序列的特征,以及各种传统的时间序列分析模型结合,是目前金融时间序列挖出领域的研究热点。 [关键词]时间序列;金融;数据挖掘 一、谓之 言 在金融领域,时间序列是一种最重要的数据类型,对时间序列的分析是金融数据分析的一个最重要内容。

半岛体育入口

[摘取 要]数据挖掘技术近年来被普遍用作时间序列分析,时间序列挖出技术主要还包括关联分析、序列分析、分类分析、聚类分析和出现异常检测等五类。由于领域的时间序列具备一些最重要的特征,因此将各种挖出方法与金融时间序列的特征,以及各种传统的时间序列分析模型结合,是目前金融时间序列挖出领域的研究热点。  [关键词]时间序列;金融;数据挖掘       一、谓之 言      在金融领域,时间序列是一种最重要的数据类型,对时间序列的分析是金融数据分析的一个最重要内容。

作为数理学的一个分支,时间序列分析自1960年代起就早已获得了普遍的研究。传统的金融时间序列分析方法主要还包括基本分析、技术分析以及各种数理统计学方法等。

随着近年来数据规模的大大快速增长以及分析任务的日益简单,数据挖掘技术开始被运用到金融时间序列的分析中。  所谓数据挖掘是所指从大规模的数据中提取说明了、不得而知、有潜在使用价值的规则的过程。

作为一门交叉学科,数据挖掘构建了许多学科中成熟期的工具和技术,还包括数据库技术、统计学、机器学习以及人工智能等。广义地说,所有从海量数据中找到新的规律的方法都可以总称为数据挖掘技术。

  本文在对传统的金融时间序列分析方法展开非常简单总结的基础上,对当前主要的金融时间序列挖出技术展开综述,并认为涉及方法的优缺点和必须更进一步研究的问题,为该领域的更进一步研究获取基础。     二、金融时间序列传统分析方法      基本分析与技术分析是最少见的分析方法,主要用作与中的时间序列分析。基本分析主要通过对影响证券市场供求关系的基本因素展开分析,从而辨别股票价格的走势。技术分析则通过对数据展开一些非常简单的计算出来,获得涉及的技术指标和图表,从而辨别序列未来的变化趋势。

半岛体育入口

  另一类主要的金融时间序列分析方法是数理统计方法,这类方法主要还包括各种统计资料特征的分析、涉及分析、线性/非线性重返分析、自重返移动平均值(ARMA)分析以及分形分析等,此外,各种多元分析方法也被普遍用作金融时间序列分析,如判别分析、主成分分析以及因子分析等。仅限于篇幅,本文仍然详尽辩论这些方法。     三、时间序列挖出方法      近年来数据挖掘技术在时间序列分析领域开始获得普遍的研究与应用于,有数大量的文献明确提出了各种时间序列挖出算法。

必须认为的是,虽然这些文献本质上归属于对标准化的基础算法展开研究,并不是专门针对金融领域的时间序列,然而其中许多方法都是以金融时间序列为事例,来解释算法的有效性、准确度或性能,因此这些算法也在金融领域获得了应用于。时间序列挖出方法主要还包括以下几个方面。     1.关联分析与序列分析   关联分析与序列分析的目的都是找到数据间的各种涉及联系,有所不同的是,关联分析用作找到同一时间段内的各种联系,而序列分析用作找到在时间上具备先后关系的联系。

  用于关联与序列分析方法,需要找到同一序列的前后变化或有所不同序列变化间的简单关系。由于传统的关联与序列挖出算法主要限于于符号型数据,因此在对数值型金融时间序列展开关联与序列分析时一般必须先对序列展开符号化。将序列区分为多个子序列,根据子序列的形状展开聚类并符号化,在此基础上使用序列挖出算法找到符号间的规则。多个股票在有所不同时段的涨跌关系切换为具备双时间维约束的关联规则模型,并明确提出涉及的挖出算法,用作挖出“当某几种资产的收益率变动多达一定幅度时,哪些资产不会在同时(或间隔一段时间后)有某种程度(或忽略)的展现出”这类简单的规则。

一种基于“最重要点”的方法将时间序列弃段符号化,并明确提出了一种基于言和关联后继树根模型的时间序列关联规则找到算法。     2.相似性查询   相似性查询是时间序列挖出领域的一个最重要研究方向。所谓相似性查询是指对于等价的目标序列Q,根据某种相似性度量函数,找寻与Q最相近的序列Qk。

时间序列的相似性查询分成仅有序列给定和子序列给定两大类,仅有序列给定是指所查询的序列与目标序列Q具备完全相同的长度;子序列给定则是所指在一个更长的序列中,找寻与目标序列Q相近的所有子序列。相似性查询在金融领域典型的应用于是,根据图形上的相似性,找寻与某种资产的价格(或收益率)变动情况较为相似的其他资产。

  由于金融时间序列一般都横跨较长的时间段,理论上甚至具备无限长度,因此这类数据都展现出出有高维甚至是超高维的特征。由于大多数相似性度量函数(如欧氏距离函数)在处置高维数据时性能都急剧下降,因此对于这类数据,一般再行使用某种方法对序列展开维约简,将要完整序列转换到较低维空间,在此基础上再行较为序列间的相似性。

少见的时间序列维约简方法还包括线性傅立叶转换、线性小波转换、弃段线性叙述等。除了维约简方法,相似性度量函数也是这一问题的研究热点。     3.聚类分析   聚类分析的目的是把整个目标数据分为多个有所不同的簇,使得每个簇中的数据尽量相近,而有所不同簇中的数据具备显著的差异。

半岛体育入口

在金融领域,聚类分析对于板块研究、人组模型的建构以及客户交易模式研究等都具有最重要的意义。  由于时间序列的聚类分析某种程度必须展开序列间的相似性度量,因此与相似性查询类似于,在聚类分析之前一般先对序列展开维约简。

用于线性傅立叶转换对序列展开维约简,在此基础上用于欧氏距离展开聚类,与此类似于,研究了基于线性小波转换和主成分分析的时间序列维约简以及聚类,对基于线性模型的聚类方法展开了研究。  研究了基于隐马尔可夫模型(HMM)的时间序列聚类,将HMM和希望仅次于方法结合,从而提升了聚类结果的准确性。针对由于时间序列中常常不存在出现异常数据,明确提出将完整序列根据中位数转化成为二元时间序列,在此基础上展开聚类,从而增加出现异常数据的影响。

试验结果表明,当序列中不存在出现异常数据时,该方法需要有效地提升聚类结果的准确性。      4.拆分与逐段叙述   时间序列的拆分与逐段叙述是所指对长度为n的序列Q,将其分成k段(k<<n),对各段分别用于某种模型展开叙述并记作Q′,使得Q′与Q十分相似。

对时间序列展开拆分与逐段叙述的主要原因有两个方面:第一,时间序列往往横跨较长的时间段,某些序列在理论上甚至具备无限长度,在此期间数据的许多特征都有可能发生变化,对这样的数据用一个单一的模型来叙述是不适合的;第二,时间序列在进化的过程中,由于受到各种因素的影响,往往具备简单的局部特征,用于一些非常简单的模型(如线性模型)对序列展开弃段叙述,弃置一些细节变化信息,对于某些挖出任务来说更加适合。  由于金融时间序列常常受到众多非线性因素的影响,并且随着时间的流逝,各种因素的影响效果也大大变化,因此金融时间序列往往呈现复杂多变的形态特征。

对金融时间序列展开拆分并弃段叙述,对许多挖出任务而言更有意义。最常用的时间序列拆分方法是用于线性模型对序列展开拆分与逐段叙述,称作弃段线性叙述,对这类拆分方法展开了详尽的讲解。

一种基于隐马尔可夫模型的联机时间序列拆分算法,根据概率密度函数的变化对序列展开拆分。


本文关键词:金融,领域,时间序列,挖掘,技术,研究,摘取,半岛体育入口,要

本文来源:半岛体育入口-www.trampaznanja.com

Copyright © 2021 Copyright weaving dreams    ICP prepared No. ********