我中心获得2011年度国家社会科学基金立项

2011-06-21 中心编辑

 

2011年度国家社科基金项目评审结果于617日正式公布。经全国哲学社会科学规划领导小组批准,厦门大学数据挖掘中心朱建平教授申报的课题《金融高频数据挖掘方法及应用研究》获得国家社科基金项目立项。该项目拟在以下几个方面展开研究。

第一、界定高频数据概念,澄清高频数据认识上的误区。我们发现很多文献对高频与超高频这两个概念混同使用,高频、超高频与低频之间的界限也较为随意。为此,我们将从更严格的意义上对低频数据、高频数据与超高频数据做作出了界定和辨析,进而从统计学理论和方法的角度来审视高频数据挖掘的内容和方法。

此外,不少文献对高频数据认识上有一些误区,认为高频数据仅仅是加细了取样间隔,增加了样本容量。事实上对高频数据的建模与低频截然不同,超高频数据与高频数据的研究方法也有质的区别,这也是我们研究的一个新领域。

第二、明确高频数据处理的特征,研究高频数据挖掘的统计方法。目前尽管大部分文献的研究内容与高频数据分析紧密相关,但从数据挖掘的角度,对高频数据的深入研究并不多。这样就有必要从统计学的角度来审视和研究高频数据挖掘。1)高频数据动态聚类。针对高频数据如何反映高频数据在时间上的动态特征,如何处理更新数据对已有聚类的影响。在高频数据的高维空间中找出最优线性基向量并将其作为降维子空间,通过降维得到聚类分析的结果;2)高频数据动态分类。高频数据的分类过程如何保证分类模型对于更新数据的适应性和分类稳定性。选择适当的基函数对高频数据进行拟合,来分析大型高频数据的分类问题。3)高频数据波动性分析。对高频数据中包含的不同性质、不同程度、不同周期的规律性特征进行分离,实际达到高频数据的降维。4)高频数据压缩。高频数据压缩方法和统计模型结合较为紧密,借助函数数据分析的观点,将高频数据函数化,不仅可以起到压缩高频数据目的,还可以对高频数据的微结构进行分析。5)规则发现。相对于其它挖掘方法,规则发现更适合用于非标准高频数据的探索性分析,对规则的有效性和稳定性最进一步的研究。

第三、加强高频数据挖掘的应用研究。研究上述问题的主要目的在于应用,其应用的重点主要体现在:1)随机交易间隔分析。对高频数据中出现的交易时间间隔随机问题,我们通过研究的方法,深入分析将交易间隔作为随机变量可以考察有关于日内市场活动的信息;2)离散价格与受限因变量分析。针对交易价格离散波动等特征,我们将对离散选择模型和排序选择模型进行扩展来分析离散价格的波动;3)微结构模型的应用研究。在资本交易市场上,我们将微结构模型研究开展,研究交易成本以及它对价格等变量的短期行为影响;4)波动性分析方法的应用。捕捉不同波动水平下金融市场间非线性、非对称相关关系的变化,进而分析出金融市场间是否存在传染。5)金融网页内容的优化研究。对股市分钟交易数据投机交易行为进行探测,并通过股票交易和访问日志数据分析来优化金融网页内容,提高金融网站平均访问率和浏览时间。