1、n利用Copula函数可以计算一致性相关系数。构造股票相关性网络n将每一只股票看作一个节点,股票与股票之间的关联关系看成边;n当股票 a 的价格变化影响股票 b 的价格变化时,则它们的关联关系是从 a 指向 b 的。当股票 b 的价格变化影响股票 a 的价格变化时,则它们的关联关系是从 b 指向 a 的;n当 a 对 b 的影响大于 b对 a 的影响,则认为两只股票的关联关系是从 a 指向 b,反之则是从b 指向 a。构造股票相关性网络n任意选取两只股票 a 和 b,则 a 股票和 b 股票的相关性系数为:其中构造股票相关性网络根据关键点可以对股票网络进行板块划分协同微粒群n将粒子编码为影响股
2、票走势的各个相关因素,粒子通过适应度函数来进行更新,并且在更新的过程中保留原来的较优成分进行遗传。协同微粒群n假设微粒群的节点搜索位置空间的维度为 D 维,粒子的编码使用某种属性下的关联股票的属性值。初始化选取m个粒子构成的粒子群,粒子的空间优化问题就是选取属性关联下的符合目标函数的粒子。n空问中第 i个粒子的编码就是选取的分析股票下某种属性的属性值,表示为以下的形式Xi=(Xi1,Xi2,Xin),n代表分析股票的总数。协同微粒群第第i个粒子空间更新的速度为个粒子空间更新的速度为第第i个粒子历史最优位置为个粒子历史最优位置为整个粒子群历史最优位置整个粒子群历史最优位置粒子可以根据如下的公式进
3、行速度与位置的更新粒子可以根据如下的公式进行速度与位置的更新K 为微粒群中优化的迭代次数,为微粒群中优化的迭代次数,r 1和和 r2是在区间是在区间 0,1上的随机数,这两个随机数能够有效保持微上的随机数,这两个随机数能够有效保持微粒群优化的多样性。粒群优化的多样性。C1和和 C2是两个学习因子,这两个系数可以保证粒子对全局位置的学习能力。是两个学习因子,这两个系数可以保证粒子对全局位置的学习能力。协同微粒群支持度挖掘粒子群S(i),S(R)分别表示微粒的支持度与用户预先设置的支持度。分别表示微粒的支持度与用户预先设置的支持度。cov(A+B)是指两种事件在数据库中的比例。)是指两种事件在数据
4、库中的比例。置信度挖掘粒子群协同微粒群初始化m个粒子支持度微粒群规则度微粒群规则提取更新进入规则微粒群更新符合适应度粒子补充不符合适应度粒子更新能力保持Apriori算法n依据支持度找出所有频繁项集n依据置信度产生关联规则项集(项集(Itemset):同时出现的项的集合。定义为:):k-itemset(k项集)。项集)。Apriori算法n首先,找出频繁“1项集”的集合,该集合记作L1。L1用于找频繁“2项集”的集合L2,而L2用于找L3。如此下去,直到不能找到“K项集”。找每个Lk都需要一次数据库扫描。n置信度大于给定最小置信度minConf的关联规则称为频繁关联规则(Frequent As
5、sociation Rule)。数据预处理n插值:由于连续交易的时间间隔不同,因此在一个时间段内,甚至可能没有任何的记录。按照给定的时间单元间隔对高频交易数据采样,选择最近的一个价格点填充。n小波分析:股票的价格变动可以看作一个一维离散信号,对于一维离散信号来说,其高频部分影响的是小波分解的第一层细节,其低频部分影响的是小波分解的最深层和低频层。小波降噪的过程,就是把信号分解为多个子信号,通过对小波分解系数的处理去掉其中的噪音部分,然后把余下部分进行合并重构的过程。n使用SYM8小波,对价格信号进行两层分解,对分解得到的分解系数进行Heursure阈值处理。数据预处理n涨幅z定义如下:若第I时刻成交价为Pi,第I-1时刻成交价为Pi-1,则涨幅z=(Pi -Pi-1)/Pi-1 。同时约定:z 1%时为涨,记为1;z -1%时为跌,记为0。n考虑时滞性:以时间窗口的个数作为事务项。数据预处理数据预处理数据预处理构造股票相关性网络n利用股票的相关性网络找出关键点并进行板块划分。投资者的盈亏大约80%是来自于买卖时机的选择,还有20%的比例是来自于板块和个股的选择。如果个股所属的板块整体有行情,那么买卖这样的个股盈利可能性更大。Apriori算法n挖掘关联规则n频繁项集n关联规则