贝叶斯判别分析在股票投资分析中的应用.doc
- 文档编号:1995225
- 上传时间:2022-10-25
- 格式:DOC
- 页数:13
- 大小:334KB
贝叶斯判别分析在股票投资分析中的应用.doc
《贝叶斯判别分析在股票投资分析中的应用.doc》由会员分享,可在线阅读,更多相关《贝叶斯判别分析在股票投资分析中的应用.doc(13页珍藏版)》请在冰豆网上搜索。
贝叶斯判别分析在传媒板块股票分析中的应用
目录
摘要…………………………………………………………………3
1.引言……………………………………………………………….3
2.综合评价指标体系的建立……………………………………….4
3.聚类分析方法…………………………………………………….4
3.1离差平方和法…………………………………………………4
3.2距离测度的选定……………………………………………….5
3.3数据的标准化………………………………………………….5
4.股票投资的实证分析……………………………………….....…5
5.贝叶斯判别………………………………………………….……8
5.1判别分析的基本方法………………………………...…………8
5.2贝叶斯判别的基本思想和规则………………………….……9
5.2.1标准的Bayes判别………………………………………9
5.2.2考虑错判损失的Bayes判别分析……………………...9
5.3判别分析的应用……………………………………………….10
6.总结………………………………………………...……………12
参考文献………………………………………………...…...……12
摘要:
随着中国股票市场的不断发展,对股票的投资更加理性化和科学化,股票投资分析的作用也日益重要起来。
本文对20家出版传媒公司2011年的财务数据从盈利能力、偿债能力、成长能力和资本扩张能力等四个方面进行聚类分析,并对其分类结果应用贝叶斯判别来量化分析,从而检验分类结果。
对传媒版块的股票进行投资分析,据此总结出传媒版块股票的类型和特点,为市场各参与者提供有效把握该版块长期成长趋势的借鉴。
关键词:
股票投资;聚类分析;判别分析
Abstract:
WiththedevelopmentofstockmarketinChina,thestragedyofinvestmenttendstobemorereasonableandscientific.Asaresult,theanalysisofstockinvestmentwillperformavitalroleininvestment.Inthearticle,thefinancialdateofthepublicationofthemediacompaniesof20isanalysedontheaspectofprofitability,sovency,growthabilityandcapitalexpansioncapacity.Theoutcomeofclusteranalysisisadjusted,applyingtheBayesdiscriminantanalysis.Accodingtotheanalysisofstockamongthemediasection,thetypeandtraitofstocksaresummarized,whichcanprovideabenefinalreferencefortheinvestorstograspthegrowthtrendofthissectionefficiently.
KeyWords:
StockInvestmentClusterAnalysisBayesDiscriminant
1.引言
中国证劵市场经过了数十年的发展和完善,逐渐趋于成熟和科学,证劵投资分析的有效性和必要性也越来越强。
通过各种专业性的分析方法可以对影响证劵波动的各类信息进行综合性质的分析,从而判断证劵价格波动的行为,这就是证劵投资分析。
它是证劵投资过程中的一个重要环节。
常用的证劵分析方法有基本分析和技术分析,在此不讨论技术分析,而着重研究基本分析。
因为基本分析可以较为全面的掌控证劵价格的基本走势,主要适用于周期相对较长的证劵价格预测和相对成熟的证劵市场。
这与多元统计在证劵投资分析中的基本要求相符合。
基本分析,又称之为基本面分析,可细分为宏观经济分析、行业分析和公司分析。
其中公司分析是基础分析的核心,公司分析主要是通过对公司财务报告的分析,从中寻找出影响公司股票价格的公司内在财务情况,作为投资决策的主要依据。
对公司进行的财务分析可以在较大的程度上确定该公司的股票是否具有投资价值,这是投资者做投资分析的主要目的。
然而基础分析中的影响因素大多都是定性分析,存在不少的主观性,所得到的长期分析结果可信度不高,为了寻求理性的长期投资的参考依据,必须采取数据量化分析,从公司股票的基本特征之中发掘出股票的真实投资价值。
这就需要在基础分析之上,对公司财务状况进行多元统计分析。
此外,经济学家马柯维茨的现代投资组合理论是利用一定时期内证劵收益率的数学期望和方差分别衡量其获益能力和风险大小,进行分散性投资。
但是这个理论存在一些限制,如前提是有效市场,需要职业的金融管理人员和现代化的计算设备。
但是很明显中国证劵市场是非有效市场,存在大量的散户和投机者,现代投资组合理论无法有效地在中国的证劵市场得到应用。
相比较而言,多元统计分析在应用时,受到的局限小,操作性强,具有可以推广给广大投资者采用的优越性。
多元统计分析主要有三大分析方法:
聚类分析、判别分析、主成分分析。
其中聚类分析可以基于股票各类基本层面因素的考察,利用建立起来的综合评价指标体系对公司股票的相似程度进行比较分类,这样做可以清晰地了解公司股票的总体特征,区别出各类优劣股票,缩小投资的范围,还可以利用分类的总体价格水平来预估股票价格的波动趋势和时机。
对于不在样本之中的同行业股票可以利用判别分析对其进行归类,得到该股票的大概走势和特征。
最后得到分类出来的判别函数,将类别特征进行量化总结。
2.综合评价指标体系的建立
公司的基础层面上可以分为四大类:
公司的盈利能力、偿债能力、成长能力、资本扩张管理能力。
从这四个方面入手分析公司股票的基本情况,进而依照各股票的特征进行分类。
并针对不同特征的股票采取不同的投资决策。
盈利能力的大小直接影响了股票价值的高低。
净资产利润率反应股东投资报酬的大小,每股收益是测定股票投资价值的重要指标,综合反映公司的获利能力。
总资产利润率=净利润/平均资产总额
每股收益=净利润/期末总股本
偿债能力可以反映出上市公司资产的稳定安全程度。
资产负债率标志着公司的长期偿债能力,相对的,流动比率反映了短期偿债能力。
资产负债率=期末负债总值/期末资产总值
流动比率=期末流动资产/期末流动负债
资本管理能力显示出公司的运行状态和资本的有效利用。
存货周转率和应收账款周转率反映公司的管理资本能力。
存货周转率=销货成本/平均存货余额
应收账款周转率反映公司应收账款周转速度的比率
成长能力可以包含收入增长率、净利润增长率、每股净资产和每股分红送股,反映公司在资本上的扩张能力和重组能力,净利润的大小决定了投资者的回报多少,也会影响到股票的价格波动。
收入增长率=本期业务收入/上期业务收入-1
净利润增长率=本期净利润/上期净利润-1
每股净资产=期末净资产/期末总股本
如上,完成了聚类分析建立在基础层面上的指标体系的建立。
3.聚类分析方法
在诸多现实问题中我们都可以应用到聚类分析。
聚类分析就是根据数据的特征来吧分类对象按照一定的规则分成若干类,最后具有相同或者相似特征的样品会被分到同一类当中去,而不同类的样品之间具有相对较高的差异性。
其中系统聚类法是最为常用的聚类方法,常用的系统聚类方法有最短距离法、最长距离法、中间距离法、类平均法、重心法、离差平方和法、可变法和可变类平均法等。
所有这些方法都有各自所适用的场合和局限。
其中,离差平方和法和类平均法的聚类效果相对较好。
3.1离差平方和法
本文中我们采取离差平方和法进行聚类,它是建立在合并两个聚类时使“信息损失”最小这个思想的基础之上的。
如果分类合理的话,那么同类样品的离差平方和较小,而类间的离差平方和应该较大。
类中各样品到类重心即均值的平方欧氏距离之和称为离差平方和。
设类和合并称为新的类,则、和的离差平方和分别是
它们反映了各自类内样品的分散程度。
如果和这两类相距较近,则合并后所增加的离差平方和应较小;否则,合并后的离差平方和则应该较大。
我们定义和之间的平方距离为。
3.2距离测度的选定
根据所建立的综合体系中的指标特性,采取欧氏距离来描述样品数据之间的相似程度。
欧氏距离:
其中表示第i个样品和第j个样品之间的距离,表示第i个样品的第k个指标,p代表指标的总个数。
3.3数据的标准化
为了避免由于各种指标的量度不同在求距离时所带来误差,这里有必要将指标数据进行标准化处理。
为了保证数据特征不变,选用SPSS软件中的Zscore方法:
其中表示样品i的指标j的值,表示指标j的平均值。
而表示指标j的标准差。
经过上述变换之后。
每个指标的均值为0,方差为1,此时每一个指标都处于同一量度。
4.股票投资的实证分析
根据之前所建立的综合评价指标体系,对所随机抽取的20家出版传媒公司2011年的财务数据进行聚类分析,指标变量的设定如下:
a:
每股收益;b:
净资产收益;c:
资产负债率;d:
流动比率;e:
存货周转率;f:
应收账款周转率;g:
收入增长率;h:
净利润增长率;i:
每股净资产;j:
每股分红送股。
应用SPSS18.0,对20家出版媒体公司的股票进行分类。
分类结果见表案例处理摘要(Table1)和表群集成员(Table2)。
Table1.案例处理摘要
案例
有效
缺失
合计
N
百分比
N
百分比
N
百分比
19
95%
1
5%
20
100.0%
通过案例处理摘要中可以看出:
20家出版传媒公司的财务数据中存在缺失值,证劵代码2400的省广股份在存货周转率这个指标上存在缺失值,无法算出省广股份与其他样品之间的欧氏距离,从而被排除在聚类分析的整个过程中,然而这个缺失值并不影响接下来的判别分析。
在判别分析中,该缺失值将会被该指标的均值所代替,保证协方差矩阵的完整,从而将缺失的证劵代码2400省广股份加入分类的结果之中,反而突显出判别分析在聚类分析结果上的一种完善。
Table2.群集成员
案例
5群集
4群集
3群集
1:
600373
1
1
1
2:
600088
2
2
2
3:
601098
1
1
1
4:
2181
3
3
1
5:
600825
4
4
3
6:
601801
4
4
3
7:
300148
5
3
1
8:
2238
2
2
2
9:
600551
4
4
3
10:
300027
5
3
1
11:
793
1
1
1
12:
300133
5
3
1
13:
300235
1
1
1
14:
600832
2
2
2
15:
917
3
3
1
16:
601999
4
4
3
17:
600880
1
1
1
18:
600386
1
1
1
19:
2292
5
3
1
群集成员表格给出分为3,4,5类的分类结果,为了保证分类的合理,选择4群集的聚类结果:
第一类:
中文传媒600373,中南传媒601098,华闻传媒793,博瑞传播600880,
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 贝叶斯 判别分析 股票投资 分析 中的 应用