欢迎来到冰豆网! | 帮助中心 分享价值,成长自我!
冰豆网
全部分类
  • IT计算机>
  • 经管营销>
  • 医药卫生>
  • 自然科学>
  • 农林牧渔>
  • 人文社科>
  • 工程科技>
  • PPT模板>
  • 求职职场>
  • 解决方案>
  • 总结汇报>
  • 党团工作>
  • ImageVerifierCode 换一换
    首页 冰豆网 > 资源分类 > DOCX文档下载
    分享到微信 分享到微博 分享到QQ空间

    从理论到应用浅谈lasso模型Word文件下载.docx

    • 资源ID:20246993       资源大小:284.71KB        全文页数:12页
    • 资源格式: DOCX        下载积分:12金币
    快捷下载 游客一键下载
    账号登录下载
    微信登录下载
    三方登录下载: 微信开放平台登录 QQ登录
    二维码
    微信扫一扫登录
    下载资源需要12金币
    邮箱/手机:
    温馨提示:
    快捷下载时,用户名和密码都是您填写的邮箱或者手机号,方便查询和重复下载(系统自动生成)。
    如填写123,账号就是123,密码也是123。
    支付方式: 支付宝    微信支付   
    验证码:   换一换

    加入VIP,免费下载
     
    账号:
    密码:
    验证码:   换一换
      忘记密码?
        
    友情提示
    2、PDF文件下载后,可能会被浏览器默认打开,此种情况可以点击浏览器菜单,保存网页到桌面,就可以正常下载了。
    3、本站不支持迅雷下载,请使用电脑自带的IE浏览器,或者360浏览器、谷歌浏览器下载即可。
    4、本站资源下载后的文档和图纸-无水印,预览文档经过压缩,下载后原文更清晰。
    5、试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓。

    从理论到应用浅谈lasso模型Word文件下载.docx

    1、读音:lsu: 而不是lsoRobert Tibshirani 简介:生于1956年7月10日,担任斯坦福大学the Departments of Statistics and Health Research and Policy的教授。1985-1998年担任多伦多大学的教授。 他主要研究方向是致力于开发处理复杂数据的分析统计工具。Lasso模式是他最著名的贡献。同时在著名的 Generalized Additive Models, An Introduction to the Bootstrap, and The Elements of Statistical Learning三本书中都有

    2、他的编著。12、起源与原理在常规的回归分析中,假设我们有一组(xi,yi),i=1,2,.,N,其中xi=(xi1,.,xip)T,yi是第i维观测值的回归量的数据。普通最小二乘(OLS)通过最小化残差平方和来进行估计。它对数据的分析不那么令人满意通常有两个原因。一是预测精度:OLS往往偏差较低但方差大;预测精度有时可以用缩小或设置一些系数为0的方法来提高。通过这样做,我们牺牲一点偏差减少预测的方差值,因此可以提高整体预测准确性。第二个原因是可解释性的问题。在大量的预测值中,我们通常想确定一个展现出最强影响的更小的子集。 两个公认优秀的改善OLS估计的方法是子集选择(subset select

    3、ion)和岭回归(ridge regression)它们都有缺点。子集选择提供了可解释的模型但是可变性非常强,因为它是一个离散的过程回归量要么保留要么从模型中去掉。小的数据变化就会使得模型的选择改变,这会降低预测准确度。岭回归是连续缩小参数的过程,因此更稳定:然而它不会使得任何参数为0,没办法得出简单的可解释的模型。lasso模型就此提出,The least absolute shrinkage and selection operator,同时缩小(shrinkage)和设置成参数为0(selection),保持了子集选择和岭回归的良好特征。23、模型的思想lasso是在回归系数的绝对值之和

    4、小于一个常数的约束条件下,使残差平方和最小化,从而能够产生某些严格等于0的回归系数,得到解释力较强的模型。给出一组测量数据x1, x2 .xp以及测量结果y,lasso符合线性模型yhat=b0 + b1x1+ b2x2 + . bpxp 它所使用的标准是:当| bj |cement - data.frame(X1 = c(7, 1, 11, 11, 7, 11, 3, 1, 2, 21, 1, 11, 10), X2 = c(26,29, 56, 31, 52, 55, 71, 31, 54, 47, 40, 66, 68), X3 = c(6, 15, 8, 8, 6,9, 17, 22,

    5、 18, 4, 23, 9, 8), X4 = c(60, 52, 20, 47, 33, 22, 6, 44, 22, 26,34, 12, 12), Y = c(78.5, 74.3, 104.3, 87.6, 95.9, 109.2, 102.7, 72.5, 93.1,115.9, 83.8, 113.3, 109.4)cementlm.solsummary(lm.sol)可以看到虽然R2接近于1,拟合优度较理想,但是自变量的p值均大于0.05,回归系数没有通过显著性检验。利用简单线性回归得到回归方程中的X与Y的关系不明显。F检验的值也非常大,说明自变量的显著性较低,需要进行变量选择。

    6、利用car包中的vif()函数查看各自变量间的共线情况library(car)vif(lm.sol)从结果看,各自变量的VIF值都超过10,存在多重共线性,其中,X2与X4的VIF值均超过200。plot(X2 X4, col = red, data = cement)图中可以明显看出X2与X4存在线性关系。3、利用lasso求解此时我们尝试用lars-lasso来求解这个方程。library(lars)x = as.matrix(cement, 1:4)y = as.matrix(cement, 5)(laa = lars(x, y, type = lar)可以看到lasso的变量选择依次是

    7、X4,X1,X2,X3。plot(laa)可以看出各变量的系数的变化过程。summary(laa)其中Cp(衡量多重共线性,其值越小越好)可以看到在第3步以后cp值明显变小。说明lasso模型在实际应用中能够解决多重共线性的问题,有良好的应用。7、应用与研究现状我们在知网中对lasso进行中文数据库的搜索,结果见下图:可以看到该模型在计算机、医学、经济等各个领域均有应用。见微知著的可以下结论其运用十分广泛。在应用和拓展方面的研究也十分丰富。下表中列出了部分内容。这些研究在数学层面考察了lasso产生最小预测误差模型的能力,并重新获得了真正的底层(稀疏)模型。重要的贡献者包括Bickel, Bu

    8、hlmann, Candes, Donoho, Johnstone, Meinshausen,van de Geer, Wainwright and Yu.也证明了lasso可以揭示更多的传统技术,给向前逐步选择方法带来了新的理解。另一个例子是graphical lasso拟合的稀疏高斯图,将其应用于逆协方差矩阵,提供了一个强有利的图选择方法(确定哪些边缘)。9随着计算机处理速度的不断提高和当今社会对于大数据处理的要求的不断进步,对lasso的研究必当更加深入,在各个领域的拓展也是值得期待的。8、参考资料1 Wikipedia. Robert TibshiraniDB/OL. .2 Tibsh

    9、irani,R.Regression Shrinkage and Selection Via the LassoJJournal of the Royal Statical Society.Series B.58,267-2883Stanford University. A simple explanation of the Lasso and Least Angle RegressionDB/OL. .4杨灿. 统计学习那些事DB/OL. learning/#more-4532.5 Efron B, Hastie T, Johnstone I and Tibshirani R. Least

    10、angle regression J. Ann. Stat., 2004, 32:409-499.6梁斌,陈敏,缪柏其,黄意球,陈钊. 基于LARS-Lasso的指数跟踪及其在股指期货套利策略中的应用J. 数理统计与管理,2011,06:1104-1113.7月之十三. LASSODB/OL. 46dfe.html, 2011-04-078薛毅, 陈立萍. 统计建模与R软件M. 北京:清华大学出版社, 2007. 279-2809 Robert, Tibshirani. Regression Shrinkage and Selection Via the Lasso:a retrospectiveJ. Royal Statistical Society, 2011, (73): 273-282


    注意事项

    本文(从理论到应用浅谈lasso模型Word文件下载.docx)为本站会员主动上传,冰豆网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知冰豆网(点击联系客服),我们立即给予删除!

    温馨提示:如果因为网速或其他原因下载失败请重新下载,重复下载不扣分。




    关于我们 - 网站声明 - 网站地图 - 资源地图 - 友情链接 - 网站客服 - 联系我们

    copyright@ 2008-2022 冰点文档网站版权所有

    经营许可证编号:鄂ICP备2022015515号-1

    收起
    展开