欢迎来到冰豆网! | 帮助中心 分享价值,成长自我!
冰豆网
全部分类
  • IT计算机>
  • 经管营销>
  • 医药卫生>
  • 自然科学>
  • 农林牧渔>
  • 人文社科>
  • 工程科技>
  • PPT模板>
  • 求职职场>
  • 解决方案>
  • 总结汇报>
  • 党团工作>
  • ImageVerifierCode 换一换
    首页 冰豆网 > 资源分类 > DOCX文档下载
    分享到微信 分享到微博 分享到QQ空间

    含答案机器学习第一阶段练习题.docx

    • 资源ID:1643143       资源大小:53.39KB        全文页数:4页
    • 资源格式: DOCX        下载积分:15金币
    快捷下载 游客一键下载
    账号登录下载
    微信登录下载
    三方登录下载: 微信开放平台登录 QQ登录
    二维码
    微信扫一扫登录
    下载资源需要15金币
    邮箱/手机:
    温馨提示:
    快捷下载时,用户名和密码都是您填写的邮箱或者手机号,方便查询和重复下载(系统自动生成)。
    如填写123,账号就是123,密码也是123。
    支付方式: 支付宝    微信支付   
    验证码:   换一换

    加入VIP,免费下载
     
    账号:
    密码:
    验证码:   换一换
      忘记密码?
        
    友情提示
    2、PDF文件下载后,可能会被浏览器默认打开,此种情况可以点击浏览器菜单,保存网页到桌面,就可以正常下载了。
    3、本站不支持迅雷下载,请使用电脑自带的IE浏览器,或者360浏览器、谷歌浏览器下载即可。
    4、本站资源下载后的文档和图纸-无水印,预览文档经过压缩,下载后原文更清晰。
    5、试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓。

    含答案机器学习第一阶段练习题.docx

    1、机器学习第一阶段练习题一、 选择题1. 以下三阶泰勒展开式错误的一项是(B)A. B. C. D. 分析:2. 以下不属于凸函数一项的是(D)A. y=-log x B. y=x log x C. y=|x|p D. y=eax 分析:a应该限定取值范围:a1或a03. 以下说法错误的一项是(C)A. 负梯度方向是使函数值下降最快的方向B. 当目标函数是凸函数时,梯度下降法的解是全局最优解C. 梯度下降法比牛顿法收敛速度快D. 拟牛顿法不需要计算Hesse矩阵分析:牛顿法需要二阶求导,梯度下降法只需一阶,因此牛顿法比梯度下降法更快收敛4. 一般,k-NN最近邻方法在(B)的情况下效果较好A.

    2、样本较多但典型性不好 B. 样本较少但典型性好C. 样本呈团状分布 D. 样本呈链状分布分析:k近邻算法对较多且典型不好的,团状,链状的样本不具有太大的优势5. 机器学习中L1正则化和L2正则化的区别是?(A)A. 使用L1可以得到稀疏的权值,使用L2可以得到平滑的权值B. 使用L1可以得到平滑的权值,使用L2可以得到平滑的权值C使用L1可以得到平滑的权值,使用L2可以得到稀疏的权值D.使用L1可以得到稀疏的权值,使用L2可以得到稀疏的权值分析:L1正则化偏向于稀疏,它会自动进行特征选择,去掉一些没用的特征,也就是将这些特征对应的权重置为0。L2主要功能是为了防止过拟合,当要求参数越小时,说明

    3、模型越简单,而模型越简单则,越趋向于平滑,从而防止过拟合。二、 公式推理题1. 请写出通过条件概率公式和全概率公式推出贝叶斯公式的过程分析:条件概率:全概率:贝叶斯公式:2. 请写出正态分布的概率密度函数、期望、以及方差分析:概率密度函数:;期望:;方差:三、 简答题1. 求函数的最小值分析:令两边取对数:两边对t求导:令t=0:,则即为f(x)最小值。2. 欠拟合和过拟合的原因分别有哪些?如何避免?分析:欠拟合的原因:模型复杂度过低,不能很好的拟合所有的数据,训练误差大; 避免欠拟合:增加模型复杂度,如采用高阶模型(预测)或者引入更多特征(分类)等。 过拟合的原因:模型复杂度过高,训练数据过

    4、少,训练误差小,测试误差大; 避免过拟合:降低模型复杂度,如加上正则惩罚项,如L1,L2,增加训练数据等。3. 列举聚类算法有哪些相似性度量准则及公式(至少四个)分析:曼哈顿距离:;欧氏距离:;Jaccard系数:;余弦相似度:;皮尔森系数:;相对熵(K-L距离):4. 若要对以下图案进行聚类分析需要采用哪种聚类方法,简述理由和该方法步骤分析:该图案为非凸状的,因此不能使用基于距离的聚类算法(k-means、k-medoids等),可选择密度聚类(DBSCAN等)、网格聚类(STING)等非距离的方法。5. 简述UserCF和ItemCF算法的相同点与不同点分析:项目UserCFItemCF性

    5、能适用于用户较少的场合,如果用户过多,计算用户相似度矩阵的代价交大适用于物品数明显小于用户数的场合,如果物品很多,计算物品相似度矩阵的代价交大领域实效性要求高,用户个性化兴趣要求不高长尾物品丰富,用户个性化需求强烈实时性用户有新行为,不一定需要推荐结果立即变化用户有新行为,一定会导致推荐结果的实时变化冷启动在新用户对少的物品产生行为后,不能立即对他进行个性化推荐,因为用户相似度是离线计算的新物品上线后一段时间,一旦有用户对物品产生行为,就可以将新物品推荐给其他用户新用户只要对一个物品产生行为,就能推荐相关物品给他,但无法在不离线更新物品相似度表的情况下将新物品推荐给用户推荐理由很难提供可以根据用户历史行为归纳推荐理由


    注意事项

    本文(含答案机器学习第一阶段练习题.docx)为本站会员主动上传,冰豆网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知冰豆网(点击联系客服),我们立即给予删除!

    温馨提示:如果因为网速或其他原因下载失败请重新下载,重复下载不扣分。




    关于我们 - 网站声明 - 网站地图 - 资源地图 - 友情链接 - 网站客服 - 联系我们

    copyright@ 2008-2022 冰点文档网站版权所有

    经营许可证编号:鄂ICP备2022015515号-1

    收起
    展开