机器学习和深度学习技能树、面试宝典_光环大数据培训

来源:互联网 由 光环IT学院 贡献 责任编辑:李志  
http://hadoop.aura-el.com

机器学习和深度学习技能树、面试宝典_光环大数据培训

人工智能的浪潮正在席卷全球,诸多词汇时刻萦绕在我们耳边:人工智能(Artificial Intelligence)、机器学习(Machine Learning)、深度学习(Deep Learning)。

为了帮助大家更好帮助大家学习这些新技术,小遍整理了相关的学习资料,希望这些资料对刚入门的同行有所帮助。

一、人工智能、机器学习和深度学习的区别?

机器学习:一种实现人工智能的方法

机器学习最基本的做法,是使用算法来解析数据、从中学习,然后对真实世界中的事件做出决策和预测。与传统的为解决特定任务、硬编码的软件程序不同,机器学习是用大量的数据来“训练”,通过各种算法从数据中学习如何完成任务。

举个简单的例子,当我们浏览网上商城时,经常会出现商品推荐的信息。这是商城根据你往期的购物记录和冗长的收藏清单,识别出这其中哪些是你真正感兴趣,并且愿意购买的产品。这样的决策模型,可以帮助商城为客户提供建议并鼓励产品消费。

机器学习直接来源于早期的人工智能领域,传统的算法包括决策树、聚类、贝叶斯分类、支持向量机、EM、Adaboost等等。从学习方法上来分,机器学习算法可以分为监督学习(如分类问题)、无监督学习(如聚类问题)、半监督学习、集成学习、深度学习和强化学习。

传统的机器学习算法在指纹识别、基于Haar的人脸检测、基于HoG特征的

http://hadoop.aura-el.com

物体检测等领域的应用基本达到了商业化的要求或者特定场景的商业化水平,但每前进一步都异常艰难,直到深度学习算法的出现。

深度学习:一种实现机器学习的技术

深度学习本来并不是一种独立的学习方法,其本身也会用到有监督和无监督的学习方法来训练深度神经网络。但由于近几年该领域发展迅猛,一些特有的学习手段相继被提出(如残差网络),因此越来越多的人将其单独看作一种学习的方法。

最初的深度学习是利用深度神经网络来解决特征表达的一种学习过程。深度神经网络本身并不是一个全新的概念,可大致理解为包含多个隐含层的神经网络结构。为了提高深层神经网络的训练效果,人们对神经元的连接方法和激活函数等方面做出相应的调整。其实有不少想法早年间也曾有过,但由于当时训练数据量不足、计算能力落后,因此最终的效果不尽如人意。

深度学习摧枯拉朽般地实现了各种任务,使得似乎所有的机器辅助功能都变为可能。无人驾驶汽车,预防性医疗保健,甚至是更好的电影推荐,都近在眼前,或者即将实现。

三者的区别和联系

机器学习是一种实现人工智能的方法,深度学习是一种实现机器学习的技术。我们就用最简单的方法——同心圆,可视化地展现出它们三者的关系。

人工智能、机器学习、深度学习三者关系示意图

二、机器学习路线图

http://hadoop.aura-el.com

1)机器学习预备知识:

了解 Python Numpy 模块:Python Numpy Tutorial

学习相关数学基础知识:

了解概率论里的条件概率和贝叶斯定理:贝叶斯推断及其互联网应用(一):定理简介;

了解线性代数中向量、矩阵的基本运算;

了解导数和偏导数运算:微积分求导数的链式法则。

2)机器学习算法工程师技能图

三、深度学习学习技能树

深度学习预备知识:

Deep Learning | Coursera的 1-3 门课偏理论

翻阅《机器学习》(周志华著)前 2 章,了解机器学习的基本概念;翻阅《数学之美》 (吴军著) 第 2-5 章,了解自然语言处理的重要概念;

深度学习技能图

四、机器学习算法工程师面试问题

你在研究/项目/实习经历中主要用过哪些机器学习/数据挖掘的算法?

你熟悉的机器学习/数据挖掘算法主要有哪些?

你用过哪些机器学习/数据挖掘工具或框架?

基础知识

无监督和有监督算法的区别?

SVM 的推导,特性?多分类怎么处理?

http://hadoop.aura-el.com

LR 的推导,特性?

决策树的特性?

SVM、LR、决策树的对比?

GBDT 和决策森林的区别?

如何判断函数凸或非凸?

解释对偶的概念。

如何进行特征选择?

为什么会产生过拟合,有哪些方法可以预防或克服过拟合?

介绍卷积神经网络,和 DBN 有什么区别?

采用 EM 算法求解的模型有哪些,为什么不用牛顿法或梯度下降法?

用 EM 算法推导解释 Kmeans。

用过哪些聚类算法,解释密度聚类算法。

聚类算法中的距离度量有哪些?

如何进行实体识别?

解释贝叶斯公式和朴素贝叶斯分类。

开放问题

给你公司内部群组的聊天记录,怎样区分出主管和员工?

如何评估网站内容的真实性(针对代刷、作弊类)?

深度学习在推荐系统上可能有怎样的发挥?

路段平均车速反映了路况,在道路上布控采集车辆速度,如何对路况做出合理估计?采集数据中的异常值如何处理?

如何根据语料计算两个词词义的相似度?

在百度贴吧里发布 APP 广告,问推荐策略?

如何判断自己实现的 LR、Kmeans 算法是否正确?

答题思路

http://hadoop.aura-el.com

用过什么算法?

最好是在项目/实习的大数据场景里用过,比如推荐里用过 CF、LR,分类里用过 SVM、GBDT;

一般用法是什么,是不是自己实现的,有什么比较知名的实现,使用过程中踩过哪些坑;

优缺点分析。

熟悉的算法有哪些?

基础算法要多说,其它算法要挑熟悉程度高的说,不光列举算法,也适当说说应用场合;

面试官和你的研究方向可能不匹配,不过在基础算法上你们还是有很多共同语言的,你说得太高大上可能效果并不好,一方面面试官还是要问基础的,另一方面一旦面试官突发奇想让你给他讲解高大上的内容,而你只是泛泛的了解,那就傻叉了。

用过哪些框架/算法包?

主流的分布式框架如 Hadoop,Spark,Graphlab,Parameter Server 等择一或多使用了解;

通用算法包,如 mahout,scikit,weka 等;

专用算法包,如 opencv,theano,torch7,ICTCLAS 等。

基础知识

个人感觉高频话题是 SVM、LR、决策树(决策森林)和聚类算法,要重点准备;

算法要从以下几个方面来掌握

产生背景,适用场合(数据规模,特征维度,是否有 Online 算法,离散/连续特征处理等角度);

原理推导(最大间隔,软间隔,对偶);

求解方法(随机梯度下降、拟牛顿法等优化算法);

优缺点,相关改进;

和其他基本方法的对比;

以下内容为系统自动转化的文字版,可能排版等有问题,仅供您参考:

光环大数据--大数据培训&人工智能培训 http://hadoop.aura-el.com 机器学习和深度学习技能树、面试宝典_光环大数据培训

人工智能的浪潮正在席卷全球,诸多词汇时刻萦绕在我们耳边:人工智能 (Artificial Intelligence) 、机器学习 (Machine Learning) 、深度学习 (Deep Learning)。

为了帮助大家更好帮助大家学习这些新技术,小遍整理了相关的学习资料, 希望这些资料对刚入门的同行有所帮助。

一、人工智能、机器学习和深度学习的区别?

机器学习:一种实现人工智能的方法

机器学习最基本的做法,是使用算法来解析数据、从中学习,然后对真实世 界中的事件做出决策和预测。

与传统的为解决特定任务、 硬编码的软件程序不同, 机器学习是用大量的数据来 “训练” , 通过各种算法从数据中学习如何完成任务。

举个简单的例子,当我们浏览网上商城时,经常会出现商品推荐的信息。

这 是商城根据你往期的购物记录和冗长的收藏清单, 识别出这其中哪些是你真正感 兴趣,并且愿意购买的产品。

这样的决策模型,可以帮助商城为客户提供建议并 鼓励产品消费。

机器学习直接来源于早期的人工智能领域,传统的算法包括决策树、聚类、 贝叶斯分类、支持向量机、EM、Adaboost 等等。

从学习方法上来分,机器学习 算法可以分为监督学习(如分类问题)、无监督学习(如聚类问题)、半监督学习、 集成学习、深度学习和强化学习。

传统的机器学习算法在指纹识别、基于 Haar 的人脸检测、基于 HoG 特征的

光环大数据 http://hadoop.aura-el.com

光环大数据--大数据培训&人工智能培训 http://hadoop.aura-el.com 物体检测等领域的应用基本达到了商业化的要求或者特定场景的商业化水平, 但 每前进一步都异常艰难,直到深度学习算法的出现。

深度学习:一种实现机器学习的技术

深度学习本来并不是一种独立的学习方法, 其本身也会用到有监督和无监督 的学习方法来训练深度神经网络。

但由于近几年该领域发展迅猛,一些特有的学 习手段相继被提出(如残差网络), 因此越来越多的人将其单独看作一种学习的方 法。

最初的深度学习是利用深度神经网络来解决特征表达的一种学习过程。

深度 神经网络本身并不是一个全新的概念, 可大致理解为包含多个隐含层的神经网络 结构。

为了提高深层神经网络的训练效果,人们对神经元的连接方法和激活函数 等方面做出相应的调整。

其实有不少想法早年间也曾有过,但由于当时训练数据 量不足、计算能力落后,因此最终的效果不尽如人意。

深度学习摧枯拉朽般地实现了各种任务, 使得似乎所有的机器辅助功能都变 为可能。

无人驾驶汽车, 预防性医疗保健, 甚至是更好的电影推荐, 都近在眼前, 或者即将实现。

三者的区别和联系

机器学习是一种实现人工智能的方法, 深度学习是一种实现机器学习的技术。

我们就用最简单的方法——同心圆,可视化地展现出它们三者的关系。

人工智能、机器学习、深度学习三者关系示意图 二、机器学习路线图

光环大数据 http://hadoop.aura-el.com

光环大数据--大数据培训&人工智能培训 http://hadoop.aura-el.com 1)机器学习预备知识:

了解 Python Numpy 模块:Python Numpy Tutorial 学习相关数学基础知识: 了解概率论里的条件概率和贝叶斯定理: 贝叶斯推断及其互联网应 用(一) :定理简介; 了解线性代数中向量、矩阵的基本运算; 了解导数和偏导数运算:微积分求导数的链式法则。

2)机器学习算法工程师技能图

三、深度学习学习技能树

深度学习预备知识:

Deep Learning | Coursera 的 1-3 门课偏理论 翻阅《机器学习》 (周志华 著)前 2 章,了解机器学习的基本概念; 翻阅《数学之美》 (吴军 著) 第 2-5 章,了解自然语言处理的重要概念;

深度学习技能图 四、机器学习算法工程师面试问题

你在研究/项目/实习经历中主要用过哪些机器学习/数据挖掘的算法? 你熟悉的机器学习/数据挖掘算法主要有哪些? 你用过哪些机器学习/数据挖掘工具或框架? 基础知识 无监督和有监督算法的区别? SVM 的推导,特性?多分类怎么处理?

光环大数据 http://hadoop.aura-el.com

光环大数据--大数据培训&人工智能培训 http://hadoop.aura-el.com LR 的推导,特性? 决策树的特性? SVM、LR、决策树的对比? GBDT 和 决策森林 的区别? 如何判断函数凸或非凸? 解释对偶的概念。

如何进行特征选择? 为什么会产生过拟合,有哪些方法可以预防或克服过拟合? 介绍卷积神经网络,和 DBN 有什么区别? 采用 EM 算法求解的模型有哪些,为什么不用牛顿法或梯度下降 法? 用 EM 算法推导解释 Kmeans。

用过哪些聚类算法,解释密度聚类算法。

聚类算法中的距离度量有哪些? 如何进行实体识别? 解释贝叶斯公式和朴素贝叶斯分类。

开放问题 给你公司内部群组的聊天记录,怎样区分出主管和员工? 如何评估网站内容的真实性(针对代刷、作弊类)? 深度学习在推荐系统上可能有怎样的发挥? 路段平均车速反映了路况,在道路上布控采集车辆速度,如何对路 况做出合理估计?采集数据中的异常值如何处理? 如何根据语料计算两个词词义的相似度? 在百度贴吧里发布 APP 广告,问推荐策略? 如何判断自己实现的 LR、Kmeans 算法是否正确?

答题思路

光环大数据 http://hadoop.aura-el.com

光环大数据--大数据培训&人工智能培训 http://hadoop.aura-el.com 用过什么算法? 最好是在项目/实习的大数据场景 里用过,比如推荐里用过 CF、 LR,分类里用过 SVM、GBDT; 一般用法是什么,是不是自己实现的,有什么比较知名的实现,使 用过程中踩过哪些坑 ; 优缺点分析。

熟悉的算法有哪些? 基础算法要多说,其它算法要挑熟悉程度高的说,不光列举算法, 也适当说说应用场合; 面试官和你的研究方向可能不匹配, 不过在基础算法上你们还是有 很多共同语言的,你说得太高大上可能效果并不好,一方面面试官还是要问基础 的,另一方面一旦面试官突发奇想让你给他讲解高大上的内容,而你只是泛泛的 了解,那就傻叉了。

用过哪些框架/算法包? 主流的分布式框架如 Hadoop, Spark, Graphlab, Parameter Server 等择一或多使用了解; 通用算法包,如 mahout,scikit,weka 等; 专用算法包,如 opencv,theano,torch7,ICTCLAS 等。

基础知识 个人感觉高频话题是 SVM、LR、决策树(决策森林)和聚类算法, 要重点准备; 算法要从以下几个方面来掌握 产生背景, 适用场合 (数据规模, 特征维度, 是否有 Online 算 法,离散/连续特征处理等角度) ; 原理推导(最大间隔,软间隔,对偶) ; 求解方法(随机梯度下降、拟牛顿法等优化算法) ; 优缺点,相关改进; 和其他基本方法的对比;

光环大数据 http://hadoop.aura-el.com

光环大数据--大数据培训&人工智能培训 http://hadoop.aura-el.com 不能停留在能看懂的程度,还要 对知识进行结构化整理,比如撰写自己的 cheet sheet,我觉 得面试是在有限时间内向面试官输出自己知识的过程 ,如果仅仅是在面试现场 才开始调动知识、组织表达,总还是不如系统的梳理准备; 从面试官的角度多问自己一些问题, 通过查找资料总结出全面 的解答,比如如何预防或克服过拟合。

开放问题 由于问题具有综合性和开放性,所以不仅仅考察对算法的了解,还 需要足够的实战经验作基础; 先不要考虑完善性或可实现性, 调动你的一切知识储备和经验储备 去设计,有多少说多少,想到什么说什么,方案都是在你和面试官讨论的过程里 逐步完善的,不过面试官有两种风格:引导你思考考虑不周之处 or 指责你没有 考虑到某些情况,遇到后者的话还请注意 灵活调整答题策略 ;

和同学朋友开展讨论,可以从上一节列出的问题开始。

准备建议

基础算法复习两条线 材料阅读包括经典教材 (比如 PRML, 模式分类) 、 网上系列博客 (比 如 研究者 July) ,系统梳理基础算法知识; 面试反馈面试过程中会让你发现自己的薄弱环节和知识盲区, 把这 些问题记录下来,在下一次面试前搞懂搞透 。

除算法知识,还应适当掌握一些系统架构方面的知识,可以从网上分享 的阿里、京东、新浪微博等的架构介绍 PPT 入手,也可以从 Hadoop、Spark 等 的设计实现切入。

如果真的是以就业为导向就要在平时注意实战经验的积累, 在科研项目、 实习、比赛(Kaggle,Netflix,天猫大数据竞赛等)中摸清算法特性、熟悉相

光环大数据 http://hadoop.aura-el.com

光环大数据--大数据培训&人工智能培训 http://hadoop.aura-el.com 关工具与模块的使用。

五、学习建议:

机器学习和深度学习有一定的学习难度,要想在竞争中脱颖而出,就必须做 到

保持学习热情,关心热点; 深入学习,会用,也要理解; 在实战中历练总结; 积极参加学术界、业界的讲座分享,向牛人学习,与他人讨论。

为什么大家选择光环大数据!

大数据培训、 人工智能培训、 Python 培训、 大数据培训机构、 大数据培训班、 数据分析培训、大数据可视化培训,就选光环大数据!光环大数据,聘请大数据 领域具有多年经验的讲师,提高教学的整体质量与教学水准。

讲师团及时掌握时 代的技术,将时新的技能融入教学中,让学生所学知识顺应时代所需。

通过深入 浅出、通俗易懂的教学方式,指导学生较快的掌握技能知识,帮助莘莘学子实现 就业梦想。

光环大数据启动了推进人工智能人才发展的“AI 智客计划” 。

光环大数据专注国内 大数据和人工智能培训,将在人工智能和大数据领域深度合作。

未来三年,光环大数据 将联合国内百所大学,通过“AI 智客计划” ,共同推动人工智能产业人才生态建设,培 养和认证 5-10 万名 AI 大数据领域的人才。

光环大数据 http://hadoop.aura-el.com

光环大数据--大数据培训&人工智能培训 http://hadoop.aura-el.com 参加“AI 智客计划” ,享 2000 元助学金!

【报名方式、详情咨询】 光环大数据网站报名:http://hadoop.aura-el.com 手机报名链接:http:// hadoop.aura-el.com /mobile/

光环大数据 http://hadoop.aura-el.com


  • 与《机器学习和深度学习技能树、面试宝典_光环大数据培训》相关:
  • 机器学习和深度学习技能树、面试宝典_深圳光环大数据
  • 深度学习技巧指南_光环大数据培训
  • 深度学习能力的拓展_光环大数据培训
  • 深度学习和机器学习是什么关系_光环大数据培训机构
  • 机器学习的子类–深度学习_光环大数据培训机构
  • 机器学习算法应用中常用技巧_北京光环大数据培训
  • 人工智能,机器学习和深度学习之间的差异是什么_光环
  • 机器学习和深度学习之间的差异是什么_光环大数据人工
  • 除了深度学习,机器翻译还需要啥_光环大数据培训
  • 人工智能、机器学习和深度学习的区别和联系_光环大数
  • 本站网站首页首页教育资格全部考试考试首页首页考试首页职业资格考试最近更新儿童教育综合综合文库22文库2建筑专业资料考试首页范文大全公务员考试首页英语首页首页教案模拟考考试pclist学路首页日记语文古诗赏析教育教育资讯1高考资讯教育头条幼教育儿知识库教育职场育儿留学教育高考公务员考研考试教育资讯1问答教育索引资讯综合学习网站地图学习考试学习方法首页14托福知道备考心经冲刺宝典机经真题名师点睛托福课程雅思GREGMATSAT留学首页首页作文
    免责声明 - 关于我们 - 联系我们 - 广告联系 - 友情链接 - 帮助中心 - 频道导航
    Copyright © 2017 www.xue63.com All Rights Reserved