引导
欢迎¶
很高兴你来到这里,相信你和我一样,是一个对人工智能技术充满兴趣和热情的爱好者。随着智能时代的到来,我们的日常生活变得充满了智能化。比如你逛淘宝的时候,淘宝的服务端会根据你浏览的商品进行判断你对某种商品的喜好,从而向你推送你可能感兴趣的商品;刷抖音的时候,当你在某一个页面停留的时间过长,抖音都会认为你对这部分内容比较感兴趣,这时他就会向你推送与这部分内容相关的视频。这些背后的算法就是目前热门的智能算法——推荐算法。在这一部分,我将向你介绍人工智能的其中一个领域:机器学习。这门技术是目前人工智能的核心,如果你以后想从事人工智能算法工作,机器学习基本理论知识对于你是必不可少的。如果你对这项技术感兴趣,那么很欢迎你阅读以下的内容,我将会对机器学习的部分知识做出分享并向你分享我的学习方法和心得。
介绍¶
机器学习是目前信息技术中最激动人心的方向之一,在该部分,你将会学习到这门技术的前沿,你也可以自己去实现机器学习的算法。
你或许每天都在不知不觉中使用了机器学习的算法每次,你打开谷歌、百度搜索到你需要的内容,正是因为他们有良好的学习算法。谷歌和百度实现了学习算法来排行网页,这就是机器学习。每次您阅读您的电子邮件垃圾邮件筛选器,可以帮你过滤大量的垃圾邮件这也是一种学习算法。目前在AI行业有一个共同的目标:有一天做出一个和人类一样聪明的机器。所以AI研究者认为:实现这个目标最好的方法是通过让机器试着模仿人的大脑学习
。
到这里你可能会问机器学习到底是什么?维基百科是这样说的:
机器学习是人工智能的一个分支。人工智能的研究历史有着一条从以“推理”为重点,到以“知识”为重点,再到以“学习”为重点的自然、清晰的脉络。显然,机器学习是实现人工智能的一个途径,即以机器学习为手段解决人工智能中的问题。机器学习在近30多年已发展为一门多领域交叉学科,涉及概率论、统计学、逼近论、凸分析、计算复杂性理论等多门学科。机器学习理论主要是设计和分析一些让计算机可以自动“学习”的算法。机器学习算法是一类从数据中自动分析获得规律,并利用规律对未知数据进行预测的算法。因为学习算法中涉及了大量的统计学理论,机器学习与推断统计学联系尤为密切,也被称为统计学习理论。算法设计方面,机器学习理论关注可以实现的,行之有效的学习算法。很多推论问题属于无程序可循难度,所以部分的机器学习研究是开发容易处理的近似算法。
机器学习已广泛应用于数据挖掘、计算机视觉、自然语言处理、生物特征识别、搜索引擎、医学诊断、检测信用卡欺诈、证券市场分析、DNA序列测序、语音和手写识别、战略游戏和机器人等领域。
是不是感觉讲的很复杂?哈哈,那就说说我对此的看法吧:从理性的角度来说,就是要让机器具有和人一样的学习的能力。从数学的角度来说,就是找到一个满足某件事相应的对应关系的函数表达式(比如:对猫狗图片进行分类),这个可能现在还不好理解,在后面我会慢慢的提到。
你将会学到什么¶
在这部分,我将向你分享不同类型的学习算法。目前存在几种不同类型的学习算法。主要的两种类型:监督学习
和无监督学习
。监督学习
是指,我们将教计算机如何去完成任务,而在无监督学习
中,我们打算让它自己进行学习。对这两个术语我后面会分别介绍。同时你还可以学到这两个分支代表下的算法:梯度下降,线性回归, 聚类,决策树, SVM…
推荐的学习资源¶
我认为学习机器学习的理论,你不可不看的就是吴恩达教授的视频:传送门
本部分的分享也是基于Andrew Ng 教授的教学的流程的,有空的时候一定要好好看看,他的教学风格会让你觉得沐浴春风。
在实践部分,我个人觉得比较适合用python
去做这些事情,因为你以后做的任何关于AI的事情,都会用到这门语言(等什么还不去学习python吗[狗头])。但是Andrew认为,使用matlab
更加的高效,因为他的语法简单,可以大大提升你的学习效率。但是我个人认为你既可以借此机会熟悉python,提高你对python的理解,和对一些库的使用,又能够学习机器学习的知识,这不是一件很香的事情吗?
需要的知识储备¶
这里需要重点提到学习机器学习算法需要用到的知识储备:
- 微积分
- 线性代数
- 概率论
- python
- numpy
我相信,你看到这里,你可能没有学完这些课程。但是这些课程又是必不可少的,因为机器学习是建立在数学之上的一门技术。所以学好它,你数学必须要学好~如果没有学,我的建议是边学机器学习边学数学,不知道的数学知识可以去百度查一查,建议多去逛逛Blog。
本页面的全部内容在 CC BY-SA 4.0 协议之条款下提供。