courses_ML17_2

http://speech.ee.ntu.edu.tw/~tlkagk/courses_ML17_2.html

概览

机器学习(Machine Learning)方案的分类:

  1. 监督学习(Supervised Learing)
  2. 半监督学习(Semi-supervised Learing)
  3. 非监督学习(Unsupervised Learing)
  4. 迁移学习(TransferLearning)
  5. 强化学习(reinforcement learning)

监督学习

监督学习需要大量的训练数据(Training Data),且训练数据数据需要带有label,也就是已知数据的分类,在一前提的训练出模型,这也是监督的含义。
label是分类,输入输出数据的类别,而另一个概念是feature则是特征(比如你通过一些特征黄色,圆,得出是月亮)。如果你训练出feature和label的关系,之后你可以通过feature得出label。

其他学习的场景

监督学习需要大量带有label的训练数据,如果数据量不够怎么办。
半监督学习(Semi-supervised Learing)针对的是数据不完全Label的场景。
迁移学习(TransferLearning)是指将其他类型Lable数据用来做训练。比如说你要对图片的猫和狗做分类,但猫和狗的图片数据不足,你把一些老虎,狮子等等一些不相干的数据也拿来训练,因为这些数据我们可以告诉机器它们不是猫和狗。
非监督学习(Unsupervised Learing),是我们给一大堆数据让机器去学,但能学成什么是未知,比如说给很多图片数据,它可能能学会对图片按某种特征做分类,也有可能学会创造出新的图片。你给一群黑色和白色的猫狗图片,它可能分出的是猫和狗,也能分出的是黑与白,还有可能是什么四条腿带有毛的什么东西。
最后强化学习(reinforcement learning),我们可以用监督学习来做个对比。
监督学习会告诉机器什么是正确答题的,而强化学习只会有一个分数,评价它做得好还是不好,但它可能不知道为什么不好,让它慢慢的学会正确的。
就好像玩游戏,监督学习是有人在旁边教你怎么操作,哪里不能去,而强化学习是你自己去摸索着玩,失败的次数多了自然就有会了。
最后,具体的方案是要通过场景去区分的,比如强化学习是没法做监督学习,没有Lable数据的前提下的方案,不能说哪个一定是最好的,有人教你还非得去自学这就没必要了。

回归(Regression)、分类(Classification)和结构化学习(Structured Learing)

回归是目的是输出一个数值,比如做一个气象预报,预测PM2.5,通过历史数据输出下一个时间的PM2.5的值。
分类的目的是输出给定数据的类型,通常包含二元分类(Binary Classification)和多分类(Mult-class Classification)。
二元分类,比如一封邮件是不是垃圾邮件:是/否。
多分类,比如判断一篇新闻属于娱乐/体育/政治等中哪一类。
结构化学习是为了得到一个有结构的东西,比如从一段语音转化为文字,完成一段翻译,从一张图片中找出人脸等等。

模型(Model)

机器学习用到的方法通常称为模型(Model),包括线性模型(Linear Model)和非线性模型(Non-linear Model)。
非线性模型中最近几年大热的是深度学习(Deep Learing),而在过去也有SVM,decision tree,K-NN等等
Alpha Go可以认为是解决在一个19x19的棋盘中选择下一步的分类问题。

Regression (回归)

输出数值
股票
无人车:in 红外或视频 out 方向盘角度
推荐系统:客户买商品的可能性。

Gradient Desent(梯度下降)

θ'=min L(θ) L:loss function θ:parameters
root mean square(均方根)

Comments
Write a Comment