目录

1.1 欢迎
1.2 机器学习是什么

1.2.1 机器学习定义

1.2.2 机器学习算法

  - Supervised learning 监督学习

  - Unsupervised learning  无监督学习

  - Reinforcement learning 强化学习

  - Recommender systems 推荐系统

1.2.3 课程目的

    如何在构建机器学习系统时,选择最好的实践类型决策、节省时间。
  1.3 监督学习

     1.3.1 Regression 回归问题

     1.3.2 Classification 分类问题

        1.3.3 回归和分类
  1.4 无监督学习

     1.4.1 聚类算法 Clustering algorithm

1.2  机器学习是什么

   参考视频: 1 - 2 - What is Machine Learning_ (7 min).mkv

1.2.1  机器学习定义

• Arthur Samuel (1959). Machine Learning: Field of study that gives computers the ability to learn without being explicitly programmed.  机器学习:在进行特定编程的情况下,给予计算机学习能力的领域。

• Tom Mitchell (1998) Well-posed Learning Problem: A computer program is said to learn from
experience E with respect to some task T and some performance measure
P, if its performance on T, as measured by P, improves with experience
E.     卡内基梅隆大学Tom 定义:一个程序被认为能从经验 E 中学习,解决任务 T,达到性能度量值P, 当且仅当,有了经验 E 后,经过 P 评判,程序在处理 T 时的性能有所提升。

  例题,以垃圾邮件监测为例,解释Tom 定义中字母的对应:

1.2.2  机器学习算法

1、常用:

  Supervised Learning 监督学习:学习数据带有标签

    Unsupervised Learning 无监督学习:没有任何的标签,或者有相同的标签。已知数据集,不知如何处理,也未告知每个数据点是什么。

       (右侧的例子,无监督学习将数据划分为两个集合,也就是聚类clustering algorithm)

2、其他:

    Reinforcement learning 强化学习, recommender systems 推荐系统

1.2.3  课程目的

  If you actually tried to develop a machine learning system, how to make those best practices type decisions about the way in which you build your system. 如何在构建机器学习系统的时候选择最好的实践类型决策,节省时间。

1.3 监督学习

参考视频: 1- 3- Supervised Learning (12 min).mkv

1.3.1  Regression回归问题:预测结果是连续的输出值

   在历史房价数据的基础上,预测房屋价格。可以使用直线拟合(粉色),也可以使用二次曲线拟合(蓝色)。

    

    监督学习:基于已有的正确结果。           回归问题:预测连续的输出值

1.3.2  Classification分类问题:预测结果是离散的多个值

  

下图是基于两个特征(两个维度)进行预测的例子, 右边是其他可能维度(维度可能有无穷多个)

1.3.3  区分 “分类问题”和“回归问题”

    例题:

1.4 无监督学习

  参考视频: 1 - 4 - Unsupervised Learning (14 min).mkv

1.4.1  聚类算法clustering algorithm 在现实生活中的应用

  1、Google News 每天将爬来的网址分为一个个的新闻专题。

  2、基因信息分组。

3、组织大型计算机集群。 社交网络的分析。市场分割。天文数据分析

    

  4、鸡尾酒party问题,将混在一起的多个音频源拆开。

通过这个例子,特别强调了Octave和MATLAB这些软件的简洁之处,这个算法的实现在Octave里只需要一行代码

[W,s,v] = svd((repmat(sum(x.*x,),size(x,),).*x)*x');

最新文章

  1. Ext.Net MVC 配置(1)
  2. SpringMvc自定义拦截器
  3. 【转】设计模式 ( 十八 ) 策略模式Strategy(对象行为型)
  4. 简单选择排序算法(C++版)
  5. thinkphp关联查询(多表查询)
  6. C# Winform C/S系统快速开发平台(源码+原创)
  7. Andriod Studio科学文章——4.常见问题解答有关编译
  8. Linux设置全局代理与yum代理
  9. 【机器学习实战】第11章 使用 Apriori 算法进行关联分析
  10. max of 直线划平面
  11. .Net Core项目添加日志功能
  12. 微软开源的Trill是什么?
  13. python内存数据库pydblite
  14. Python模块和包使用
  15. 【Social listening实操】如何运用免费的大数据工具获得行业洞察?
  16. Linux 网卡流量查看
  17. 10分钟理解Android数据库的创建与使用(附具体解释和演示样例代码)
  18. php--------获取当前时间、时间戳
  19. HDU 4585
  20. mac上安装nginx

热门文章

  1. 【linux】基础知识学习
  2. 【linux】ulimit限制打开的文件数量
  3. 如何在PostgreSQL中建只读账号
  4. mac brew安装使用卸载
  5. LUAROCKS 报错解决办法
  6. fedora 安装新字体 courier new xxx
  7. 【转】C# Socket编程(4)初识Socket和数据流
  8. 动态可缓存的内容管理系统(CMS)
  9. bzoj 1085 [SCOI2005]骑士精神——IDA*
  10. Linux yum操作时出现Error: xz compression not available