參考:http://scikit-learn.org/stable/modules/scaling_strategies.html

对于examples、features(或者两者)数量非常大的情况,挑战传统的方法要解决两个问题:内存和效率。办法是Out-of-core (or “external memory”) learning

有三种方法能够实现out-of-core。各自是:

1、Streaming instances(流体化实例):

简单说就是。instances是一个一个来的。详细实现不在scikit-learn文档范围。

2、Extracting features:

简单说就是利用different feature
extraction
 methods(翻译之后的文章:http://blog.csdn.net/mmc2015/article/details/46992105)实现大数据提取实用数据。简化内存、提高效率。不细讲。

3、Incremental
learning:

all
estimators implementing the partial_fit API
are candidates。

the
ability to learn incrementally from a mini-batch of instances (sometimes called “online learning”) is key to out-of-core learning as it guarantees that at any given time there will be only a small amount of instances in the main memory。

全部实现 partial_fit API
的estimators都能够实现增量学习,包含:

注意:对于分类问题,因为incremental
learner可能不知道全部的classes有哪些,所以第一次调用partial_fit时,最好人工设定參数 classes= ,指明全部类别。

4、Examples:

a
example of Out-of-core
classification of text documents
. 通过样例能够更好理解上面的内容。

最新文章

  1. 智能头盔 "Livall携全球首款智能骑行头盔亮相CES"
  2. PowerDesigner中表名过长,自动生成的主键名截取的问题
  3. javascript中常用操作字符串的几种方法charAt()、indexOf()、slice()、substr()
  4. versionCompare 版本号比较工具
  5. 关于shell脚本时遇value too great for base (error token is "08")
  6. 【转】SVN库的迁移
  7. PHP 开发 APP 接口 学习笔记与总结 - APP 接口实例 [7] APP 错误日志接口
  8. Android PermissionChecker 权限全面详细分析和解决方案
  9. 非阻塞式socket的select()用法
  10. php支持rewrite 时创建.htaccess文件
  11. ☀【JS】eval
  12. MVC 用扩展方法执行自定义视图,替代 UIHint
  13. css中display的属性解析
  14. ReactiveCocoa源码解析(四) Signal中的静态属性静态方法以及面向协议扩展
  15. oracle数据库创建并导入dmp文件
  16. Selenium自动化测试Python三:WebDriver进阶
  17. 【转】Ubuntu做日常开发电脑的系统是一种怎样的体验
  18. 【MySQL】MySQL的约束
  19. 12 Release History for go go语言的版本历史
  20. python 基础 2.8 python练习题

热门文章

  1. 【转】UIAutomator源码分析之启动和运行
  2. 安装win和xp双系统 若干问题
  3. quartz持久化部署实现
  4. 不可不知的Oracle常用技巧
  5. data1是字符串?需要加上引号
  6. 【TP3.2+onethink】radio+checkbox+select 空间 编辑页面选中,附录 js 返回上一页
  7. java struts2入门学习--基于xml文件的声明式验证
  8. windbg dds、dps、dqs
  9. android:fitsSystemWindows属性的用法
  10. Linux 性能測试工具