一、sklearn模块

  1. sklearn模块下有很多子模块,常用的数据集在:sklearn.datasets模块下;
  2. 通过数据集中DESCR来查看数据集的文档;
  3. 从datasets中加载数据:
    import numpy as np
    import matplotlib as mpl
    import matplotlib.pyplot as plt
    from sklearn import datasets # 查看datasets中的数据,一般格式为:datasets.load_ + 数据集的名称(按Tab键可选择);
    iris = datasets.load_iris() # 看到数据集中的内容种类,格式:数据集变量.keys()
    iris.keys()
    # 输出:dict_keys(['data', 'target', 'target_names', 'DESCR', 'feature_names'])
    # 则load_iris()数据集中有['data', 'target', 'target_names', 'DESCR', 'feature_names']内容;
    # data:数据的具体数值;
    # DESCR:数据集的文档;
    # feature_name:特征名称;
    # target:样本类别,是图标中的纵轴label,也即是样本的标记;
    # target_names:样本类别数值的具体意思,一般target为数值,target_names为解释这些数值的语言; # 查看数据集中的各类内容,格式:数据集变量.数据类别
    iris.data
  4. 可视化数据:只能绘制二维数据;
    # 取前两列/种特征值
    X = iris.data[:, :2] # 对两列数据绘散点图,两列特征值分别为横轴和纵轴
    plt.scatter(X[:, 0], X[:, 1])
    plt.show()
  5. 按target类型对散点图的点着色并显示:(y == 0返回一个布尔数组,此处目的是选取target = 0的行,即0类的样本)
    y = iris.target
    # marker表示点的样式
    plt.scatter(X[y == 0, 0], X[y == 0, 1], color = 'red', marker = "o")
    plt.scatter(X[y == 1, 0], X[y == 1, 1], color = 'blue', marker = "+")
    plt.scatter(X[y == 2, 0], X[y == 2, 1], color = 'green', marker = "x")
    plt.show()
  6. 如果所选的特征类型绘制出的散点图区别不明显,可以尝试选择其它特征进行绘图;

最新文章

  1. 54B
  2. 在VS里配置及查看IL
  3. 多线程调用WebClient速度变慢的问题
  4. 这些git技能够你用一年了
  5. Nginx优化—配置优化
  6. PCI 总线学习笔记
  7. Oracle SQL Lesson (2) - 限制和排序数据
  8. RAID部署
  9. day13_H5_CSS_1
  10. Mysql对用户的操作
  11. 设置PL/SQL 快捷键
  12. Springboot & Mybatis 构建restful 服务五
  13. Nginx支持WebSocket反向代理-学习小结
  14. orcale存储过程学习之路--存储过程实例(三)
  15. Flask系列03--Flask的路由 app.route中的参数, 动态参数路由
  16. AME_PR采购申请单通过AME审批设定和测试(案例)
  17. DS作业01--日期抽象数据类型设计与实现
  18. JAVA练手--链表
  19. NYOJ 1022 合纵连横 (并查集)
  20. angular的属性绑定

热门文章

  1. JQuery日记 5.11 Sizzle选择器(五)
  2. ABAP内表数据做层次XML输出
  3. jQuery 中的 Deferred 和 Promises(转)
  4. linux基础part4
  5. myBatis中使用Map进行遍历
  6. html5 css3 进度条特效
  7. 【转】.net中快捷键的使用
  8. Data Structure Binary Tree: Lowest Common Ancestor in a Binary Tree
  9. [原创]java WEB学习笔记30:Cookie Demo 之显示最近浏览的记录
  10. poj3301 Texas Trip【三分算法】