机器学习:从sklearn中加载数据
2024-08-29 22:17:29
一、sklearn模块
- sklearn模块下有很多子模块,常用的数据集在:sklearn.datasets模块下;
- 通过数据集中DESCR来查看数据集的文档;
- 从datasets中加载数据:
import numpy as np
import matplotlib as mpl
import matplotlib.pyplot as plt
from sklearn import datasets # 查看datasets中的数据,一般格式为:datasets.load_ + 数据集的名称(按Tab键可选择);
iris = datasets.load_iris() # 看到数据集中的内容种类,格式:数据集变量.keys()
iris.keys()
# 输出:dict_keys(['data', 'target', 'target_names', 'DESCR', 'feature_names'])
# 则load_iris()数据集中有['data', 'target', 'target_names', 'DESCR', 'feature_names']内容;
# data:数据的具体数值;
# DESCR:数据集的文档;
# feature_name:特征名称;
# target:样本类别,是图标中的纵轴label,也即是样本的标记;
# target_names:样本类别数值的具体意思,一般target为数值,target_names为解释这些数值的语言; # 查看数据集中的各类内容,格式:数据集变量.数据类别
iris.data - 可视化数据:只能绘制二维数据;
# 取前两列/种特征值
X = iris.data[:, :2] # 对两列数据绘散点图,两列特征值分别为横轴和纵轴
plt.scatter(X[:, 0], X[:, 1])
plt.show() - 按target类型对散点图的点着色并显示:(y == 0返回一个布尔数组,此处目的是选取target = 0的行,即0类的样本)
y = iris.target
# marker表示点的样式
plt.scatter(X[y == 0, 0], X[y == 0, 1], color = 'red', marker = "o")
plt.scatter(X[y == 1, 0], X[y == 1, 1], color = 'blue', marker = "+")
plt.scatter(X[y == 2, 0], X[y == 2, 1], color = 'green', marker = "x")
plt.show() - 如果所选的特征类型绘制出的散点图区别不明显,可以尝试选择其它特征进行绘图;
最新文章
- 54B
- 在VS里配置及查看IL
- 多线程调用WebClient速度变慢的问题
- 这些git技能够你用一年了
- Nginx优化—配置优化
- PCI 总线学习笔记
- Oracle SQL Lesson (2) - 限制和排序数据
- RAID部署
- day13_H5_CSS_1
- Mysql对用户的操作
- 设置PL/SQL 快捷键
- Springboot &; Mybatis 构建restful 服务五
- Nginx支持WebSocket反向代理-学习小结
- orcale存储过程学习之路--存储过程实例(三)
- Flask系列03--Flask的路由 app.route中的参数, 动态参数路由
- AME_PR采购申请单通过AME审批设定和测试(案例)
- DS作业01--日期抽象数据类型设计与实现
- JAVA练手--链表
- NYOJ 1022 合纵连横 (并查集)
- angular的属性绑定
热门文章
- JQuery日记 5.11 Sizzle选择器(五)
- ABAP内表数据做层次XML输出
- jQuery 中的 Deferred 和 Promises(转)
- linux基础part4
- myBatis中使用Map进行遍历
- html5 css3 进度条特效
- 【转】.net中快捷键的使用
- Data Structure Binary Tree: Lowest Common Ancestor in a Binary Tree
- [原创]java WEB学习笔记30:Cookie Demo 之显示最近浏览的记录
- poj3301 Texas Trip【三分算法】