RandomForestClassifier(随机森林检测每个特征的重要性及每个样例属于哪个类的概率)
2024-09-16 14:16:44
#In the next recipe, we'll look at how to tune the random forest classifier.
#Let's start by importing datasets: from sklearn import datasets
X, y = datasets.make_classification(1000) # X(1000,20)
#y(1000) 取值范围【0,1】 from sklearn.ensemble import RandomForestClassifier
rf = RandomForestClassifier()
rf.n_jobs=-1 rf.fit(X, y)
print ("Accuracy:\t", (y == rf.predict(X)).mean())
print ("Total Correct:\t", (y == rf.predict(X)).sum()) #每个例子属于哪个类的概率
probs = rf.predict_proba(X)
import pandas as pd
probs_df = pd.DataFrame(probs, columns=['', ''])
probs_df['was_correct'] = rf.predict(X) == y
import matplotlib.pyplot as plt
f, ax = plt.subplots(figsize=(7, 5))
probs_df.groupby('').was_correct.mean().plot(kind='bar', ax=ax)
ax.set_title("Accuracy at 0 class probability")
ax.set_ylabel("% Correct")
ax.set_xlabel("% trees for 0")
f.show() #检测重要特征
rf = RandomForestClassifier()
rf.fit(X, y)
f, ax = plt.subplots(figsize=(7, 5))
ax.bar(range(len(rf.feature_importances_)),rf.feature_importances_)
ax.set_title("Feature Importances")
f.show()
最新文章
- ASP.NET Core 中间件之压缩、缓存
- 9.2.2 .net framework下的MVC 控件的封装(下)
- ACM/ICPC 之 BFS(离线)+康拓展开(TSH OJ-玩具(Toy))
- iptables nt
- MFC CFileDialog用法例子。
- Longest Consecutive Sequence
- Javascript金额转化
- Android存储之SharedPreferences
- Callable与Future
- Python档案袋(生成器、迭代器、队列 )
- MySQL系列:性能优化
- 芯灵思Sinlinx A64开发板设置qt程序自启动
- Android--使用剪切板在Activity中传值
- ios 学习路线总结
- SQL Server中使用convert进行日期转换(转载)
- Android跨进程通信:图文详解 Binder机制 原理
- iis ajax post 跨域问题解决
- Java页面中EL的${}与<;%= request.getParameter%>;有什么区别? el 取不到值
- Struts2学习笔记二:开发流程
- Android应用坐标系统全面具体解释
热门文章
- UvaLive 5811 概率DP
- How to use the ZooKeeper driver for ServiceGroup in OpenStack Nova
- zhly
- js 实现自动调出键盘
- UML用例建模解析(二)---------用例执行者之间关系
- 如何在阿里云上部署war包到tomcat服务器
- linux(ubuntu16.04)下安装和破解pycharm专业版
- 2017.11.28 Enginering management:problem-solving ability
- (转)msys2使用教程
- 自定义php(NON-CORE WORDPRESS FILE) 引用 wordpress