kmeans 对表达量进行聚类
2024-10-21 20:43:47
代码如下
df = pd.read_csv("../kmeans/gene.fpkm.csv",header=None)
print df.head()
#去掉第一行
tdf = df.drop(index=[0])
#去掉第一列
mdf = tdf.drop([0],axis=1)
#获取第一列作为行的名称
rownames=tdf[0]
#获取第一行作为列的名称
gene=df.loc[0][1:]
#修改原始数据库的行列名
mdf.rename(index=rownames, columns=gene, inplace=True)
from sklearn.cluster import KMeans
seed = 9 # 设置随机数
clf = KMeans(n_clusters=3, random_state=seed) # 聚类
clf.fit(mdf)
mdf['label'] = clf.labels_ # 对原数据表进行类别标记
c = mdf['label'].value_counts()
最新文章
- C#实现自动发送QQ消息
- 【java 断点续传】
- Android Priority Job Queue (Job Manager)(一)
- C#实现ByteBuffer类 .
- strcpy_s与strcpy的比較
- 【web安全】第三弹:web攻防平台pentester安装及XSS部分答案解析
- symfony 从request中获取当前登陆用户
- pyqt pyside QLineEdit 重写键盘事件
- Zabbix监控服务器硬盘状态
- hdu 1114Piggy-Bank(完全背包)
- JDBC编程之预编译SQL与防注入式攻击以及PreparedStatement的使用教程
- MySql折腾小记二:text/blog类型不允许设置默认值,不允许存在两个CURRENT_TIMESTAMP
- Django url反向解析与路由分发名称空间
- leetcode268
- pytest 入门及运行
- onclick时间加return和不加return的区别
- 关于pthread_cond_wait使用while循环判断的理解
- api proxy设置 后端服务器代理
- ajaxSubmit请求返回数据成功,但是不执行success回调函数
- 【BZOJ4361】isn(动态规划,容斥)