对数据的特征进行分析,分群。

数据选用的是Iris data

下载地址:http://archive.ics.uci.edu/ml/machine-learning-databases/iris/

1.下载后的数据文件是.data格式,直接选择用Tableau导入,选择Text file,文件类型选所有类型将Iris.data添加进去

2.修改列名

3.分析的时候将工具栏->Analysis->Aggregate Measures关闭。

4.根据花萼宽和花萼长标记出每个点,再加上种类进行分类。如下图所示

5.根据花萼宽和花萼长进行分群,左侧Analytics->Cluster进行分群。Marks中选择Clusters,右击->Edit Clusters->Number of Clusters 选3个 因为3个种类。

将Clusters移到Dimensions作为一个维度,对该唯独Edit Group将三个群名字改为3个种类的名字。

创建一个判断分群的维度,计算公式如下。分群与类别相同时,则为真,否则为假。

6.通过判断分群的维度,给出直方图,测度选择Number of Records。

7.最后通过DashBoard给出详细的视觉化对比图。

通过添加Actoins 给出高亮效果,看出哪几个是分群错误的。分类和分群前面需要加上分群判断的Mark才可以联动。

最后可以看出,是因为特征介于两种种类之间的会导致分群失败。分群可以根据特征确定所属的分类进行分析。

最新文章

  1. 《Spark快速大数据分析》—— 第三章 RDD编程
  2. Tomcat7开启CGI支持的方法
  3. Hibernate 错误处理
  4. uva 1421
  5. IOS web网页图片上传问题
  6. 为什么 Flask 有那么多的好评?
  7. iOS 加载Image的两种方式
  8. 【SPOJ】Longest Common Substring(后缀自动机)
  9. Python+reuqests自动化接口测试
  10. vue 中引用jquery
  11. 【原创】讲讲亿级PV的负载均衡架构
  12. js float运算精度问题
  13. day02编程语言介绍及python介绍
  14. Java常考面试题(四)
  15. Web_add_cookie的作用
  16. C# Zip解压缩,规避 [content_types].xml 文件
  17. Common issue on financial information exchange (FIX) Connectivity[z]
  18. Linux 优化详解
  19. gradle-4.1-rc-1-all.zip gradle-4.1-rc-2-all.zip 免费下载(百度网盘)
  20. 在centos6.7通过源码安装python3.6.7报错“zipimport.ZipImportError: can't decompress data; zlib not available”

热门文章

  1. ASP.NET(C#) 面试总结面试题大全
  2. Codeforces Round #594 (Div. 2)(A/B/C)
  3. 自然语言处理NLP学习笔记三:使用Django做一个NLP的Web站点
  4. flask_alembic操作
  5. HanLP-实词分词器详解
  6. springmvc默认配置文件
  7. 解决mac下brew install报错
  8. python:map 函数
  9. 关于memset的几个易错点
  10. 08 Python之内存管理