1.局部向量

Mllib支持2种局部向量类型:密集向量(dense)和稀疏向量(sparse)。

密集向量由double类型的数组支持,而稀疏向量则由两个平行数组支持。

example:

向量(5.2,0.0,5.5)

密集向量表示:[5.2,0.0,5.5]

稀疏向量表示:(3,[0,2],[5.2,5.5])    # 3是向量(5.2,0.0,5.5)的长度,除去0值外,其他两个值的索引和值分别构成了数组[0,2]和数组[5.2,5.5]。

Vector是所有局部向量的基类,Dense-Vector和SparseVector都是Vector的具体实现。

import org.apache.spark.mllib.linalg.{Vector, Vectors}
// 创建一个dense vector (5.2, 0.0, 5.5).
val dv: Vector = Vectors.dense(5.2, 0.0, 5.5)
// 创建一个sparse vector (5.2, 0.0, 5.5)并且指定它的索引和值
val sv1: Vector = Vectors.sparse(3, Array(0, 2), Array(5.2, 5.5))
// 创建一个sparse vector (5.2, 0.0, 5.5)并且指定它的索引和值,通过指定非0的值,位置0是5.2,位置2是5.5
val sv2: Vector = Vectors.sparse(3, Seq((0, 5.2), (2, 5.5)))

  

最新文章

  1. django manytomany
  2. 使用BigDecimal进行精确运算
  3. JVM堆和栈的区别
  4. 网络封包分析工具Charles使用
  5. linux命令:du 命令
  6. insmod module_param 模块参数
  7. 关于asp.net mvc4 在IE8下 导出excel失败的解决办法
  8. Python之字符串详解1
  9. 爬虫实例系列一(requests)
  10. DRF 中使用 级验科技滑动验证
  11. 设置IDEA中的web
  12. 动态HTMl处理
  13. VS调试时JSON格式文件加载不了
  14. Codeforces 455A - Boredom - [DP]
  15. BugkuCTF web3
  16. Unity 使用C/C++ 跨平台终极解决方案(PC,iOS,Android,以及支持C/C++的平台)
  17. Python - PIL-pytesseract-tesseract验证码识别
  18. Python repr() 函数
  19. 满帮集团CEO:未来将向“智慧型”公司转变,要成为一家生态公司
  20. 读书笔记_Effective_C++_条款四十:明智而审慎地使用多重继承

热门文章

  1. Android零基础入门第34节:Android中基于监听的事件处理
  2. JS function document.onclick(){}报错Syntax error on token "function", delete this token - CSDN博客
  3. 类选择器和所作用的标签一起写为什么不起作用? - CSDN博客
  4. SetForegroundWindow API函数还不够(好多好多解决方案,真是奇思妙想)
  5. Hadoop 3、Hadoop 分布式存储系统 HDFS(好多彩色图)
  6. cStor云存储、cProc云处理、cVideo云视频、cTrans云传输,云创个人网盘
  7. HTML 关于colgroup的研究
  8. Python连载11-Python中os.path模块简介
  9. Nginx学习笔记---服务与集群
  10. chrome浏览器开发者工具F12中某网站的sources下的源码如何批量保存?