数据量大(Volume):第一个特征是数据量大,包括采集、存储和计算的量都非常大。大数据的起始计量单位至少是P(1000个T)、E(100万个T)或Z(10亿个T)。

类型繁多(Variety):第二个特征是种类和来源多样化。包括结构化、半结构化和非结构化数据,具体表现为网络日志、音频、视频、图片、地理位置信息等等,多类型的数据对数据的处理能力提出了更高的要求。

价值密度低(Value):第三个特征是数据价值密度相对较低,或者说是浪里淘沙却又弥足珍贵。随着互联网以及物联网的广泛应用,信息感知无处不在,信息海量,但价值密度较低,如何结合业务逻辑并通过强大的机器算法来挖掘数据价值,是大数据时代最需要解决的问题。

速度快时效高(Velocity):第四个特征数据增长速度快,处理速度也快,时效性要求高。比如搜索引擎要求几分钟前的新闻能够被用户查询到,个性化推荐算法尽可能要求实时完成推荐。这是大数据区别于传统数据挖掘的显著特征。

数据是在线的(Online):数据是永远在线的,是随时能调用和计算的,这是大数据区别于传统数据最大的特征。现在我们所谈到的大数据不仅仅是大,更重要的是数据变的在线了,这是互联网高速发展背景下的特点。比如,对于打车工具,客户的数据和出租司机数据都是实时在线的,这样的数据才有意义。如果是放在磁盘中而且是离线的,这些数据远远不如在线的商业价值大。

最新文章

  1. JavaScript之自我总结篇
  2. 【九度OJ】题目1111:单词替换
  3. spring 事务管理方式及配置
  4. jQuery的XX如何实现?——1.框架
  5. Begin to record my bologs....
  6. SQL Server之存储过程基础知识
  7. 《深入理解计算机系统》C程序中常见的内存操作有关的典型编程错误
  8. ES6__异步开发优化
  9. PE文件格式详解,第三讲,可选头文件格式,以及节表
  10. 【面试笔试算法】Problem 9: 腾讯2016年研发实习笔试题:最长回文子串
  11. Linux运行firefox出错
  12. UnityShader实现物体被遮挡描边
  13. “每日一道面试题”.Net中所有类的基类是以及包含的方法
  14. Laravel 5.5处理 Emoji 表情不顯示問題
  15. tomcat 配置图片服务器
  16. Yahoo的Yslow23条规则
  17. UltraEdit 不生成.bak文件
  18. failed to load response data
  19. 【jmeter】jmeter环境搭建
  20. pythonl学习笔记——爬虫的基本常识

热门文章

  1. 插入jupyter notebook代码
  2. 518-零钱兑换 II(完全背包-求方案总数)
  3. js上传文件工具类
  4. date-fns时间库的基本使用
  5. Linux - Shell - 字符串截取
  6. [POI2004] PRZ - 状压dp
  7. Echarts--来自官网
  8. JAVA 注解教程(二)元注解
  9. document.getElementById("id").value与$("#id").val()之间的区别
  10. JS高级---函数作为返回值使用拓展,排序