大数据的特征(4V+1O)
2024-09-06 19:43:11
数据量大(Volume):第一个特征是数据量大,包括采集、存储和计算的量都非常大。大数据的起始计量单位至少是P(1000个T)、E(100万个T)或Z(10亿个T)。
类型繁多(Variety):第二个特征是种类和来源多样化。包括结构化、半结构化和非结构化数据,具体表现为网络日志、音频、视频、图片、地理位置信息等等,多类型的数据对数据的处理能力提出了更高的要求。
价值密度低(Value):第三个特征是数据价值密度相对较低,或者说是浪里淘沙却又弥足珍贵。随着互联网以及物联网的广泛应用,信息感知无处不在,信息海量,但价值密度较低,如何结合业务逻辑并通过强大的机器算法来挖掘数据价值,是大数据时代最需要解决的问题。
速度快时效高(Velocity):第四个特征数据增长速度快,处理速度也快,时效性要求高。比如搜索引擎要求几分钟前的新闻能够被用户查询到,个性化推荐算法尽可能要求实时完成推荐。这是大数据区别于传统数据挖掘的显著特征。
数据是在线的(Online):数据是永远在线的,是随时能调用和计算的,这是大数据区别于传统数据最大的特征。现在我们所谈到的大数据不仅仅是大,更重要的是数据变的在线了,这是互联网高速发展背景下的特点。比如,对于打车工具,客户的数据和出租司机数据都是实时在线的,这样的数据才有意义。如果是放在磁盘中而且是离线的,这些数据远远不如在线的商业价值大。
最新文章
- JavaScript之自我总结篇
- 【九度OJ】题目1111:单词替换
- spring 事务管理方式及配置
- jQuery的XX如何实现?——1.框架
- Begin to record my bologs....
- SQL Server之存储过程基础知识
- 《深入理解计算机系统》C程序中常见的内存操作有关的典型编程错误
- ES6__异步开发优化
- PE文件格式详解,第三讲,可选头文件格式,以及节表
- 【面试笔试算法】Problem 9: 腾讯2016年研发实习笔试题:最长回文子串
- Linux运行firefox出错
- UnityShader实现物体被遮挡描边
- “每日一道面试题”.Net中所有类的基类是以及包含的方法
- Laravel 5.5处理 Emoji 表情不顯示問題
- tomcat 配置图片服务器
- Yahoo的Yslow23条规则
- UltraEdit 不生成.bak文件
- failed to load response data
- 【jmeter】jmeter环境搭建
- pythonl学习笔记——爬虫的基本常识
热门文章
- 插入jupyter notebook代码
- 518-零钱兑换 II(完全背包-求方案总数)
- js上传文件工具类
- date-fns时间库的基本使用
- Linux - Shell - 字符串截取
- [POI2004] PRZ - 状压dp
- Echarts--来自官网
- JAVA 注解教程(二)元注解
- document.getElementById(";id";).value与$(";#id";).val()之间的区别
- JS高级---函数作为返回值使用拓展,排序