Big Data资料汇总
整理和翻新一下自己看过和笔记过的Big Data相关的论文和Blog
Streaming & Spark
Discretized Streams, 离散化的流数据处理
Spark - A Fault-Tolerant Abstraction for In-Memory Cluster Computing
Mesos: A Platform for Fine-Grained Resource Sharing in the Data Center
Sparrow - Distributed, Low Latency Scheduling
Linkedin Ecosystem
The Log: What every software engineer should know about real-time data's unifying abstraction
Kafka: a Distributed Messaging System for Log Processing
Apache Samza - Reliable Stream Processing atop Apache Kafka and Hadoop YARN
Google Ecosystem
bigtable: A Distributed Storage System for Structured Data
Dremel - Interactive Analysis of WebScale Datasets
Chubby - lock service for loosely-coupled distributed systems
Megastore - Providing Scalable, Highly Available Storage for Interactive Services
NoSQL
一致性问题
Why Vector Clock are Easy or Hard?
索引技术
数据模型
NoSQL Data Modeling Techniques
系统
Dynamo: Amazon’s Highly Available Key-value Store
Cassandra - A Decentralized Structured Storage System
Hadoop Ecosystem
YARN - Yet Another Resource Negotiator
数据分析和挖掘
海量文档查同或聚类问题 -- Locality Sensitive Hash 算法
并发技术
同步和异步, 阻塞和非阻塞, Reactor和Proactor
最新文章
- 【十大经典数据挖掘算法】EM
- JDBC判断数据库是否插入成功
- 前端UI框架和JS类库
- JavaScript下的setTimeout(fn,0)意味着什么?
- 关于紫光a5扫描仪的安装
- YARN的内存和CPU配置
- 如何清理photoshop cs6 被升级的烦人的adobe creative cloud组件
- STM32学习笔记(一) 如何新建一个STM32工程模板
- 【.NET】对文件的对称加密
- cocos2d-x 3.2 DrawNode 绘图API
- Java Concurrency - 线程执行器
- [jobdu]孩子们的游戏(圆圈中最后剩下的数)
- Laravel PHP Web开发框架
- apache服务器参数设置
- C++ 观察者模式样例
- Android Studio快捷键汇总
- 企业IT管理员IE11升级指南【8】—— Win7 IE8和Win7 IE11对比
- Atom编辑器插件
- ln 软链
- 多台linux主机间免密码登录
热门文章
- sphider 丁廷臣简体中文完美汉化版带蜘蛛搜索引擎程序 v1.3.4
- 利用css3背景位置完成拼图
- jquery插件-table转Json数据插件
- [C++]在什么时候需要“#include string.h“
- Ajax的两个用法
- jquery.autocomplete 传参问题
- ansible ansible_os_family == ";RedHat"; and ansible_lsb.major_release|int >;= 6 转为数字比大小
- 【BZOJ】1058: [ZJOI2007]报表统计(splay+set)
- hdu 4708(暴力+找规律)
- 使用 Estimator 构建卷积神经网络