整理和翻新一下自己看过和笔记过的Big Data相关的论文和Blog

Streaming & Spark

In-Stream Big Data Processing

Discretized Streams, 离散化的流数据处理

Spark - A Fault-Tolerant Abstraction for In-Memory Cluster Computing

Mesos: A Platform for Fine-Grained Resource Sharing in the Data Center

Sparrow - Distributed, Low Latency Scheduling

 

Linkedin Ecosystem

The Log: What every software engineer should know about real-time data's unifying abstraction

Kafka: a Distributed Messaging System for Log Processing

Linkedin Kafka Design

Linkedin Databus

Apache Samza - Reliable Stream Processing atop Apache Kafka and Hadoop YARN

 

Google Ecosystem

GFS - The Google File System

bigtable: A Distributed Storage System for Structured Data

Dremel - Interactive Analysis of WebScale Datasets

Chubby - lock service for loosely-coupled distributed systems

Megastore - Providing Scalable, Highly Available Storage for Interactive Services

 

NoSQL

一致性问题

How to beat the CAP theorem

全序, 分布式一致性的本质

Nosql数据一致性技术概要

Paxos Made Simple

Why Vector Clock are Easy or Hard?

Anti-Entropy Protocols

索引技术

大数据索引技术 - B+ tree vs LSM tree

详解SSTable结构和LSMTree索引

数据模型

NoSQL Data Modeling Techniques

Columnar Storage

系统

Dynamo: Amazon’s Highly Available Key-value Store

Cassandra - A Decentralized Structured Storage System

NoSQL Databases - MongoDB

NoSQL Databases - CouchDB

 

Hadoop Ecosystem

Apache Tez Design

YARN - Yet Another Resource Negotiator

 

数据分析和挖掘

大数据处理中基于概率的数据结构

海量文档查同或聚类问题 -- Locality Sensitive Hash 算法

 

并发技术

LMAX Disruptor 原理

同步和异步, 阻塞和非阻塞, Reactor和Proactor

并发编程模型和访问控制

Scalable IO in Java

Java Concurrency In Practice

最新文章

  1. 【十大经典数据挖掘算法】EM
  2. JDBC判断数据库是否插入成功
  3. 前端UI框架和JS类库
  4. JavaScript下的setTimeout(fn,0)意味着什么?
  5. 关于紫光a5扫描仪的安装
  6. YARN的内存和CPU配置
  7. 如何清理photoshop cs6 被升级的烦人的adobe creative cloud组件
  8. STM32学习笔记(一) 如何新建一个STM32工程模板
  9. 【.NET】对文件的对称加密
  10. cocos2d-x 3.2 DrawNode 绘图API
  11. Java Concurrency - 线程执行器
  12. [jobdu]孩子们的游戏(圆圈中最后剩下的数)
  13. Laravel PHP Web开发框架
  14. apache服务器参数设置
  15. C++ 观察者模式样例
  16. Android Studio快捷键汇总
  17. 企业IT管理员IE11升级指南【8】—— Win7 IE8和Win7 IE11对比
  18. Atom编辑器插件
  19. ln 软链
  20. 多台linux主机间免密码登录

热门文章

  1. sphider 丁廷臣简体中文完美汉化版带蜘蛛搜索引擎程序 v1.3.4
  2. 利用css3背景位置完成拼图
  3. jquery插件-table转Json数据插件
  4. [C++]在什么时候需要“#include string.h“
  5. Ajax的两个用法
  6. jquery.autocomplete 传参问题
  7. ansible ansible_os_family == "RedHat" and ansible_lsb.major_release|int >= 6 转为数字比大小
  8. 【BZOJ】1058: [ZJOI2007]报表统计(splay+set)
  9. hdu 4708(暴力+找规律)
  10. 使用 Estimator 构建卷积神经网络