//HTML5本地缓存数据 function putObj(key, data) { if (!!window.localStorage) { var obj = { "key": key, "data": data}; window.localStorage.setItem(key, JSON.stringify(obj)); } } function getObj(key) { var data = ""; if (localStorage.
广播变量 背景 一般Task大小超过10K时(Spark官方建议是20K),需要考虑使用广播变量进行优化.大表小表Join,小表使用广播的方式,减少Join操作. 参考:Spark广播变量与累加器 Local Dir 背景 shuffle过程中,临时数据需要写入本地磁盘.本地磁盘的临时目录通过参数spark.local.dir配置. 性能优化点 spark.local.dir支持配置多个目录.配置spark.local.dir有多个目录,每个目录对应不同的磁盘,这样可以提升IO效率.另外,可以采