Map-Reduce

Map-Reduce 是 mongodb 处理批量数据的大杀器,凡是数据量大并且定时处理能满足需求的,都可以试着扔给 mongodb,让它去 Map-Reduce。

以下截取自文档的图,可以清楚的说明 Map-Reduce 的执行过程。先看图:

回答问题,Map-Reduce 的执行过程是先 map 然后 reduce 么?

是?恭喜入坑!而且是自己挖坑自己填。仔细再看一遍上文的图,看到那个灰色的箭头了?不是每次 map 都有 reduce 的!

如果 map 的结果不是数组,mongodb 就不会执行 reduce。很合理的处理逻辑。

然后,只有入过坑才能意识到自己挖的坑:对于 map 到的数据,如果在 reduce 时希望做统一的处理,一定会发现数据结果是不完整的。

mgo 时间

mgo 是 golang 的 mongodb driver。

首先,构建测试程序。

package main

import (
"log"
"time" "gopkg.in/mgo.v2"
. "gopkg.in/mgo.v2/bson"
) type TestTime struct {
Id ObjectId "_id"
CreationTime time.Time
} func main() {
session, err := mgo.Dial("127.0.0.1")
if err != nil {
log.Fatalln("Fatal error:", err.Error())
} defer session.LogoutAll()
defer session.Close() tc := session.DB("test").C("testtime") t := time.Now()
id := NewObjectId() test := TestTime{
Id: id,
CreationTime: t,
} tc.Insert(test) var testTime TestTime
tc.FindId(id).One(&testTime) log.Println(t) log.Println(t == testTime.CreationTime)
}

UTC

执行测试程序,查看 mongodb 数据

/* 0 */
{
"_id" : ObjectId("548d0b3194e33700f5ffaba9"),
"creationtime" : ISODate("2014-12-14T03:59:45.123Z")
}

时间已经是 UTC 了,没有必要 time.Now().UTC(),当然,执行下 .UTC() 代码看起来更明确,也耗费不了多少 CPU,因为,.UTC() 仅仅是赋值时间的 location,其源码如下:

func (t Time) UTC() Time{
t.loc = UTC
return t
}

精度

mgo 直接以 time.Time 类型插入 mongodb 的时间精度与 time.Now() 的时间精度是不同的:

  • mgo 精度为 ms
  • time.Now() 精度为 ns2014-12-14 11:59:45.123670247 +0800 CST

所以,上文 log.Println(t == testTime.CreationTime) 打印结果是 false

_id 索引

_id 是 mongodb 每个文档必备字段,而且是默认索引,就是说不管你用不用,它都会建立索引并占用存储空间。

在设计存储结构时,只要能保证唯一性,即可将其作为 _id,例如:

{
"_id" : {
"nickname" : "busyStone",
"index" : 1
},
"creationtime" : ISODate("2014-11-09T02:00:44.496Z")
}

mongodb 是支持组合索引的,那么,_id.nickname 是不是也可以作为索引用呢?

在选中的 collection 上执行 .find({"id.nickname":"busyStone"}).explain()nscanned 字段并不是预想中的 1,因为,建立的索引是这样的:

{
"_id" : 1
}

所以,老老实实自己个建索引吧。

最新文章

  1. 关于strlen误用的一点记录
  2. linux下对进程按照内存使用情况进行排序
  3. Mysql导出函数、存储过程
  4. JS-Date对象
  5. C语言变参问题
  6. ZGrapher 画函数曲线图的工具
  7. 李洪强iOS开发Swift篇---12_NSThread线程相关简单说明
  8. 源文件名和public 类名
  9. lr11 录制脚本时候,无法自动启动ie,查了网上很多方法都未解决?
  10. EF6多线程与分库架构设计之Repository
  11. MyEclipse弹出提示窗口
  12. Python编程从入门到实践笔记——文件
  13. hive 的map数和reduce如何确定(转)
  14. Gym100496H-House of Representatives-树
  15. excel多元回归-系数参数解读
  16. html5 随机数函数
  17. 子Fragment获取父Fragment
  18. iOS 越狱后 SSH 不能连接
  19. URL里面的中文参数到底转换成了什么?
  20. java面试题之----IO与NIO的区别

热门文章

  1. [MySQL] 一致性读分析
  2. js加载条
  3. 【C++】继承时构造函数和析构函数
  4. python批量下载图片3
  5. Nodejs Express下载文件,并保存成原文件
  6. [jquery] ajax 调试
  7. hihocoder 1174 [BFS /拓扑排序判断是否有环]
  8. JNI基础学习
  9. AtCoder Grand Contest 023 A - Zero-Sum Ranges
  10. 数据排序 第二讲( 各种排序方法 结合noi题库1.10)