转文:

本篇博客翻译自:

http://blog.mongodb.org/post/87200945828/6-rules-of-thumb-for-mongodb-schema-design-part-1?mkt_tok=3RkMMJWWfF9wsRonsq7Ldu%2FhmjTEU5z14uUsUKGxhokz2EFye%2BLIHETpodcMTcVnM7zYDBceEJhqyQJxPr3FLdcN0tJuRhTrCw%3D%3D

备注:本译文不是严格意义上的翻译,只是在基于对该原文的理解之上,尽可能表达清楚。如有疑问或不妥,请参考原文。

很多刚从传统SQL开发转向MongoDB开发的朋友都会问到一个问题:如何用MongoDB表达传统关系数据库中的一对多(1 to n)关系?

基于MongoDB丰富的表达力,我们不能说我们必须采用一个标准的方法来进行1 to n的建模。稍后我们从3个具体场景来展开讲解。

首先,我们将1 to n中的n进行场景细化。这个n究竟代表多大的量级呢?是几个到几十个?还是几个到几千个?还是成千上万个?

1) 1 to n(n代表好几个,或几十个,反正不太多)

比如每个Person会有多个Address。此种情况下,我们采用最简单的嵌入式文档来建模。

{
name: 'Kate Monster',
id: '123-456-7890',
addresses : [
{ street: '123 Sesame St', city: 'Anytown', cc: 'USA' },
{ street: '123 Avenue Q', city: 'New York', cc: 'USA' }
]
}

这种建模的方式包含了显而易见的优点和缺点:

优点:你不需要执行单独的查询就可以获得某个Person的所有Address信息。

缺点:你无法像操作独立文档那样来操作Address信息。你必须首先操作(比如查询)Person文档后,才有可能继续操作Address。

在本实例中,我们不需要对Address进行独立的操作,且Address信息只有在关联到某一个具体Person后才有意义。所以结论是:采用这种embedded(嵌入式)建模是非常适合Person-Address场景的。

2)1 to n(n代表好些个,比如几十个,甚至几百个)

比如产品(Product)和零部件(part),每个产品会有很多个零部件。这种场景下,我们可以采用引用方式来建模,如下:

零部件(Part):
{
_id : ObjectID('AAAA'),
partno : '123-aff-456',
name : '#4 grommet',
qty: 94,
cost: 0.94,
price: 3.99
}
 
产品(Product):
{
name : 'left-handed smoke shifter',
manufacturer : 'Acme Corp',
catalog_number: 1234,
parts : [ // array of references to Part documents
ObjectID('AAAA'), // reference to the #4 grommet above
ObjectID('F17C'), // reference to a different Part
ObjectID('D2AA'),
// etc
]
}

首先每个part作为单独的文档存在。每个产品中包含一个数组类型字段(parts),这个数组中存放的是所有该产品包含的零部件的编号(_id主键)。当你需要根据某一个产品编号查询该产品包含的所有部件信息时,你可以执行以下操作:

> product = db.products.findOne({catalog_number: 1234});
// Fetch all the Parts that are linked to this Product
> product_parts = db.parts.find({_id: { $in : product.parts } } ).toArray() ;

这种建模方式的优缺点也非常明显:

优点:部件是作为独立文档(document)存在的,你可以对某一部件进行独立的操作,比如查询或更新。

缺点:如上,你必须通过两次查询才能找到某一个产品所属的所有部件信息。

在本例中,这个缺点是可以接受的,本身实现起来也不难。而且,通过这种建模,你可以轻易的将1 to n扩展到n to n,即一个产品可以包含多个部件,同时一个部件也可以被多个产品所引用(即同一部件可以被多个产品使用)。

3)1 to n(这个n代表很大的数值,比如成千上万,甚至更大)

比如,每一个机器(host)会产生很大数量的日志信息(logmsg)。在这种情况下,如果你采用嵌入式建模,则一个host文档会非常庞大,从
而轻易超过MongoDB的文档大小限制,所以不可行。如果你采用第二中方式建模,用数组来存放所有logmsg的_id值,这种方式同样不可行,因为当
日止很多时,即使单单引用objectId也会轻易超过文档大小限制。所以此时,我们采用以下方式:

机器(hosts):
{
_id : ObjectID('AAAB'),
name : 'goofy.example.com',
ipaddr : '127.66.66.66'
}
 
日志(logmsg):
{
time : ISODate("2014-03-28T09:42:41.382Z"),
message : 'cpu is on fire!',
host: ObjectID('AAAB') // Reference to the Host document
}

我们在logsmg中,存放对host的_id引用即可。

综上所述,在对1 to n关系建模时,我们需要考虑:

1)n代表的数量级很小,且n代表的实体不需要单独操作时,可以采用嵌入式建模。

2)n代表的数量级比较大,或者n代表的实体需要单独进行操作时,采用在1中用Array存放引用的方式建模。

3)n代表的数量级非常大时,我们没有选择,只能在n端添加一个引用到1端。

最新文章

  1. 技能收获与C语言学习
  2. Web服务及http协议
  3. [Git] Git 常用技巧
  4. js 程序出发事件
  5. 使用node js 操作 Mysql 数据库
  6. container_of
  7. Java I/O继承图
  8. POJ 2289 Jamie's Contact Groups & POJ3189 Steady Cow Assignment
  9. winzip15.0许可证
  10. loadrunner多负载机联合产生负载
  11. 【转】open参数O_DIRECT的学习
  12. CSS 文本溢出时显示省略标记
  13. 解决svn--Unable to connect to a repository at URL ‘https://xxxxxx’ 问题
  14. springMVC源码分析--HandlerAdapter(一)
  15. #7 Python代码调试
  16. zigbee组网函数的一些用法
  17. jemter分布式部署及linux下分布式脚本执行
  18. 19-07 【docker】随笔笔记
  19. IDEA+提示“Cannot resolve symbol XXXX”
  20. Linux 线程编程1.0

热门文章

  1. Tomcat源码导入Eclipse测试
  2. [Effective Java]第五章 泛型
  3. SQL疑难杂症【1】解决SQL2008 RESTORE 失败问题
  4. 容易混淆的url src href
  5. WdatePicker.js 日历点击时,触发自定义方法 ,可以调用自己的函数。
  6. iOS - Swift 与 Objective-C 互相操作
  7. FFPEG 转码记录------解决了有流,但是没有码率和FPS?
  8. Redis基础知识之——自定义封装单实例和普通类Redis
  9. 进击的Hybrid App,量身定做缓存机制
  10. Ubuntu 14.04 FTP服务器--vsftpd的安装和配置