本文通过文章同步功能推送至博客园,排版可能会有所错误,敬请见谅!

1.客户端初始化

初始化MongoDB客户端

client = pymongo.MongoClient('localhost',27017)

2.创建数据库和数据表

pymongo支持以字典或属性的形式(内置了__item__和__getattr__方法)连接数据库和数据表,若该数据库/表不存在,则创建。

db = client['mydatabase']

sheet = db['sheetname']

3.数据的增加

在pymongo中,对数据的增删改查,全部在数据表对象(sheet)中执行。

MongoDB属于非关系型数据库,它被常用于存储JSON结构,可以很方便的存储序列化信息。

· insert_one方法

· insert_many方法

· insert方法

(1)insert_one插入一条记录

insert_one(document, bypass_document_validation=False, session=None)

document往往是一条以字典形式的数据

可以是

data = {

'city': soup.find(attrs={'name': 'location'})['content'].split('city=')[-1].split(';')[0],

'district':soup.title.get_text().split('短租房')[0][1:] + '区',

'title': soup.select('#indexPage
> div > div.houseIntroduce > div.border_b > p')[-1].get_text().strip(),

'addr': soup.select('#indexPage
> div > section > p')[0].get_text().strip(),

'price': int(soup.select('div.priceBox > div > div > span.newPcrice')[0].get_text().strip()),

'introduce':soup.select('div.houseIntroduceBox
> div.houseIntroduce_P_con > p')[0].get_text().strip(),

'tags':[],

}

(2)insert_many插入多条记录

insert_one(document, ordered=True, bypass_document_validation=False,

session=None)

document是一个可迭代对象,通常是数据组成的列表或者元组。

ordered如果为真,数据将按照提供的顺序连续插入数据表,否则以任意顺序。

(3)insert方法

在pymongo3.6.1中,insert方法是不被赞成的方法,请使用insert_one或者insert_many。

4.数据的删除

使用下面几种方法可以删除任意条数据:

· delete_one方法

· delete_many方法

(1)delete_one删除一条记录

delete_one(filter, collation=False, session=None)

filter为字典形式的查询对象

(2)delete_many删除多条记录

delete_many(filter, collation=False, session=None)

filter为字典形式的查询对象

(3)find_one_and_delete找到并删除一条数据

find_one_and_delete(filter, projection=None, sort=None, session=None)

5.数据的修改

· replace_one方法

· update_one方法

· update_many方法

(1)replace_one替换一条记录

replace_one(filter, replacement, upsert=False,

bypass_document_validation=False, collation=None,

session=None)

filter是过滤条件

replacement是替换后的数据

upsert如果为真,则当找不到过滤条件时,会直接插入替换后的数据。

(2)update_one修改一条记录数据

与replace_one替换方法的简单粗暴相比,update_one更注重于修改一条数据本身,update方法系列也支持更高级的操作符。

update_one(filter, update, upsert=False,

bypass_document_validation=False,

collation=None, array_filters=None, session=None)

filter是过滤条件

update是要修改字段的数据集合(通常以字典表现)

update支持MongoDB的操作符(详见MongDB的操作运算符),这是一个非常重要的特性。

6.数据的查询

· find方法

· find_one方法

(1)find查询所有匹配数据

sheet.find({'district':'岳麓区', 'deposit':{'$lt':301}})

(2)find_one查询匹配的第一条数据

使用方法与find一致。

在数据的查询中,主要掌握MongoDB的操作运算符才是灵活使用的关键点。

7.其他内置方法

· count() - 返回查询结果数量

· sorted()

- 接收一个字段,按其排序

· create_index() - 创建索引详见官方文档

8.补充:MongDB的操作运算符

参考资料:mongodb常用操作符

(1)比较操作符

· $gt - 匹配字段值大于指定值的文档( > )

· $lt - 匹配字段值大于指定值的文档( < )

· $gte - 匹配字段值大于等于指定值的文档( >= )

· $lte - 匹配字段值小于等于指定值的文档( <= )

· $eq - 匹配字段值等于指定值的文档( = )

· $in - 匹配字段值等于指定数组中的任何值

o { field: { $in: [<value1>, <value2>, ... <valueN> ] } }

· $ne - 匹配字段值不等于指定值的文档,包括没有这个字段的文档

· $nin - 字段值不在指定数组或者不存在

o { field: { $nin: [<value1>, <value2>, ... <valueN> ] } }

(2)逻辑操作符

· $or - 文档至少满足其中的一个表达式

o { $or: [ { <expression1> }, ... , { <expressionN> } ] }

· $and - 文档同时满足所有的表达式

o { $and: [ { <expression1> }, ... , { <expressionN> } ] }

· $nor - 字段值不匹配所有的表达式的文档,包括那些不包含这些字段的文档

o { $nor: [ { <expression1> }, ... , { <expressionN> } ] }

(3)元素操作符

· $type - 匹配字段值为指定数据类型的文档(详见)

o { field: { $type: <BSON type number> | <String alias> } }

o sheet.find({'deposit':{'$type':'string'}})

o sheet.find({'deposit':{'$type':2}})

· $exists - 匹配字段存在的数据

(4)评估操作符

· $mod - 匹配字段值被除有指定的余数的文档

o { field: { $mod: [ divisor(除数), remainder(余数) ] } }

· $regex - 正则表达式可以匹配到的文档

o { <field>: { $regex: 'pattern', $options: '<options>' } }

· $text - 针对创建了全文索引的字段进行文本搜索

附表1MongoDB数据类型

mestamp”

Type

Number

Alias

Notes

Double

1

“double”

String

2

“string”

Object

3

“object”

Array

4

“array”

Binary

data

5

“binData”

Undefined

6

“undefined”

Deprecated.

ObjectId

7

“objectId”

Boolean

8

“bool”

Date

9

“date”

Null

10

“null”

Regular

Expression

11

“regex”

DBPointer

12

“dbPointer”

"182" valign="top" style="border:solid #A3A3A3 1.0pt;background:white;">

JavaScript

13

“javascript”

Symbol

14

“symbol”

Deprecated.

JavaScript

(with scope)

15

“javascriptWithScope”

32-bit

integer

16

“int”

64-bit

integer

18

“long”

Decimal128

19

“decimal”

New

in version 3.4.

Min

key

-1

“minKey”

Max key

127

“maxKey”

最新文章

  1. Entity Framework 6 Recipes 2nd Edition(11-1)译 -&gt; 从“模型定义”函数返回一个标量值
  2. CSS3新增基础属性总结——20160409(易达客)
  3. node基础 --工具
  4. mysql执行update报错1175解决方法
  5. QT中使用Glut库
  6. NetAnalyzer笔记 之 六 用C#打造自己的网络连接进程查看器(为进程抓包做准备)
  7. java输出空心菱形
  8. Java Object 构造方法的执行顺序
  9. js 向上、向下取整
  10. Oracle数据库操作基本语法
  11. PAT-A1135. Is It A Red-Black Tree (30)
  12. day2_Jmeter压测
  13. android -------- 混淆打包报错(warning - InnerClass annotations are missing corresponding EnclosingMember annotations)
  14. Python GUI中 text框里实时输出
  15. Spring Websocket实现文本、图片、声音、文件下载及推送、接收及显示(集群模式)
  16. Apache解析和绑定域名
  17. FPGA视频拼接器的DP 的4k 功能输入, 把lvds 转为 serdes
  18. ISE、vivado、QuartusII调用notepad++、UE汇总(整理)
  19. linux3.4.2之dma驱动
  20. Hadoop 2.0 上深度学习的解决方案

热门文章

  1. Java 方法与数组
  2. LeetCode 222. 完全二叉树的节点个数(Count Complete Tree Nodes)
  3. Qt之模型/视图(委托)
  4. 数据分析之 pandas
  5. 连接池设置导致的“血案” 原创: 一页破书 一页破书 5月6日 这个问题被投诉的几个月了,一直没重视——内部客户嘛&#128575; 问题现象: 隔几周就会出现 A服务调用B服务超时 脚趾头想就是防火墙的问题,A、B两服务之间有防火墙 找运维查看防火墙日志确实断掉了tcp连接,但是是因为B服务5分钟没有回包,下面这个表情就是我当时的心情——其实我们在防火墙、A服务、B服务都抓包了,几十个G的t
  6. Vue 缓存当前页面keep-alive
  7. Time类
  8. React——相关工具概述
  9. VS在项目范围内禁止关闭特定警告
  10. 最新 梦网科技java校招面经 (含整理过的面试题大全)