在使用Pandas进行数据处理的时候,我们通常从CSV或EXCEL中导入数据,但有的时候数据都存在数据库内,我们并没有现成的数据文件,这时候可以通过Pymongo这个库,从mongoDB中读取数据,然后载入到Pandas中,只需要简单的三步。

第一步,导入相关的模块:

import pymongo
import pandas as pd

  

第二步,设置MongoDB连接信息:

client = pymongo.MongoClient('localhost',27017)
db = client['Lottery']
pk10 = db['Pk10']

  

第三步,加载数据到Pandas中:

data = pd.DataFrame(list(pk10.find()))

  

删除mongodb中的_id字段

del data['_id']

选择需要显示的字段

data = data[['date','num1','num10']]
print(data)

这样就可以轻松地从MongoDB中读取数据到Pandas中进行数据分析了。

stackoverflow

import pandas as pd
from pymongo import MongoClient def _connect_mongo(host, port, username, password, db):
""" A util for making a connection to mongo """ if username and password:
mongo_uri = 'mongodb://%s:%s@%s:%s/%s' % (username, password, host, port, db)
conn = MongoClient(mongo_uri)
else:
conn = MongoClient(host, port) return conn[db] def read_mongo(db, collection, query={}, host='localhost', port=27017, username=None, password=None, no_id=True):
""" Read from Mongo and Store into DataFrame """ # Connect to MongoDB
db = _connect_mongo(host=host, port=port, username=username, password=password, db=db) # Make a query to the specific DB and Collection
cursor = db[collection].find(query) # Expand the cursor and construct the DataFrame
df = pd.DataFrame(list(cursor)) # Delete the _id
if no_id:
del df['_id'] return df

  

最新文章

  1. spark 简介
  2. 搞清css的单位 px,em,rem的区别
  3. htmlFormat
  4. 无废话WCF入门教程六[一个简单的Demo]
  5. Longest Substring Without Repeating Characters(Difficulty: Medium)
  6. PL/SQL连接Oracle客户端步骤
  7. 细说Linux下软件包的安装与管理
  8. WebRTC手记Channel概念
  9. iOS开发之总结
  10. 能源项目xml文件标签释义--CommonsMultipartResolver
  11. Android:开发环境
  12. 怎么在SQL Server 2008中还原.mdf数据文件
  13. 【2011 Greater New York Regional 】Problem I :The Golden Ceiling
  14. git push error: RPC failed; result=56, HTTP code = 0 ,the remote end hung up unexpectedly
  15. Ffmpeg和SDL如何同步音频
  16. STL中的set集合容器进行集合运算:并、交、差实例
  17. SQL点滴30—SQL中常用的函数
  18. win10外接键盘失灵
  19. javascript 获取滚动条距离顶部的位置(兼容所有的)。
  20. JavaScript技巧总结和本地存储(二)

热门文章

  1. multiprocess(上)
  2. python基础知识梳理-----4基本数据类型,list ,tuple 操作 ,增删该查,以及其他功能函数
  3. 火焰图定位dbproxy问题
  4. 44.oracle表空间的使用
  5. L06-Ubuntu系统中部署Vagrant和VirtualBox
  6. [HNOI2019]鱼
  7. 非常不错的app和网站
  8. [C语言]日期间天数差值的计算
  9. WPF在XAML中使用MultiBinding的两个例子
  10. 虹软linux错误