chunkers=pd.read_csv('dd.csv',chunksize=10000) tot=pd.Series([]) for piece in chunkers: tot=tot.add(piece['dfcol'].value_counts(),fill_value=0)#迭代计数 tot=tot.order(ascending=False)
Python中基本的读文件和简单数据处理 暂无评论 DataQuest上面的免费课程(本文是Python基础课程部分),里面有些很基础的东西(csv文件读,字符串预处理等),发在这里做记录.涉及下面六个案例: Find the lowest crime rate(读取csv文件,字符串切分,for循环和if判断过滤数据) Discover weather pattern in LA(for循环和if判断进行频数统计) Building a Spell Checker(词频统计,字符串预处理,字典
读文件: 读取文件 f = open('\info.txt') fil = f.read() f.close() 按行读文件: f = open("info.txt") while 1: line = f.readline() line=line.strip('\n') # 去掉换行符 if not line: break print line f.close()
直接上代码: # 读文件 def get_venue(file): fname = file # 文件名 # 获取数据长度 len = 0 with open(fname, 'r+', encoding='utf-8') as f: for line in f.readlines(): len += 1 # 创建数组,并赋值 list = [[None] * len for i in range(2)] i = 0 with open(fname, 'r+', encoding='utf-8')