您的当前位置:首页正文

python如何处理excel数据

2020-11-27 来源:客趣旅游网
python主要是使用第三方模块库xlrd、xlwt、xluntils、pyExcelerator和Pandas来处理excel文件数据。

这里有一张excel数据表,下面我们通过示例来看看xlrd、xlwt、xluntils、pyExcelerator和Pandas是如何处理excel文件数据的。【视频教程推荐:python教程】

2.jpg

方法一:使用xlrd来处理excel数据

示例1:python读取excel文件特定数据

import xlrd
data = xlrd.open_workbook('test.xls') # 打开xls文件
table = data.sheets()[0] # 打开第一张表
nrows = table.nrows # 获取表的行数
# 循环逐行
输出 for i in range(nrows): if i == 0: # 跳过第一行 continue print table.row_values(i)[:13] # 取前十三列数据

示例2:python读取excel文件所有数据

import xlrd
#打开一个xls文件
workbook = xlrd.open_workbook('test.xls')
#抓取所有sheet页的名称
worksheets = workbook.sheet_names()
print('worksheets is %s' %worksheets)
#定位到sheet1
worksheet1 = workbook.sheet_by_name(u'Sheet1')


"""
#通过索引顺序获取
worksheet1 = workbook.sheets()[0]
#或
worksheet1 = workbook.sheet_by_index(0)
"""
"""
#遍历所有sheet对象
for worksheet_name in worksheets:
worksheet = workbook.sheet_by_name(worksheet_name)
"""


#遍历sheet1中所有行row
num_rows = worksheet1.nrows
for curr_row in range(num_rows):
row = worksheet1.row_values(curr_row)
print('row%s is %s' %(curr_row,row))
#遍历sheet1中所有列col
num_cols = worksheet1.ncols
for curr_col in range(num_cols):
col = worksheet1.col_values(curr_col)
print('col%s is %s' %(curr_col,col))
#遍历sheet1中所有单元格cell
for rown in range(num_rows):
for coln in range(num_cols):
cell = worksheet1.cell_value(rown,coln)
print cell

方法二:使用xlutils+xlrd来处理excel数据

示例:向excel文件中写入数据

import xlrd
import xlutils.copy
#打开一个xls文件
rb = xlrd.open_workbook('test.xls')
wb = xlutils.copy.copy(rb)

#获取sheet对象,通过sheet_by_index()获取的sheet对象没有write()方法
ws = wb.get_sheet(0)

#写入数据
ws.write(1, 1, 'changed!')

#添加sheet页
wb.add_sheet('sheetnnn2',cell_overwrite_ok=True)

#利用保存时同名覆盖达到修改excel文件的目的,注意未被修改的内容保持不变
wb.save('test.xls')

方法三:使用xlwt来处理excel数据

示例1:新建excel文件并写入数据

import xlwt
#创建workbook和sheet对象
workbook = xlwt.Workbook() #注意Workbook的开头W要大写
sheet1 = workbook.add_sheet('sheet1',cell_overwrite_ok=True)
sheet2 = workbook.add_sheet('sheet2',cell_overwrite_ok=True)

#向sheet页中写入数据
sheet1.write(0,0,'this should overwrite1')
sheet1.write(0,1,'aaaaaaaaaaaa')
sheet2.write(0,0,'this should overwrite2')
sheet2.write(1,2,'bbbbbbbbbbbbb')

#保存该excel文件,有同名文件时直接覆盖
workbook.save('test.xls')
print '创建excel文件完成!'

方法四:使用pyExcelerator来处理excel数据

示例1:读excel文件中的数据

import pyExcelerator
#parse_xls返回一个列表,每项都是一个sheet页的数据。
#每项是一个二元组(表名,单元格数据)。其中单元格数据为一个字典,键值就是单元格的索引(i,j)。如果某个单元格无数据,那么就不存在这个值
sheets = pyExcelerator.parse_xls('test.xls')
print sheets

示例2:新建excel文件并写入数据

import pyExcelerator
#创建workbook和sheet对象
wb = pyExcelerator.Workbook()
ws = wb.add_sheet(u'第一页')

#设置样式
myfont = pyExcelerator.Font()
myfont.name = u'Times New Roman'
myfont.bold = True
mystyle = pyExcelerator.XFStyle()
mystyle.font = myfont

#写入数据,使用样式
ws.write(0,0,u'ni hao 帕索!',mystyle)

#保存该excel文件,有同名文件时直接覆盖
wb.save('E:\Code\Python\mini.xls')
print '创建excel文件完成!'

方法五:使用Pandas库来处理excel数据

示例1:读取excel数据

#导入pandas模块
import pandas as pd
#直接默认读取到这个Excel的第一个表单
sheet = pd.read_excel('test.xls')

#默认读取前5行数据
data=sheet.head()
print("获取到所有的值:
{0}".format(data))#格式化
输出 #也可以通过指定表单名来读取数据 sheet2=pd.read_excel('test.xlsx',sheet_name='userRegister') data2=sheet2.head()#默认读取前5行数据 print("获取到所有的值: {0}".format(data2))#格式化输出

示例2:操作Excel中的行列

#导入pandas模块
import pandas as pd
sheet=pd.read_excel('webservice_testcase.xlsx')#这个会直接默认读取到这个Excel的第一个表单

#读取制定的某一行数据:
data=sheet.ix[0].values #0表示第一行 这里读取数据并不包含表头
print("读取指定行的数据:
{0}".format(data))

#读取指定的多行:
data2=sheet.ix[[0,1]].values 
print("读取指定行的数据:
{0}".format(data2))

#读取指定行列的数据:
data3=sheet.ix[0,1]#读取第一行第二列的值
print("读取指定行的数据:
{0}".format(data3))

#读取指定的多行多列的值:
data4=sheet.ix[[1,2],['姓名','电话']].values #读取第二行第三行的姓名以及电话列的值,这里需要嵌套列表
print("读取指定行的数据:
{0}".format(data4))

#读取所有行指定的列的值:
data5=sheet.ix[:,['姓名','电话']].values #姓名以及电话列的值
print("读取指定行的数据:
{0}".format(data5))

#获取行号
输出: print("输出行号列表",sheet.index.values) #获取列名输出: print("输出列标题",sheet.columns.values)
显示全文