189人加入学习
2023年广东省大学生计算机设计大赛
价格 免费
抱歉,该课程为限制课程,请联系客服
  • 数据框的常用属性 
  1. values将数据框返回数组形式
  2. index  数据框的行索引
  3. columns  数据的列名
  4. types  数据类型
  5. size  元素个数
  6. ndim  维度数
  7. shape  行、列的个数
[展开全文]

对单列数据的访问:DataFramef的单列数据为一个Series.根据DataFrame是一个带有标签的二维数组,每个标签相当每一列的列名。有以下两种方式实现对单列数据的访问。

  1. 以字典访问某一个key的值的方式使用对应的列名,实现单列数据的访问。
  2. 以属性的方式访问,实现单列数据的访问。(不建议使用,易引起混淆)
d=[[1.3,2.0,3,4],[2,4,1,4],[2,5,1.9,7],[3,1,0,11]]
print(d)
df = pd.DataFrame(d,index=['a','b','c','d'],columns=['A','B','C','D'])
print(df['列名称']) #单列数据访问
print(df[['列名称','列名称']]) #多列数据访问
print(df.head(n))  #访问数据前n行
print(df.tail(n))  #访问数据后n行
print(df.iloc[0,0])  #按照行列数据进行数据访问
print(df.iloc[0:3,0])

  

[展开全文]

Series是一个特殊的DataFrame

 

[展开全文]

存储文件

data_excel.to_excel('文件路径',index=None)

[展开全文]

#读取Excel文件

data_excel = pd.read_excel('文件路径',sheet_name='工作表名称')

data.excel

[展开全文]
  • 掌握DataFrame的常用操作
  1. Series系列
ser1 = pd.Series([1,2,'a'],index=['a','b','c'])
print(ser1)
ser2 = pd.Series({'a':[1,2,3],'b':['1','2','3']})
print(ser2)
d=[[1.3,2.0,3,4],[2,4,1,4],[2,5,1.9,7],[3,1,0,11]]
print(d)
df = pd.DataFrame(d,index=['a','b','c','d'],columns=['A','B','C','D'])
print(df)



d={'color':['blue','green','yellow','red','while'],
    'object':['ball','pen','pencil','paper','mug'],
    'print':[1.2,1.0,0.6,0.9,1.7]}
frame = pd.DataFrame(d, index=['a','b','c','d','e'])
peint(frame)

 

[展开全文]
  •  将数据框存储为Excel文件
data_excel.to_excel('存储路径',index='None',sheet_name='对应工作表')
[展开全文]
  • 读取Excel文件d

  

data_excel = pd.read_excel('读取路径', sheet_name='对应工作表')

 

[展开全文]
  • 将数据框存储为文本文档数据
  1. data_csv.to_csv
  2.  

 

data_csv.to_csv('存储路径',index='None')
[展开全文]
  • 数据读取
  1. pandas.read_csv : 读取文件
  2. sep :指定文本分隔符的参数,如果分隔符指定错误,在读取数据的时候,每一行数据将连成一片。
  3. header参数是用来指定列名的,如果是None则会添加一个默认的列名。
  4. encoding代表文件的编码格式,常用发的编码有utf-8、utf-16、gbk、gb2312、gb18030等。如果编码指定错误数据将无法读取,IPython解释器会报解析错误。
import pandas as pd

data_txt = pd.read_csv('文档路径',sep=' ',encoding=' ')

data_txt

 

[展开全文]