pandas入门

By 陆勤 at 2019-03-08 • 1人收藏 • 135人看过

pandas提供让数据分析工作变得更快更简单的高级数据结构和操作工具。

pandas为利用Python做数据分析提供了一套全面而高效地解决方案。

pandas是基于Numpy构建的,让以Numpy为中心的应用变得更加简单和便利。


因而,利用Python做数据分析,学习和使用pandas,值得为之努力,付出和实践。


pandas-logo.png

一 pandas的数据结构


pandas 两个最基本的数据结构:Series和DataFrame


1 Series(序列)

Series类似于一维数组对象,它由一组数据(各种Numpy数据类型)以及一组与之相关的标签(即索引)组成。


导入Python相应库和做相应配置(建议在Jupyter Notebook编写和测试)

import pandas as pd
from pandas import Series, DataFrame

import numpy as np
import matplotlib.pyplot as plt
import warnings

np.random.seed(12345)
np.set_printoptions(precision=4, suppress=True)
plt.rc("figure", figsize=(10, 6))
PREVIOUS_MAX_ROWS = pd.options.display.max_rows
pd.options.display.max_rows = 20
warnings.filterwarnings("ignore")


构建Series序列

obj = pd.Series([1, 2, 3, 4])
obj

结果:

0    1
1    2
2    3
3    4
dtype: int64

利用序列的values和index属性获取其数组表示形式和索引对象

obj.values

结果:

array([1, 2, 3, 4], dtype=int64)

obj.index

结果:

RangeIndex(start=0, stop=4, step=1)


Series函数的参数index设置自定义的索引

obj2 = Series([1, 100, 1000, 10000], index = ["a", "b", "c", "d"])
obj2

结果:

a        1
b      100
c     1000
d    10000
dtype: int64


通过索引方式选择序列对象中单个或者一组值。

obj2["a"]

1

obj2[["a", "d", "c"]]

结果:

a    1
d    10000
c    1000
dtype: int64


登录后方可回帖

信息栏
数据人网是数据人学习、交流和分享的平台,专注于从数据中学习,努力发觉数据之洞见,积极利用数据之价值
Loading...