Python pandas索引如何设置和修改-编程学习网

这篇“Python pandas索引如何设置和修改”文章的知识点大部分人都不太理解，所以小编给大家总结了以下内容，内容详细，步骤清晰，具有一定的借鉴价值，希望大家阅读完这篇文章能有所收获，下面我们一起来看看这篇“Python pandas索引如何设置和修改”文章吧。

创建索引

快速回顾下Pandas创建索引的常见方法：

pd.Index

In [1]:

import pandas as pdimport numpy as np

In [2]:

# 指定类型和名称s1 = pd.Index([1,2,3,4,5,6,7],          dtype="int",         name="Peter")s1

Out[2]:

Int64Index([1, 2, 3, 4, 5, 6, 7], dtype='int64', name='Peter')

pd.IntervalIndex

新的间隔索引 IntervalIndex 通常使用 interval_range()函数来进行构造，它使用的是数据或者数值区间，基本用法：

In [3]:

s2 = pd.interval_range(start=0, end=6, closed="left")s2

Out[3]:

IntervalIndex([[0, 1), [1, 2), [2, 3), [3, 4), [4, 5), [5, 6)],              closed='left',              dtype='interval[int64]')

pd.CategoricalIndex

In [4]:

s3 = pd.CategoricalIndex(    # 待排序的数据    ["S","M","L","XS","M","L","S","M","L","XL"],    # 指定分类顺序    categories=["XS","S","M","L","XL"],    # 排需    ordered=True,    # 索引名字    name="category")s3

Out[4]:

CategoricalIndex(['S', 'M', 'L', 'XS', 'M', 'L', 'S', 'M', 'L', 'XL'], categories=['XS', 'S', 'M', 'L', 'XL'], ordered=True, name='category', dtype='category')

pd.DatetimeIndex

以时间和日期作为索引，通过date_range函数来生成，具体例子为：

In [5]:

# 日期作为索引，D代表天s4 = pd.date_range("2022-01-01",periods=6, freq="D")s4

Out[5]:

DatetimeIndex(['2022-01-01', '2022-01-02', '2022-01-03', '2022-01-04','2022-01-05', '2022-01-06'],              dtype='datetime64[ns]', freq='D')

pd.PeriodIndex

pd.PeriodIndex是一个专门针对周期性数据的索引，方便针对具有一定周期的数据进行处理，具体用法如下：

In [6]:

s5 = pd.PeriodIndex(['2022-01-01', '2022-01-02', '2022-01-03', '2022-01-04'], freq = '2H')s5

Out[6]:

PeriodIndex(['2022-01-01 00:00', '2022-01-02 00:00', '2022-01-03 00:00','2022-01-04 00:00'],            dtype='period[2H]', freq='2H')

pd.TimedeltaIndex

In [7]:

data = pd.timedelta_range(start='1 day', end='3 days', freq='6H')data

Out[7]:

TimedeltaIndex(['1 days 00:00:00', '1 days 06:00:00', '1 days 12:00:00',                '1 days 18:00:00', '2 days 00:00:00', '2 days 06:00:00',                '2 days 12:00:00', '2 days 18:00:00', '3 days 00:00:00'],               dtype='timedelta64[ns]', freq='6H')

In [8]:

s6 = pd.TimedeltaIndex(data)s6

Out[8]:

TimedeltaIndex(['1 days 00:00:00', '1 days 06:00:00', '1 days 12:00:00',                '1 days 18:00:00', '2 days 00:00:00', '2 days 06:00:00',                '2 days 12:00:00', '2 days 18:00:00', '3 days 00:00:00'],               dtype='timedelta64[ns]', freq='6H')

读取数据

下面通过一份简单的数据来讲解4个函数的使用。数据如下：

Python pandas索引如何设置和修改

set_index

设置单层索引

In [10]:

# 设置单层索引df1 = df.set_index("name")df1

Python pandas索引如何设置和修改

我们发现df1的索引已经变成了name字段的相关值。

下面是设置多层索引：

# 设置两层索引df2 = df.set_index(["sex","name"])df2

Python pandas索引如何设置和修改

reset_index

对索引的重置：

Python pandas索引如何设置和修改

针对多层索引的重置：

Python pandas索引如何设置和修改

多层索引直接原地修改：

Python pandas索引如何设置和修改

set_axis

将指定的数据分配给所需要的轴axis。其中axis=0代表行方向，axis=1代表列方向。

两种不同的写法：

axis=0 等价于  axis="index"axis=1 等价于  axis="columns"

操作行索引

Python pandas索引如何设置和修改

使用 index 效果相同：

Python pandas索引如何设置和修改

原来的df2是没有改变的。如果我们想改变生效，同样也可以直接原地修改：

Python pandas索引如何设置和修改

操作列索引

针对axis=1或者axis="columns"方向上的操作。

直接传入我们需要修改的新名称：

Python pandas索引如何设置和修改

使用axis="columns"效果相同：

Python pandas索引如何设置和修改

同样也可以直接原地修改：

Python pandas索引如何设置和修改

rename

给行索引或者列索引进行重命名，假设我们的原始数据如下：

Python pandas索引如何设置和修改

字典形式

通过传入的一个或者多个属性的字典形式进行修改：

In [29]:

# 修改单个列索引；非原地修改df2.rename(columns={"Sex":"sex"})

Python pandas索引如何设置和修改

同时修改多个列属性的名称：

Python pandas索引如何设置和修改

函数形式

通过传入的函数进行修改：

In [31]:

# 传入函数df2.rename(str.upper, axis="columns")

Python pandas索引如何设置和修改

也可以使用匿名函数lambda：

# 全部变成小写df2.rename(lambda x: x.lower(), axis="columns")

Python pandas索引如何设置和修改

使用案例

In [33]:

在这里我们使用的是可视化库plotly_express库中的自带数据集tips：

import plotly_express as pxtips = px.data.tips()  tips

Python pandas索引如何设置和修改

按日统计总消费

In [34]:

df3 = tips.groupby("day")["total_bill"].sum()df3

Out[34]:

dayFri      325.88Sat     1778.40Sun     1627.16Thur    1096.33Name: total_bill, dtype: float64

In [35]:

我们发现df3其实是一个Series型的数据：

type(df3)   # Series型的数据

Out[35]:

pandas.core.series.Series

In [36]:

下面我们通过reset_index函数将其变成了DataFrame数据：

df4 = df3.reset_index()df4

Python pandas索引如何设置和修改

我们把列方向上的索引重新命名下：

In [37]:

# 直接原地修改df4.rename(columns={"day":"Day", "total_bill":"Amount"},            inplace=True)df4

Python pandas索引如何设置和修改

按日、性别统计小费均值，消费总和

In [38]:

df5 = tips.groupby(["day","sex"]).agg({"tip":"mean", "total_bill":"sum"})df5

Python pandas索引如何设置和修改

我们发现df5是df5是一个具有多层索引的数据框：

In [39]:

type(df5)

Out[39]:

pandas.core.frame.DataFrame

我们可以选择重置其中一个索引：

Python pandas索引如何设置和修改

在重置索引的同时，直接丢弃原来的字段信息：下面的sex信息被删除

In [41]:

df5.reset_index(["sex"],drop=True)  # 非原地修改

Python pandas索引如何设置和修改

列方向上的索引直接原地修改：

df5.reset_index(inplace=True)  # 原地修改df5

Python pandas索引如何设置和修改

笨方法

最后介绍一个笨方法来修改列索引的名称：就是将新的名称通过列表的形式全部赋值给数据框的columns属性

Python pandas索引如何设置和修改

在列索引个数少的时候用起来挺方便的，如果多了不建议使用。

以上就是关于“Python pandas索引如何设置和修改”这篇文章的内容，相信大家都有了一定的了解，希望小编分享的内容对大家有帮助，若想了解更多相关的知识内容，请关注编程网行业资讯频道。

文章详情

Python pandas索引如何设置和修改

创建索引

pd.Index

pd.IntervalIndex

pd.CategoricalIndex

pd.DatetimeIndex

pd.PeriodIndex

pd.TimedeltaIndex

读取数据

set_index

reset_index

set_axis

操作行索引

操作列索引

rename

字典形式

函数形式

使用案例

按日统计总消费

按日、性别统计小费均值，消费总和

笨方法

软考中级精品资料免费领

相关文章

猜你喜欢

Python pandas索引如何设置和修改

Python pandas索引的设置和修改方法

python如何设置函数索引

Pandas reindex重置索引如何使用

python怎么修改索引和行列

mysql如何修改索引类型

mysql如何进行索引修改

Python Pandas如何获取和修改任意位置的值（at,iat,loc,iloc）

如何修改XP设置

win10重建索引如何设置

oracle位图索引的字段如何修改

win10字体设置如何修改

如何在设置中修改Windows

oracle设置索引失效如何解决

数据库建表如何设置索引名

win8电脑要如何更改索引缓存位置

python如何修改yaml配置文件

ubuntu如何修改读写权限设置

你是否知道如何在Go中读取和修改Git索引文件？

ubuntu如何修改休眠时间设置