这篇文章将为大家详细讲解有关pandas筛选数值列和非数值列方式,小编觉得挺实用的,因此分享给大家做个参考,希望大家阅读完这篇文章后可以有所收获。
筛选数值列
- 使用 is_numeric() 方法:此方法返回一个布尔掩码,其中 True 表示数值列,False 表示非数值列。
import pandas as pd
df = pd.DataFrame({"name": ["Alice", "Bob", "Charlie"], "age": [20, 25, 30]})
numerical_columns = df.select_dtypes(include=[np.number]).columns print(numerical_columns)
输出:
Index(["age"], dtype="object")
* **使用 to_numeric() 方法:**此方法将对象列转换为数值列,从而使筛选更容易。
```python
df = pd.DataFrame({"name": ["Alice", "Bob", "Charlie"], "age": ["20", "25", "30"]})
df["age"] = pd.to_numeric(df["age"])
numerical_columns = df.select_dtypes(include=[np.number]).columns
print(numerical_columns)
输出:
Index(["age"], dtype="object")
筛选非数值列
- 使用 is_object() 方法:此方法返回一个布尔掩码,其中 True 表示对象列,False 表示非对象列。
import pandas as pd
df = pd.DataFrame({"name": ["Alice", "Bob", "Charlie"], "age": [20, 25, 30]})
non_numerical_columns = df.select_dtypes(include=[np.object]).columns print(non_numerical_columns)
输出:
Index(["name"], dtype="object")
* **使用 all() 和 isna() 方法:**此方法筛选所有列中不包含任何缺失值的非数值列。
```python
df = pd.DataFrame({"name": ["Alice", "Bob", "Charlie"], "age": [20, np.nan, 30]})
non_numerical_columns = df.select_dtypes(include=[np.object]).apply(lambda x: x.all() and not x.isnull()).index
print(non_numerical_columns)
输出:
Index(["name"], dtype="object")
以上就是pandas筛选数值列和非数值列方式的详细内容,更多请关注编程学习网其它相关文章!