返回Series
访问DataFrame中的Series,可以使用DataFrame['列名']
方式。
# 加载数据
movies_df = pd.read_csv("IMDB-Movie-Data.csv", index_col="Title")
movies_df.columns = ['rank', 'genre', 'description', 'director', 'actors', 'year', 'runtime',
'rating', 'votes', 'revenue_millions', 'metascore']
# 访问列数据
genre_col = movies_df['genre']
type(genre_col)
输出
<class 'pandas.core.series.Series'>
返回的是一个Series。
返回DataFrame
要提取列作为DataFrame,需要传入列名的列表:DataFrame[['列名1', '列名2', ... '列名n']]
。
在我们的例子中,只有一个列:
genre_col = movies_df[['genre']]
type(genre_col)
输出
<class 'pandas.core.frame.DataFrame'>
可以看到,返回的是一个DataFrame。
添加另一个列:
subset = movies_df[['genre', 'rating']]
subset.head()
输出
genre rating
Title
Guardians of the Galaxy Action,Adventure,Sci-Fi 8.1
Prometheus Adventure,Mystery,Sci-Fi 7.0
Split Horror,Thriller 7.3
Sing Animation,Comedy,Family 7.2
Suicide Squad Action,Adventure,Fantasy 6.2