在 Python 中使用 Pandas 和系列对数据进行数据挖掘?

问题描述

[Data_Image_Part_1]

1

[Data_Imagine_Part_2]

2

[列名和索引名(忘记在图片第 1 部分添加]

3


我试图找出这个数据集:

  1. 如何找到FIDN为30的学生的专业?
    我的想法:df_test.get_value(30,'Major')
    但我不知道这是否正确

  2. 如何按姓氏和学费对所有学生进行排序?
    我的想法:df_test.sort_values( ['LastName','tuition'] )
    但这不起作用,只输出列名和索引名:(

解决方法

  1. df_test[df_test["FIDN"] == 30]["Major"]
    或:df_test.loc[df_test["FIDN"] == 30]["Major"]
    https://stackoverflow.com/a/17071908/9169359

  2. df_test.sort_values(by=["LastName","tuition"],ascending=False)
    https://pandas.pydata.org/pandas-docs/stable/reference/api/pandas.DataFrame.sort_values.html