我试图建立一个类中所有属性的名称列表,这些类要么是pandas DataFrames,要么是Series.
以下工作有效,但似乎很慢,因为它遍历了dir()列出的每个属性,包括特殊方法(这些特殊方法不会是DataFrames,因此不需要检查它们).它似乎也可以用其他方法执行print语句,因此不确定是否正在运行其他属性(不需要).
my_instance = MyClass()
pd_objects = [attr for attr in dir(my_instance) if
isinstance(getattr(my_instance, attr), pd.DataFrame)
or isinstance(getattr(my_instance, attr), pd.Series)]
有什么想法可以更高效地快速列出分配给熊猫对象的属性,也许使用检查模块?
解决方法:
您要使用__dict__.
class A(object):
def __init__(self):
self.df2 = pd.DataFrame({'df2': range(5)})
self.sr2 = pd.Series(range(5))
self.x = 4
self.y = 'abc'
self.z = []
def get_attributes_of_type(cls, types):
return [i for _, i in cls.__dict__.iteritems() if isinstance(i, types)]
然后像这样使用它:
my_A = A()
get_attributes_of_type(my_A, (pd.Series, pd.DataFrame))
[0 0
1 1
2 2
3 3
4 4
dtype: int64, df2
0 0
1 1
2 2
3 3
4 4]
get_attributes_of_type(my_A, list)
[[]]
get_attributes_of_type(my_A, str)
['abc']
get_attributes_of_type(my_A, int)
[4]