问题描述
预先道歉,因为我在技术上对我想用python解决的问题有一些疑问,但是由于它们是相关的,所以我将其全部发表在了一篇文章中(至少我希望这对任何人来说都是一个值得挑战的挑战可以帮助我)。
我有以下名为df
的熊猫数据框:
REF Period Product Price Type QTY
T001 Jan-20 EQ 69.87 Sell -10
T001 Feb-21 EQ 69.77 Buy 10
T002 Apr-20 BN 10.77 Buy 15
T003 Jul-20 EQ 71.25 Sell -20
T003 Aug-20 EQ 70.89 Buy 40
T003 Sep-20 EQ 70.69 Sell -20
T004 Nov-20 BN 20.83 Buy 10
T004 Dec-20 EQ 40.01 Sell 12
T005 Sep-20 FD 31.25 Buy -20
T005 Mar-21 FD 36.89 Sell 40
T005 Sep-21 FD 40.69 Buy -20
您可以看到REF
列是我要分析的投资组合的交易参考。
我一直在努力寻找以下数据分析问题的解决方案:
我希望python遍历交易参考列的每一行,并且:
-
如果
REF
是唯一的(该列中没有重复项),则TradE_TYPE
应该为=“ Flat” + df [Period](即“ Flat Apr-20”)和{ {1}}应该是该行的df [Type] -
如果两行中的
DIRECTION
是相同的,则这些行中的REF
是相同的,这些行中的Product
是不同的,而Period
是不同(一个是卖出,另一个是买入),则这些行中的Type
应该=“ Spread”,并且TradE_TYPE
应该等于第一行的类型(即,如果2的第一行显示卖出然后卖出,反之亦然) -
如果
DIRECTION
在3行中相同,则REF
在这些行中相同,Product
在这些行中不同,并且{{这些行中的1}}等于零,那么Period
应该等于“ Trio”,而QTY
应该等于第一行的类型(即,如果3的第一行是卖出,第二行是买入)第三个是卖出,则应该选择第一个的值) -
如果两行中的
TradE_TYPE
是相同的,但是DIRECTION
是不同的,则REF
应该等于“套利”并且Product
应该等于第一行的TradE_TYPE
(即,如果2的第一行显示“卖出”,则其为卖出,反之亦然)
如果以上表为例,最终结果应该是这样的:
DIRECTION
有人可以帮助解决这个问题或为我指明正确的方向吗? (如果有条件的话,如何在行和列上同时进行迭代和使用等)。
非常感谢您的提前帮助!
解决方法
大约-您需要执行df.groupby(["REF","Product"]).count()
,这将为您提供一个仅包含引用,乘积和计数的表。从那里,您可以使用RAW_TRADE_TYPE
或where()
在select()
中投射/加入“平面”,“扩展”或“三重奏”之一。
您可以join()
到原始表。从那里,您将获得所需的所有信息,以按照您的描述计算列。