在 Python 中回测投资组合

问题描述

我正在尝试对 Markowitz 投资组合进行回测。到目前为止,我已经尝试过 zipline、backTrader 和 QSTrader(虽然 QSTrader 可以工作,但没有文档,所以很难)。我没有像我想要的那样创建回测。

我的数据结构是一个由 200 只不同股票调整后的收盘价组成的 csv。我想每季度或每年进行一次投资组合再平衡。我已经有了实际投资组合优化的代码和它返回的权重。我只需要一个实际的框架来插入这些权重,然后每年每季度重新计算一次。到目前为止,我已经使用了大约 5 个小时,我只是无法进行任何回测。 Zipline 在处理数据方面非常令人困惑,在导入具有我描述的结构的本地 csv 时更是如此。 BackTrader 也遇到了同样的问题。 QSTrader 似乎对我不起作用,它在加载数据后抛出以下错误

Traceback (most recent call last):
  File "d:\Finansiering. Modern Portfolio Theory Projekt\Finansiering_BackTrader.py",line 53,in <module>
    strategy_backtest.run()
  File "D:\Anaconda\envs\zipline\lib\site-packages\qsTrader\Trading\backtest.py",line 398,in run
    self.qts(dt,stats=stats)
  File "D:\Anaconda\envs\zipline\lib\site-packages\qsTrader\system\qts.py",line 172,in __call__
    rebalance_orders = self.portfolio_construction_model(dt,stats=stats)
  File "D:\Anaconda\envs\zipline\lib\site-packages\qsTrader\portcon\pcm.py",line 289,in __call__
    target_portfolio = self._generate_target_portfolio(dt,full_weights)
  File "D:\Anaconda\envs\zipline\lib\site-packages\qsTrader\portcon\pcm.py",line 139,in _generate_target_portfolio
    return self.order_sizer(dt,weights)
  File "D:\Anaconda\envs\zipline\lib\site-packages\qsTrader\portcon\order_sizer\dollar_weighted.py",line 168,in __call__
    'modifying the backtest start date and re-running.' % (asset,dt)
ValueError: Asset price for "A" at timestamp "2006-01-31 21:00:00+00:00" is Not-a-Number (NaN). This can occur if the chosen backtest start date is earlier than the first available price for a particular asset. Try modifying the backtest start date and re-running.

回测的开始日期是正确的,基本上在月末需要重新平衡的时候它只是中风。我也无法解决这个问题。

我希望有人对此有半即插即用的解决方案。

解决方法

我对 zipline 也没有什么经验,但似乎 zipline 使用 data_bundle 类处理数据。文档确实不是很清楚。您可能需要执行以下操作:

  1. 格式化 csv 文件中的数据 - 最好为此构建一个函数。数据包的严格格式包含在自定义 csv 包部分下的文档中。请记住,它们需要具有完全相同的开始和结束日期,与您的交易日历保持一致,并且具有与文档中提供的 csv 完全相同的格式。

  2. 您应该有一个“.zipline”文件夹,在其中创建/编辑 extension.py,内容如下: 1) 注册交易日历; 2) 注册自定义 csv 包 - 两者都可以在文档中找到。

  3. 在提示中输入 $zipline ingest -b [bundle_name] - 这应该会摄取数据。

  4. 使用“符号”调用每个资产的数据,并在运行回测时指定包名称。

希望能帮到你。