问题描述
我在一个团队中使用 dvc 和 git 来控制数据文件。我们正在使用 dvc 1.3.1 和 S3 存储桶遥控器。在同事的分支上执行 dvc fetch
或 dvc pull
时出现此错误:
ERROR: Failed to fetch data from the cloud - DVC-file 'C:\Users\blah\Documents\repo\data\processed_data.dvc' format error: extra keys not allowed @ data['outs'][0]['size']
md5: ded591aacbe363f0518ceb9c3bc1836b
outs:
- md5: efdab20e8b59903b9523cc188ff727e5
path: completion_header.p
cache: true
metric: false
persist: false
但有问题的文件只有这个:
outs:
- md5: f4e15187d9a0bbb328e629eabd8d1784.dir
size: 112007
nfiles: 3
path: processed_data
在所有情况下,文件都使用命令 dvc add %dirname%
添加到 dvc。这是我第二次在同事的分支机构(2 个不同的人)上看到这种情况。
自从发帖后,我意识到我的同事 dvc'd 一个目录。我曾尝试先创建目录,然后调用 dvc fetch
,但得到相同的错误。
解决方法
在所有情况下,使用命令 dvc add %filename% 将文件添加到 dvc。
在较新版本的 dvc 中创建的 dvc 文件之一似乎很有可能您正尝试使用较旧版本进行操作。添加新文件时,您的所有同事是否都使用相同的 dvc 版本?