用于图像合成的动态关键点注释

问题描述

我目前正在做一个项目,我需要估计医院病床上的人的姿势,这意味着很多遮挡和主体只能部分看到。

至于现在,我已经对数据进行了注释,并对图片中的人物进行了分割。 我的注释是 COCO 风格的:它们是具有 [X,Y] 坐标的关键点,给出图片中每个人关节的坐标。

预训练模型显示的结果非常有限,我需要创建自己的数据库。 但我想避免整个花费三周的注释部分并综合生成注释数据。

我的问题是我的数据上的注释具有它们自己图片的坐标(有意义),我想将分割区域(带有注释)放在另一张图片上。分割不会在新图片上的完全相同的位置,这意味着注释不会精确定位关节的正确 [X,Y] 坐标。所以我需要找到一种方法来翻译分割参考中的注释(可能是分割的最高点)。

现在我想到的是:

  • 手动分割 ~50-80 张预先标注的图像以提取前景(= 床上的人)

  • 应用同构变换将注释的参考系从 original_img 更改为 mask

  • 通过将分割部分(带注释的人)添加到背景(医院病床)来生成合成图像

  • 应用同构变换将注释的参考系从掩码更改为 new_img

  • 对注释坐标重新应用同构变换,以将它们重新转换为新合成图像中的 coco 样式

这整个过程可能很乏味(主要是为了解析 json 注释文件)所以你能告诉我是否有更简单的方法来做到这一点,或者有人还没有这样做吗?

感谢您的回答

如果你想要更精确的 coco 注释:https://www.immersivelimit.com/tutorials/create-coco-annotations-from-scratch/#create-custom-coco-dataset

解决方法

暂无找到可以解决该程序问题的有效方法,小编努力寻找整理中!

如果你已经找到好的解决方法,欢迎将解决方案带上本链接一起发送给小编。

小编邮箱:dio#foxmail.com (将#修改为@)