问题描述
我创建了图像和xml标签文件的数据集,其中图像的原始大小和分辨率比网络要处理的分辨率高得多。 (2700x900,网可处理500x130)。标签是边界框的minx,miny,maxx,maxy,作为原始图片的像素坐标。
<?xml version="1.0" ?>
<annotation>
<folder>JPEGImages</folder>
<filename>picture.jpg</filename>
<size>
<width>2700</width>
<height>900</height>
<depth>3</depth>
</size>
<object>
<name>person</name>
<pose>Unspecified</pose>
<truncated>0</truncated>
<difficult>0</difficult>
<bndbox>
<xmin>1622</xmin>
<ymin>331</ymin>
<xmax>1692</xmax>
<ymax>415</ymax>
</bndbox>
</object>
</annotation>
现在,我想在训练网络之前对此数据集执行转换。例如重新缩放。我该怎么办?
我注意到create_data.sh
脚本会自动重新缩放,但是它如何处理边界框的位置?
如果要删除平均值或更改颜色布局(RGB-> BGR)或进行直方图均衡怎么办?我应该在哪里添加这些?
解决方法
暂无找到可以解决该程序问题的有效方法,小编努力寻找整理中!
如果你已经找到好的解决方法,欢迎将解决方案带上本链接一起发送给小编。
小编邮箱:dio#foxmail.com (将#修改为@)