Caffe预先编写训练数据

问题描述

我创建了图像和xml标签文件的数据集,其中图像的原始大小和分辨率比网络要处理的分辨率高得多。 (2700x900,网可处理500x130)。标签是边界框的minx,miny,maxx,maxy,作为原始图片的像素坐标。

<?xml version="1.0" ?>
<annotation>
    <folder>JPEGImages</folder>
    <filename>picture.jpg</filename>
    <size>
        <width>2700</width>
        <height>900</height>
        <depth>3</depth>
    </size>
    <object>
        <name>person</name>
        <pose>Unspecified</pose>
        <truncated>0</truncated>
        <difficult>0</difficult>
        <bndbox>
            <xmin>1622</xmin>
            <ymin>331</ymin>
            <xmax>1692</xmax>
            <ymax>415</ymax>
        </bndbox>
    </object>
</annotation>

现在,我想在训练网络之前对此数据集执行转换。例如重新缩放。我该怎么办?

我注意到create_data.sh脚本会自动重新缩放,但是它如何处理边界框的位置?

如果要删除平均值或更改颜色布局(RGB-> BGR)或进行直方图均衡怎么办?我应该在哪里添加这些?

解决方法

暂无找到可以解决该程序问题的有效方法,小编努力寻找整理中!

如果你已经找到好的解决方法,欢迎将解决方案带上本链接一起发送给小编。

小编邮箱:dio#foxmail.com (将#修改为@)

相关问答

依赖报错 idea导入项目后依赖报错,解决方案:https://blog....
错误1:代码生成器依赖和mybatis依赖冲突 启动项目时报错如下...
错误1:gradle项目控制台输出为乱码 # 解决方案:https://bl...
错误还原:在查询的过程中,传入的workType为0时,该条件不起...
报错如下,gcc版本太低 ^ server.c:5346:31: 错误:‘struct...