使用旋转矩阵和常规图像网络标准偏差计算灰度图像网络像素值的标准偏差

问题描述

我想训练一些模型来处理灰度图像,例如对显微镜应用很有用 (Source)。因此,我想在灰度图像网络上训练我的模型,使用 pytorch 灰度转换 (torchvision.transforms.Grayscale),将 RGB 图像网络转换为灰度图像网络。 pytorch 内部将颜色空间从 RGB 旋转到 YPbPr,如下所示:

enter image description here

Y'则是灰度通道,因此变换后可以忽略Pb和Pr。其实pytorch甚至只计算

grayscale = (0.2989 * r + 0.587 * g + 0.114 * b)

为了标准化图像数据,我需要知道灰度图像网络的平均像素值,以及标准偏差。可以计算这些吗?

我成功地使用

计算了平均像素强度
meanGrayscale = 0.2989 * r.mean() + 0.587 * g.mean() + 0.114 * b.mean()

转换图像,然后计算灰度平均值,得到的结果与首先计算 RGB 平均值,然后将它们转换为灰度平均值的结果相同。

但是,我现在在计算方差或标准偏差时一无所知。有人有任何想法,或者知道一些关于这个主题的好文献吗?这甚至可能吗?

我找到了一个出版物“Jianxin Gong - Clarifying the Standard Deviational Ellipse”......他在那里做了二维(据我所知)。我只是不知道如何在 3D 中做到这一点。

解决方法

好的,我无法按计划计算标准偏差,但使用下面的代码进行了计算。灰度图像网络的训练数据集均值和标准差为(随心所欲地四舍五入):

平均值:0.44531356896770125

标准偏差:0.2692461874154524

import multiprocessing
import os

def calcSTD(d):
    meanValue = 0.44531356896770125
    squaredError = 0
    numberOfPixels = 0
    for f in os.listdir("/home/imagenet/ILSVRC/Data/CLS-LOC/train/"+str(d)+"/"): 
        if f.endswith(".JPEG"):
            
            image = imread("/home/imagenet/ILSVRC/Data/CLS-LOC/train/"+str(d)+"/"+str(f))
                
            ###Transform to gray if not already gray anyways  
            if  np.array(image).ndim == 3:
                matrix = np.array(image)
                blue = matrix[:,:,0]/255
                green = matrix[:,1]/255
                red = matrix[:,2]/255
                gray = (0.2989 * red + 0.587 * green + 0.114 * blue)
            else:
                gray = np.array(image)/255
            ###----------------------------------------------------       
                    
            for line in gray:
                for pixel in line:
                    squaredError += (pixel-meanValue)**2
                    numberOfPixels += 1
    
    return (squaredError,numberOfPixels)

a_pool = multiprocessing.Pool()
folders = []
[folders.append(f.name) for f in os.scandir("/home/imagenet/ILSVRC/Data/CLS-LOC/train") if f.is_dir()]
resultStD = a_pool.map(calcSTD,folders)

StD = (sum([intensity[0] for intensity in resultStD])/sum([pixels[1] for pixels in resultStD]))**0.5
print(StD)

在这个过程中出现了一些这样的错误:

/opt/conda/lib/python3.7/site-packages/PIL/TiffImagePlugin.py:771: 用户警告:可能已损坏 EXIF 数据。期望读取 8 个字节 但只得到 4. 跳过标签 41486“可能损坏的 EXIF 数据。”

跳过了 2019 版 ImageNet 中的各个图像。

相关问答

错误1:Request method ‘DELETE‘ not supported 错误还原:...
错误1:启动docker镜像时报错:Error response from daemon:...
错误1:private field ‘xxx‘ is never assigned 按Alt...
报错如下,通过源不能下载,最后警告pip需升级版本 Requirem...