使用 libav (ffmpeg) 进行 RGB 到 YUV 的转换三次图像

问题描述

我正在构建一个小程序来捕获视频的屏幕(使用 X11 MIT-SHM extension)。如果我为捕获的帧创建单独的 PNG 文件,它会很好用,但现在我正在尝试集成 libav (ffmpeg) 来创建视频,我得到了......有趣的结果。

我能达到的最远是这个。预期的结果(这是直接从 XImage 文件的 RGB 数据创建的 PNG)是这样的:

Expected result

然而,我得到的结果是:

Obtained result

如您所见,颜色很时髦,图像被裁剪了三遍。我有一个捕获屏幕的循环,首先我生成单独的 PNG 文件(当前在下面的代码中注释),然后我尝试使用 libswscale 从 RGB24 转换为 YUV420:

while (gRunning) {
        printf("Processing frame framecnt=%i \n",framecnt);

        if (!XShmGetimage(display,Rootwindow(display,DefaultScreen(display)),img,AllPlanes)) {
            printf("\n Ooops.. Something is wrong.");
            break;
        }

        // PNG generation
        // snprintf(imageName,sizeof(imageName),"salida_%i.png",framecnt);
        // writePngForImage(img,width,height,imageName);

        unsigned long red_mask = img->red_mask;
        unsigned long green_mask = img->green_mask;
        unsigned long blue_mask = img->blue_mask;

        // Write image data
        for (int y = 0; y < height; y++) {
            for (int x = 0; x < width; x++) {
                unsigned long pixel = XGetPixel(img,x,y);

                unsigned char blue = pixel & blue_mask;
                unsigned char green = (pixel & green_mask) >> 8;
                unsigned char red = (pixel & red_mask) >> 16;

                pixel_rgb_data[y * width + x * 3] = red;
                pixel_rgb_data[y * width + x * 3 + 1] = green;
                pixel_rgb_data[y * width + x * 3 + 2] = blue;
            }
        }

        uint8_t* inData[1] = { pixel_rgb_data };
        int inLinesize[1] = { in_w };

        printf("Scaling frame... \n");
        int sliceHeight = sws_scale(sws_context,inData,inLinesize,pFrame->data,pFrame->linesize);

        printf("Obtained slice height: %i \n",sliceHeight);
        pFrame->pts = framecnt * (pVideoStream->time_base.den) / ((pVideoStream->time_base.num) * 25);

        printf("Frame pts: %li \n",pFrame->pts);
        int got_picture = 0;

        printf("Encoding frame... \n");
        int ret = avcodec_encode_video2(pCodecCtx,&pkt,pFrame,&got_picture);

//                int ret = avcodec_send_frame(pCodecCtx,pFrame);

        if (ret != 0) {
            printf("Failed to encode! Error: %i\n",ret);
            return -1;
        }

        printf("Succeed to encode frame: %5d - size: %5d\n",framecnt,pkt.size);

        framecnt++;

        pkt.stream_index = pVideoStream->index;
        ret = av_write_frame(pformatCtx,&pkt);

        if (ret != 0) {
            printf("Error writing frame! Error: %framecnt \n",ret);
            return -1;
        }

        av_packet_unref(&pkt);
    }

我已经放置了整个代码 at this gistThis question right here 看起来与我的非常相似,但不完全相同,并且该解决方案对我不起作用,尽管我认为这与计算行距的方式有关。

解决方法

不要使用yum install php-xml ,使用av_image_alloc

(与您的问题无关,但现在使用 av_frame_get_buffer 被认为是不好的做法,应替换为 avcodec_encode_video2avcodec_send_frame

,

最后,错误不在于libav的使用,而在于将像素数据从XImage填充到rgb向量的代码。而不是使用:

                pixel_rgb_data[y * width + x * 3    ] = red;
                pixel_rgb_data[y * width + x * 3 + 1] = green;
                pixel_rgb_data[y * width + x * 3 + 2] = blue;

我应该使用这个:

                pixel_rgb_data[3 * (y * width + x)    ] = red;
                pixel_rgb_data[3 * (y * width + x) + 1] = green;
                pixel_rgb_data[3 * (y * width + x) + 2] = blue;

不知何故,我只乘了矩阵内的水平位移,而不是垂直位移。我改变它的那一刻,它完美地工作。