视音频数据处理入门：RGB、YUV像素数据处理

=====================================================

视音频数据处理入门系列文章：

视音频数据处理入门：PCM音频采样数据处理

视音频数据处理入门：H.264视频码流解析

视音频数据处理入门：AAC音频码流解析

视音频数据处理入门：FLV封装格式解析

视音频数据处理入门：UDP-RTP协议解析

=====================================================

有段时间没有写博客了，这两天写起博客来竟然感觉有些兴奋，仿佛找回了原来的感觉。前一阵子在梳理以前文章的时候，发现自己虽然总结了各种视音频应用程序，却还缺少一个适合无视音频背景人员学习的“最基础”的程序。因此抽时间将以前写过的代码整理成了一个小项目。这个小项目里面包含了一系列简单的函数，可以对RGB/YUV视频像素数据、PCM音频采样数据、H.264视频码流、AAC音频码流、FLV封装格式数据、UDP/RTP协议数据进行简单处理。这个项目的一大特点就是没有使用任何的第三方类库，完全借助于C语言的基本函数实现了功能。通过对这些代码的学习，可以让初学者迅速掌握视音频数据的基本格式。有关上述几种格式的介绍可以参考文章《[总结]视音频编解码技术零基础学习方法》。

从这篇文章开始打算写6篇文章分别记录上述6种不同类型的视音频数据的处理方法。本文首先记录第一部分即RGB/YUV视频像素数据的处理方法。视频像素数据在视频播放器的解码流程中的位置如下图所示。

本文分别介绍如下几个RGB/YUV视频像素数据处理函数：
分离YUV420P像素数据中的Y、U、V分量
分离YUV444P像素数据中的Y、U、V分量
将YUV420P像素数据去掉颜色（变成灰度图）
将YUV420P像素数据的亮度减半
将YUV420P像素数据的周围加上边框
生成YUV420P格式的灰阶测试图
计算两个YUV420P像素数据的PSNR
分离RGB24像素数据中的R、G、B分量
将RGB24格式像素数据封装为BMP图像
将RGB24格式像素数据转换为YUV420P格式像素数据
生成RGB24格式的彩条测试图
本文中的RGB/YUV文件需要使用RGB/YUV播放器才能查看。YUV播放器种类比较多，例如YUV Player Deluxe，或者开源播放器（参考文章《修改了一个YUV/RGB播放器》）等。

函数列表

(1) 分离YUV420P像素数据中的Y、U、V分量

本程序中的函数可以将YUV420P数据中的Y、U、V三个分量分离开来并保存成三个文件。函数的代码如下所示。

[cpp]view plain copy 
   
 
 /** 
  * Split Y, U, V planes in YUV420P file. 
 * @param url  Location of Input YUV file. 
 * @param w    Width of Input YUV file. 
 * @param h    Height of Input YUV file. 
 * @param num  Number of frames to process. 
 * 
 */  
 int simplest_yuv420_split(char *url, int w,87); font-weight:bold; background-color:inherit">int h,int num){  
     FILE *fp=fopen(url,"rb+");  
     FILE *fp1=fopen("output_420_y.y","wb+");  
FILE *fp2=fopen("output_420_u.y","wb+");  
FILE *fp3=fopen("output_420_v.y",248)">   
     unsigned char *pic=(unsigned char *)malloc(w*h*3/2);  
     for(int i=0;i<num;i++){  
         fread(pic,1,w*h*3/2,fp);  
         //Y  
         fwrite(pic,w*h,fp1);  
//U  
         fwrite(pic+w*h,w*h/4,fp2);  
//V  
         fwrite(pic+w*h*5/4,fp3);  
     }  
   
     free(pic);  
     fclose(fp);  
     fclose(fp1);  
     fclose(fp2);  
     fclose(fp3);  
     return 0;  
 }  

调用上面函数的方法如下所示。
copy

simplest_yuv420_split("lena_256x256_yuv420p.yuv",256,1);

从代码可以看出，如果视频帧的宽和高分别为w和h，那么一帧YUV420P像素数据一共占用w*h*3/2 Byte的数据。其中前w*h Byte存储Y，接着的w*h*1/4 Byte存储U，最后w*h*1/4 Byte存储V。上述调用函数的代码运行后，将会把一张分辨率为256x256的名称为lena_256x256_yuv420p.yuv的YUV420P格式的像素数据文件分离成为三个文件：

output_420_y.y：纯Y数据，分辨率为256x256。
output_420_u.y：纯U数据，分辨率为128x128。
output_420_v.y：纯V数据，分辨率为128x128。

注：本文中像素的采样位数一律为8bit。由于1Byte=8bit，所以一个像素的一个分量的采样值占用1Byte。

程序输入的原图如下所示。

lena_256x256_yuv420p.yuv

程序输出的三个文件的截图如下图所示。在这里需要注意输出的U、V分量在YUV播放器中也是当做Y分量进行播放的。

output_420_y.y

output_420_u.y和output_420_v.y

(2)分离YUV444P像素数据中的Y、U、V分量本程序中的函数可以将YUV444P数据中的Y、U、V三个分量分离开来并保存成三个文件。函数的代码如下所示。
copy

* @param url Location of YUV file.

int simplest_yuv444_split(FILE *fp1=fopen("output_444_y.y",87); font-weight:bold; background-color:inherit">FILE *fp2=fopen("output_444_u.y",87); font-weight:bold; background-color:inherit">FILE *fp3=fopen("output_444_v.y",248)"> unsigned char *)malloc(w*h*3);

int i=0;i<num;i++){

fwrite(pic+w*h*2,207); display:inline-block; width:16px; height:16px; text-indent:-2000px; background-color:inherit">copy

simplest_yuv444_split("lena_256x256_yuv444p.yuv",1);

颜色	(R,G,B)
白	(255,255)
黄	(255, 0)
青	( 0,255)
绿	( 0, 0)
品	(255, 0,255)
红	(255, 0)
蓝	( 0,255)
黑	( 0, 0)

视音频数据处理入门：RGB、YUV像素数据处理

函数列表

(1) 分离YUV420P像素数据中的Y、U、V分量

(3) 将YUV420P像素数据去掉颜色（变成灰度图）

下载

相关文章

Y	U	V
0	128	128
28	128	128
56	128	128
85	128	128
113	128	128
141	128	128
170	128	128
198	128	128
226	128	128
255	128	128

Y	U	V
0	128	128
28	128	128
56	128	128
85	128	128
113	128	128
141	128	128
170	128	128
198	128	128
226	128	128
255	128	128

Y	U	V
0	128	128
28	128	128
56	128	128
85	128	128
113	128	128
141	128	128
170	128	128
198	128	128
226	128	128
255	128	128