У меня возникают проблемы с отображением необработанного файла YUV в формате NV12.
Я могу отобразить выбранный кадр, однако он по-прежнему в основном черно-белый с определенными оттенками розового и зеленого.
Вот как выглядит мой вывод
В любом случае, вот как работает моя программа. (Это делается в Cocoa/target-c, но мне нужен ваш совет специалиста по алгоритму программы, а не по синтаксису.)
Перед выполнением программы файл YUV хранится в двоичном файле с именем "test.yuv". Файл в формате NV12, то есть сначала сохраняется Y-план, а затем UV-план чередуется. У меня нет проблем с извлечением файлов, потому что я провел много тестов на нем.
Во время инициализации я создаю справочную таблицу, которая преобразует двоичные /8 байтов/байт/символы в соответствующие значения Y, U, V с плавающей запятой.
Для плоскости Y это мой код
-(void)createLookupTableY //creates a lookup table for converting a single byte into a float between 0 and 1
{
NSLog(@"YUVFrame: createLookupTableY");
lookupTableY = new float [256];
for (int i = 0; i < 256; i++)
{
lookupTableY[i] = (float) i /255;
//NSLog(@"lookupTableY[%d]: %f",i,lookupTableY[i]);//prints out the value of each float
}
}
Таблица поиска U-плоскости
-(void)createLookupTableU //creates a lookup table for converting a single byte into a float between 0 and 1
{
NSLog(@"YUVFrame: createLookupTableU");
lookupTableU = new float [256];
for (int i = 0; i < 256; i++)
{
lookupTableU[i] = -0.436 + (float) i / 255* (0.436*2);
NSLog(@"lookupTableU[%d]: %f",i,lookupTableU[i]);//prints out the value of each float
}
}
И V таблица поиска
-(void)createLookupTableV //creates a lookup table for converting a single byte into a float between 0 and 1
{
NSLog(@"YUVFrame: createLookupTableV");
lookupTableV = new float [256];
for (int i = 0; i < 256; i++)
{
lookupTableV[i] = -0.615 + (float) i /255 * (0.615*2);
NSLog(@"lookupTableV[%d]: %f",i,lookupTableV[i]);//prints out the value of each float
}
}
после этого я извлекаю план Y & UV и сохраняю их в два буфера: yBuffer & uvBuffer
в этот момент я пытаюсь преобразовать данные YUV и сохранить их в буферном массиве RGB с именем frameImage
-(void)sortAndConvert//sort the extracted frame data into an array of float
{
NSLog(@"YUVFrame: sortAndConvert");
int frameImageCounter = 0;
int pixelCounter = 0;
for (int y = 0; y < YUV_HEIGHT; y++)//traverse through the frame height
{
for ( int x = 0; x < YUV_WIDTH; x++)//traverse through the frame width
{
float Y = lookupTableY [yBuffer [y*YUV_WIDTH + x] ];
float U = lookupTableU [uvBuffer [ ((y / 2) * (YUV_WIDTH / 2) + (x/2)) * 2 ] ];
float V = lookupTableV [uvBuffer [ ((y / 2) * (YUV_WIDTH / 2) + (x/2)) * 2 + 1] ];
float RFormula = Y + 1.13983f * V;
float GFormula = Y - 0.39465f * U - 0.58060f * V;
float BFormula = Y + 2.03211f * U;
frameImage [frameImageCounter++] = [self clampValue:RFormula];
frameImage [frameImageCounter++] = [self clampValue:GFormula];
frameImage [frameImageCounter++] = [self clampValue:BFormula];
}
}
}
тогда я попытался нарисовать изображение в OpenGl
-(void)drawFrame:(int )x
{
GLuint texture;
glGenTextures(1, &texture);
glBindTexture(GL_TEXTURE_2D, texture);
glTexImage2D(GL_TEXTURE_2D, 0, GL_RGB, YUV_WIDTH, YUV_HEIGHT, 0, GL_RGB, GL_FLOAT, frameImage);
glTexParameteri(GL_TEXTURE_2D, GL_TEXTURE_MIN_FILTER, GL_LINEAR);
glEnable(GL_TEXTURE_2D);
glBindTexture(GL_TEXTURE_2D, texture);
glRotatef( 180.0f, 1.0f, 0.0f, 0.0f );
glBegin( GL_QUADS );
glTexCoord2d(0.0,0.0); glVertex2d(-1.0,-1.0);
glTexCoord2d(1.0,0.0); glVertex2d(+1.0,-1.0);
glTexCoord2d(1.0,1.0); glVertex2d(+1.0,+1.0);
glTexCoord2d(0.0,1.0); glVertex2d(-1.0,+1.0);
glEnd();
glFlush();
}
так что в основном это моя программа в скорлупе. по сути, я читаю двоичные файлы YUV, хранит все данные в буфере массива символов. Затем я перевожу эти значения в соответствующие значения YUV.
Здесь я думаю, что ошибка может быть следующей: в справочной таблице Y я стандартизирую плоскость Y до [0,1], в плоскости U я стандартизировал значения между [-0.435,0.436] и в V плоскость я стандартизировала его между [-0.615,0.615]. Я сделал это, потому что это диапазоны значений YUV согласно википедии.
И формула YUV-RGB - это та же формула из Википедии. Я также пробовал различные другие формулы, и это единственная формула, которая дает приблизительный обзор кадра. Любой может рискнуть предположить, почему моя программа неправильно отображает данные кадра YUV. Я думаю, что это как-то связано с моей техникой стандартизации, но мне кажется, что все в порядке.
Я сделал много тестов, и я на 100% уверен, что ошибка вызвана поиском таблицы. Я не думаю, что мои установочные формулы верны.
Примечание для всех, кто читает это. Долгое время мой кадр не отображался должным образом, потому что я не мог правильно извлечь данные кадра.
Когда я только начал программировать, у меня сложилось впечатление, что в клипе, скажем, 30 кадров, все 30 Y-планарных данных сначала записываются в файл данных, а затем - данные UV-плоскости.
Методом проб и ошибок я обнаружил, что для файла данных YUV, в частности NV12, файл данных хранится следующим образом.
Y (1) УФ (1) Y (2) УФ (2)......
@nschmidt
Я изменил свой код на то, что вы предложили
float U = lookupTableU [uvBuffer [ (y * (YUV_WIDTH / 4) + (x/4)) * 2 ] ]
float V = lookupTableU [uvBuffer [ (y * (YUV_WIDTH / 4) + (x/4)) * 2 + 1] ]
и это результат, который я получаю
вот строка печати с консоли. я распечатываю значения для значений Y, U, V и RGB, которые переводятся и сохраняются в массиве frameImage
YUV: [0.658824, -0.022227, -0.045824] RGBFinal: [0.606593,0.694201,0.613655]
YUV: [0.643137, -0.022227, -0.045824] RGBFinal: [0.590906,0.678514,0.597969]
YUV: [0.607843, -0.022227, -0.045824] RGBFinal: [0.555612,0.643220,0.562675]
YUV: [0.592157, -0.022227, -0.045824] RGBFinal: [0.539926,0.627534,0.546988]
YUV: [0.643137,0.025647,0.151941] RGBFinal: [0.816324,0.544799,0.695255]
YUV: [0.662745,0.025647,0.151941] RGBFinal: [0.835932,0.564406,0.714863]
YUV: [0.690196,0.025647,0.151941] RGBFinal: [0.863383,0.591857,0.742314]
Обновление 13 июля 2009 г.
Проблема была окончательно решена благодаря рекомендации nschmidt. Оказывается, мой файл YUV был на самом деле в формате YUV 4: 1:1. Мне изначально сказали, что это в формате YUV NV12. В любом случае, я хотел бы поделиться своими результатами с вами.
Вот выходной
и мой код для декодирования выглядит следующим образом
float Y = (float) yBuffer [y*YUV_WIDTH + x] ;
float U = (float) uvBuffer [ ((y / 2) * (YUV_WIDTH / 2) + (x/2)) ] ;
float V = (float) uvBuffer [ ((y / 2) * (YUV_WIDTH / 2) + (x/2)) + UOffset] ;
float RFormula = (1.164*(Y-16) + (1.596* (V - 128) ));
float GFormula = ((1.164 * (Y - 16)) - (0.813 * ((V) - 128)) - (0.391 * ((U) - 128)));
float BFormula = ((1.164 * (Y - 16)) + (2.018 * ((U) - 128)));
frameImage [frameImageCounter] = (unsigned char)( (int)[self clampValue:RFormula]);
frameImageCounter ++;
frameImage [frameImageCounter] = (unsigned char)((int)[self clampValue:GFormula]);
frameImageCounter++;
frameImage [frameImageCounter] = (unsigned char)((int) [self clampValue:BFormula]);
frameImageCounter++;
GLuint texture;
glGenTextures(1, &texture);
glEnable(GL_TEXTURE_2D);
glBindTexture(GL_TEXTURE_2D, texture);
glTexParameteri(GL_TEXTURE_2D, GL_GENERATE_MIPMAP_SGIS, GL_TRUE);
glTexImage2D(GL_TEXTURE_2D, 0, GL_RGB, YUV_WIDTH, YUV_HEIGHT, 0, GL_RGB, GL_UNSIGNED_BYTE, frameImage);
//glTexParameteri(GL_TEXTURE_2D, GL_TEXTURE_MIN_FILTER, GL_LINEAR);
glTexParameteri(GL_TEXTURE_2D,GL_TEXTURE_WRAP_S,GL_CLAMP_TO_EDGE_SGIS);
glTexParameteri(GL_TEXTURE_2D,GL_TEXTURE_WRAP_T,GL_CLAMP_TO_EDGE_SGIS);
glTexParameteri(GL_TEXTURE_2D,GL_TEXTURE_MAG_FILTER,GL_LINEAR);
glTexParameteri(GL_TEXTURE_2D,GL_TEXTURE_MIN_FILTER,GL_LINEAR_MIPMAP_LINEAR);
glRotatef( 180.0f, 1.0f, 0.0f, 0.0f );
glBegin( GL_QUADS );
glTexCoord2d(0.0,0.0); glVertex2d(-1.0,-1.0);
glTexCoord2d(1.0,0.0); glVertex2d(+1.0,-1.0);
glTexCoord2d(1.0,1.0); glVertex2d(+1.0,+1.0);
glTexCoord2d(0.0,1.0); glVertex2d(-1.0,+1.0);
glEnd();
NSLog(@"YUVFrameView: drawRect complete");
glFlush();
по сути, я использовал NSData для извлечения необработанных файлов. хранится в буфере массива символов. Для преобразования YUV в RGB я использовал приведенную выше формулу, после чего я ограничил значения до [0: 255]. затем я использовал 2DTexture в OpenGL для отображения.
Так что если вы в будущем конвертируете YUV в RGB, используйте формулу сверху. Если вы используете формулу преобразования YUV в RGB из предыдущего поста, то вам нужно отобразить текстуру в GL_Float из значений RGB, зажатых между [0: 1]