Отображать YUV в OpenGl

У меня возникают проблемы с отображением необработанного файла YUV в формате NV12.

Я могу отобразить выбранный кадр, однако он по-прежнему в основном черно-белый с определенными оттенками розового и зеленого.

Вот как выглядит мой вывод alt text

В любом случае, вот как работает моя программа. (Это делается в Cocoa/target-c, но мне нужен ваш совет специалиста по алгоритму программы, а не по синтаксису.)

Перед выполнением программы файл YUV хранится в двоичном файле с именем "test.yuv". Файл в формате NV12, то есть сначала сохраняется Y-план, а затем UV-план чередуется. У меня нет проблем с извлечением файлов, потому что я провел много тестов на нем.

Во время инициализации я создаю справочную таблицу, которая преобразует двоичные /8 байтов/байт/символы в соответствующие значения Y, U, V с плавающей запятой.

Для плоскости Y это мой код

-(void)createLookupTableY //creates a lookup table for converting a single byte into a float between 0 and 1
{
    NSLog(@"YUVFrame: createLookupTableY");
    lookupTableY = new float [256];

    for (int i = 0; i < 256; i++)
    {
        lookupTableY[i] = (float) i /255;
        //NSLog(@"lookupTableY[%d]: %f",i,lookupTableY[i]);//prints out the value of each float
    }
}

Таблица поиска U-плоскости

-(void)createLookupTableU //creates a lookup table for converting a single byte into a float between 0 and 1
{
    NSLog(@"YUVFrame: createLookupTableU");
    lookupTableU = new float [256];

    for (int i = 0; i < 256; i++)
    {
        lookupTableU[i] =  -0.436 + (float) i / 255* (0.436*2);
        NSLog(@"lookupTableU[%d]: %f",i,lookupTableU[i]);//prints out the value of each float
    }
}

И V таблица поиска

-(void)createLookupTableV //creates a lookup table for converting a single byte into a float between 0 and 1
{
    NSLog(@"YUVFrame: createLookupTableV");
    lookupTableV = new float [256];

    for (int i = 0; i < 256; i++)
    {
        lookupTableV[i] =  -0.615 + (float) i /255 * (0.615*2);
        NSLog(@"lookupTableV[%d]: %f",i,lookupTableV[i]);//prints out the value of each float
    }
}

после этого я извлекаю план Y & UV и сохраняю их в два буфера: yBuffer & uvBuffer

в этот момент я пытаюсь преобразовать данные YUV и сохранить их в буферном массиве RGB с именем frameImage

-(void)sortAndConvert//sort the extracted frame data into an array of float
{
    NSLog(@"YUVFrame: sortAndConvert");
    int frameImageCounter = 0;
    int pixelCounter = 0;
    for (int y = 0; y < YUV_HEIGHT; y++)//traverse through the frame height
    {
        for ( int x = 0; x < YUV_WIDTH; x++)//traverse through the frame width
        {

            float Y = lookupTableY [yBuffer [y*YUV_WIDTH + x] ];
            float U = lookupTableU [uvBuffer [ ((y / 2) * (YUV_WIDTH / 2) + (x/2)) * 2  ] ]; 
            float V = lookupTableV [uvBuffer [  ((y / 2) * (YUV_WIDTH / 2) + (x/2)) * 2 + 1] ];

            float RFormula = Y + 1.13983f * V;
            float GFormula = Y - 0.39465f * U - 0.58060f * V;
            float BFormula = Y + 2.03211f * U;

             frameImage [frameImageCounter++] = [self clampValue:RFormula];
             frameImage [frameImageCounter++] = [self clampValue:GFormula];
             frameImage [frameImageCounter++] = [self clampValue:BFormula];

        }
    }

}

тогда я попытался нарисовать изображение в OpenGl

-(void)drawFrame:(int )x
{

    GLuint texture;

    glGenTextures(1, &texture);
    glBindTexture(GL_TEXTURE_2D, texture);
    glTexImage2D(GL_TEXTURE_2D, 0, GL_RGB, YUV_WIDTH, YUV_HEIGHT, 0, GL_RGB, GL_FLOAT, frameImage);

    glTexParameteri(GL_TEXTURE_2D, GL_TEXTURE_MIN_FILTER, GL_LINEAR);

    glEnable(GL_TEXTURE_2D);
    glBindTexture(GL_TEXTURE_2D, texture);
    glRotatef( 180.0f, 1.0f, 0.0f, 0.0f );

    glBegin( GL_QUADS );
    glTexCoord2d(0.0,0.0); glVertex2d(-1.0,-1.0);
    glTexCoord2d(1.0,0.0); glVertex2d(+1.0,-1.0);
    glTexCoord2d(1.0,1.0); glVertex2d(+1.0,+1.0);
    glTexCoord2d(0.0,1.0); glVertex2d(-1.0,+1.0);
    glEnd();

    glFlush();
}

так что в основном это моя программа в скорлупе. по сути, я читаю двоичные файлы YUV, хранит все данные в буфере массива символов. Затем я перевожу эти значения в соответствующие значения YUV.

Здесь я думаю, что ошибка может быть следующей: в справочной таблице Y я стандартизирую плоскость Y до [0,1], в плоскости U я стандартизировал значения между [-0.435,0.436] и в V плоскость я стандартизировала его между [-0.615,0.615]. Я сделал это, потому что это диапазоны значений YUV согласно википедии.

И формула YUV-RGB - это та же формула из Википедии. Я также пробовал различные другие формулы, и это единственная формула, которая дает приблизительный обзор кадра. Любой может рискнуть предположить, почему моя программа неправильно отображает данные кадра YUV. Я думаю, что это как-то связано с моей техникой стандартизации, но мне кажется, что все в порядке.

Я сделал много тестов, и я на 100% уверен, что ошибка вызвана поиском таблицы. Я не думаю, что мои установочные формулы верны.

Примечание для всех, кто читает это. Долгое время мой кадр не отображался должным образом, потому что я не мог правильно извлечь данные кадра.

Когда я только начал программировать, у меня сложилось впечатление, что в клипе, скажем, 30 кадров, все 30 Y-планарных данных сначала записываются в файл данных, а затем - данные UV-плоскости.

Методом проб и ошибок я обнаружил, что для файла данных YUV, в частности NV12, файл данных хранится следующим образом.

Y (1) УФ (1) Y (2) УФ (2)......

@nschmidt

Я изменил свой код на то, что вы предложили

float U = lookupTableU [uvBuffer [ (y * (YUV_WIDTH / 4) + (x/4)) * 2 ] ]
float V = lookupTableU [uvBuffer [ (y * (YUV_WIDTH / 4) + (x/4)) * 2 + 1] ]

и это результат, который я получаю alt text

вот строка печати с консоли. я распечатываю значения для значений Y, U, V и RGB, которые переводятся и сохраняются в массиве frameImage

YUV: [0.658824, -0.022227, -0.045824] RGBFinal: [0.606593,0.694201,0.613655]

YUV: [0.643137, -0.022227, -0.045824] RGBFinal: [0.590906,0.678514,0.597969]

YUV: [0.607843, -0.022227, -0.045824] RGBFinal: [0.555612,0.643220,0.562675]

YUV: [0.592157, -0.022227, -0.045824] RGBFinal: [0.539926,0.627534,0.546988]

YUV: [0.643137,0.025647,0.151941] RGBFinal: [0.816324,0.544799,0.695255]

YUV: [0.662745,0.025647,0.151941] RGBFinal: [0.835932,0.564406,0.714863]

YUV: [0.690196,0.025647,0.151941] RGBFinal: [0.863383,0.591857,0.742314]

Обновление 13 июля 2009 г.

Проблема была окончательно решена благодаря рекомендации nschmidt. Оказывается, мой файл YUV был на самом деле в формате YUV 4: 1:1. Мне изначально сказали, что это в формате YUV NV12. В любом случае, я хотел бы поделиться своими результатами с вами.

Вот выходной

alt text

и мой код для декодирования выглядит следующим образом

        float Y = (float) yBuffer [y*YUV_WIDTH + x] ;
        float U = (float) uvBuffer [ ((y / 2) * (YUV_WIDTH  / 2) + (x/2))   ] ; 
        float V = (float) uvBuffer [  ((y / 2) * (YUV_WIDTH  / 2) + (x/2))  + UOffset] ;

        float RFormula = (1.164*(Y-16) + (1.596* (V - 128) ));
        float GFormula = ((1.164 * (Y - 16)) - (0.813 * ((V) - 128)) - (0.391 * ((U) - 128)));
        float BFormula = ((1.164 * (Y - 16)) + (2.018 * ((U) - 128)));


        frameImage [frameImageCounter] = (unsigned char)( (int)[self clampValue:RFormula]);
        frameImageCounter ++;
        frameImage [frameImageCounter] =  (unsigned char)((int)[self clampValue:GFormula]);
        frameImageCounter++;
        frameImage [frameImageCounter] = (unsigned char)((int) [self clampValue:BFormula]);
        frameImageCounter++;



GLuint texture;

glGenTextures(1, &texture);
glEnable(GL_TEXTURE_2D);

glBindTexture(GL_TEXTURE_2D, texture);
glTexParameteri(GL_TEXTURE_2D, GL_GENERATE_MIPMAP_SGIS, GL_TRUE);

glTexImage2D(GL_TEXTURE_2D, 0, GL_RGB, YUV_WIDTH, YUV_HEIGHT, 0, GL_RGB, GL_UNSIGNED_BYTE, frameImage);

//glTexParameteri(GL_TEXTURE_2D, GL_TEXTURE_MIN_FILTER, GL_LINEAR);
glTexParameteri(GL_TEXTURE_2D,GL_TEXTURE_WRAP_S,GL_CLAMP_TO_EDGE_SGIS);
glTexParameteri(GL_TEXTURE_2D,GL_TEXTURE_WRAP_T,GL_CLAMP_TO_EDGE_SGIS);
glTexParameteri(GL_TEXTURE_2D,GL_TEXTURE_MAG_FILTER,GL_LINEAR);
glTexParameteri(GL_TEXTURE_2D,GL_TEXTURE_MIN_FILTER,GL_LINEAR_MIPMAP_LINEAR);

glRotatef( 180.0f, 1.0f, 0.0f, 0.0f );

glBegin( GL_QUADS );
glTexCoord2d(0.0,0.0); glVertex2d(-1.0,-1.0);
glTexCoord2d(1.0,0.0); glVertex2d(+1.0,-1.0);
glTexCoord2d(1.0,1.0); glVertex2d(+1.0,+1.0);
glTexCoord2d(0.0,1.0); glVertex2d(-1.0,+1.0);
glEnd();

NSLog(@"YUVFrameView: drawRect complete");
glFlush();

по сути, я использовал NSData для извлечения необработанных файлов. хранится в буфере массива символов. Для преобразования YUV в RGB я использовал приведенную выше формулу, после чего я ограничил значения до [0: 255]. затем я использовал 2DTexture в OpenGL для отображения.

Так что если вы в будущем конвертируете YUV в RGB, используйте формулу сверху. Если вы используете формулу преобразования YUV в RGB из предыдущего поста, то вам нужно отобразить текстуру в GL_Float из значений RGB, зажатых между [0: 1]

Ответ 1

Следующая попытка:) Я думаю, что у вас буфер uv не чередуется. Похоже, что сначала идут значения U, а затем массив значений V. Изменение строк на

unsigned int voffset = YUV_HEIGHT * YUV_WIDTH / 2;
float U = lookupTableU [uvBuffer [ y * (YUV_WIDTH / 2) + x/2] ]; 
float V = lookupTableV [uvBuffer [ voffset + y * (YUV_WIDTH / 2) + x/2] ];

может указывать, действительно ли это так.

Ответ 2

Я думаю, что вы неправильно указываете значения U и V. Вместо:

float U = lookupTableU [uvBuffer [ ((y / 2) * (x / 2) + (x/2)) * 2  ] ]; 
float V = lookupTableV [uvBuffer [  ((y / 2) * (x / 2) + (x/2)) * 2 + 1] ];

Это должно быть что-то вроде строк

float U = lookupTableU [uvBuffer [ ((y / 2) * (YUV_WIDTH / 2) + (x/2)) * 2  ] ]; 
float V = lookupTableV [uvBuffer [  ((y / 2) * (YUV_WIDTH / 2) + (x/2)) * 2 + 1] ];

Ответ 3

Изображение похоже, что у вас формат 4: 1:1. Вы должны изменить свои строки на

float U = lookupTableU [uvBuffer [ (y * (YUV_WIDTH / 4) + (x/4)) * 2 ] ]
float V = lookupTableU [uvBuffer [ (y * (YUV_WIDTH / 4) + (x/4)) * 2 + 1] ]

Может быть, вы можете опубликовать результат, чтобы увидеть, что еще не так. Мне всегда трудно думать об этом. Гораздо проще подойти к этому итеративно.