Я хочу оптимизировать статистический код гистограммы с неонными функциями. Но мне это не удалось. Вот код c:
#define NUM (7*1024*1024)
uint8 src_data[NUM];
uint32 histogram_result[256] = {0};
for (int i = 0; i < NUM; i++)
{
histogram_result[src_data[i]]++;
}
Статистика Historam больше похожа на последовательную обработку. Трудно оптимизировать с помощью неоновых intrinsics. Кто-нибудь знает, как оптимизировать? Спасибо заранее.