Я новичок в программировании CUDA, и мне было интересно, как производительность pyCUDA сравнивается с программами, реализованными на простом C. Будет ли производительность примерно одинаковой? Есть ли какие-нибудь бутылочные шеи, о которых я должен знать?
EDIT: Я, очевидно, попытался сначала разобраться с этой проблемой и был удивлен, не найдя никакой информации. т.е. я бы исключил, что люди pyCUDA ответили на этот вопрос в своем FAQ.