Как я могу обрабатывать векторы, не зная тип в Rcpp

Я хочу реплицировать следующую функцию R в Rcpp:

fR = function(x) x[1:2]

fR(c(1,2,3))
#[1] 1 2
fR(c('a','b','c'))
#[1] "a" "b"

Я могу сделать это для фиксированного типа вывода, например:

library(inline)
library(Rcpp)

fint = cxxfunction(signature(x = "SEXP"), '
          List xin(x);
          IntegerVector xout;

          for (int i = 0; i < 2; ++i) xout.push_back(xin[i]);

          return xout;', plugin = "Rcpp")

Но это будет работать только для целых чисел, и если я попытаюсь заменить тип xout на List (или GenericVector, которые являются одинаковыми) - он работает с любым типом ввода, но я возвращаю a List вместо вектора.

Каков правильный способ Rcpp сделать это?

Ответ 1

Не используйте push_back для Rcpp. Способ реализации Rcpp-векторов в настоящее время требует копирования всех данных каждый раз. Это очень дорогостоящая операция.

У нас RCPP_RETURN_VECTOR для отправки, это требует, чтобы вы записали функцию шаблона, в которую был введен вектор.

#include <Rcpp.h>
using namespace Rcpp ;

template <int RTYPE>
Vector<RTYPE> first_two_impl( Vector<RTYPE> xin){
    Vector<RTYPE> xout(2) ;
    for( int i=0; i<2; i++ ){
        xout[i] = xin[i] ;    
    }
    return xout ;
}

// [[Rcpp::export]]
SEXP first_two( SEXP xin ){
  RCPP_RETURN_VECTOR(first_two_impl, xin) ;
}

/*** R
    first_two( 1:3 )
    first_two( letters )
*/

Просто sourceCpp этот файл также запустит R-код, который вызывает две функции. На самом деле шаблон может быть проще, это тоже сработает:

template <typename T>
T first_two_impl( T xin){
    T xout(2) ;
    for( int i=0; i<2; i++ ){
        xout[i] = xin[i] ;    
    }
    return xout ;
}

Для параметра шаблона T требуется только

  • Конструктор, принимающий int
  • An operator[](int)

В качестве альтернативы это может быть задачей для посетителей dplyr.

#include <dplyr.h>
// [[Rcpp::depends(dplyr,BH)]]

using namespace dplyr ;
using namespace Rcpp ;

// [[Rcpp::export]]
SEXP first_two( SEXP data ){
    VectorVisitor* v = visitor(data) ;
    IntegerVector idx = seq( 0, 1 ) ;
    Shield<SEXP> out( v->subset(idx) ) ;
    delete v ;
    return out ;
}
Посетители

позволяют вам делать множество вещей на векторе независимо от типа данных, которые он хранит.

> first_two(letters)
[1] "a" "b"

> first_two(1:10)
[1] 1 2

> first_two(rnorm(10))
[1] 0.4647190 0.9790888

Ответ 2

Вам нужно выбрать тип (т.е. не использовать signature="SEXP" [oh, и вы должны смотреть в атрибуты в любом случае]).

Или вы сохраняете тип SEXP и отправляете внутренне. См. Например этот пост в галерее Rcpp.

Изменить: И C, конечно, статически типизирован. Эти переключатели в зависимости от типа также находятся в R-источниках. Здесь нет бесплатного обеда.