Я использую R 2.14.1 и Cassandra 1.2.11, у меня есть отдельная программа, которая записывает данные в одну таблицу Cassandra. Я не читаю их из R.
Схема Cassandra определяется следующим образом:
create table chosen_samples (id bigint , temperature double, primary key(id))
Я сначала попробовал пакет RCassandra (http://www.rforge.net/RCassandra/)
> # install.packages("RCassandra")
> library(RCassandra)
> rc <- RC.connect(host ="192.168.33.10", port = 9160L)
> RC.use(rc, "poc1_samples")
> cs <- RC.read.table(rc, c.family="chosen_samples")
Соединение кажется успешным, но синтаксический анализ таблицы в кадре данных не выполняется:
> cs
Error in data.frame(..dfd. = c("@\"ffffff", "@(<cc><cc><cc><cc><cc><cd>", :
duplicate row.names:
Я также попытался использовать JDBC-коннектор, как описано здесь: http://www.datastax.com/dev/blog/big-analytics-with-r-cassandra-and-hive
> # install.packages("RJDBC")
> library(RJDBC)
> cassdrv <- JDBC("org.apache.cassandra.cql.jdbc.CassandraDriver", "/Users/svend/dev/libs/cassandra-jdbc-1.2.5.jar", "`")
Но это не так:
Error in .jfindClass(as.character(driverClass)[1]) : class not found
Несмотря на правильность расположения драйвера java,
$ ls /Users/svend/dev/libs/cassandra-jdbc-1.2.5.jar
/Users/svend/dev/libs/cassandra-jdbc-1.2.5.jar