R RKEA - недостаточно учебных экземпляров с метками класса (обязательно: 1, при условии: 0)!

Я пытаюсь заставить RKEA работать в R Studio. Вот мой текущий код:

#Imports packages
library(RKEA)
library(tm)

#Creates a corpus of training sentences
data <- c("This is a sentence",
          "I am in an office",
          "I'm working on a laptop",
          "I have a glass of water",
          "There is a wooden desk",
          "I have an apple for lunch")
data <- as.data.frame(data)
data <- Corpus(VectorSource(data$data))

#Creates a corpus of training keywords
keywords <- c("sentence",
              "office",
              "working",
              "glass",
              "wooden",
              "apple")
keywords <- as.data.frame(keywords)
keywords <- Corpus(VectorSource(keywords$keywords))

#Creates output file for created model
tmpdir <- tempfile()
dir.create(tmpdir)
model <- file.path(tmpdir, "MyModel")

#Creates RKEA model
createModel(data, keywords, model)

Это в основном моделируется после примера, приведенного в документации RKEA. Однако, когда я запускаю это, я получаю следующее сообщение об ошибке:

Error in .jcall(km, "V", "saveModel") : 
  weka.core.WekaException: weka.classifiers.bayes.NaiveBayesSimple: Not enough training instances with class labels (required: 1, provided: 0)!

Ответ 1

Я думаю, что ваши примерные предложения слишком коротки, как документы. Следующая модификация (в первую очередь для первого образца документа) работает без ошибок:

data <- c("This is a longer and longer sentence.",
      "I am in an office.",
      "I'm working on a laptop.",
      "I have a glass of water.",
      "There is a wooden desk.",
      "I have an apple for lunch.")

Я предполагаю, что с очень короткими предложениями недостаточно слов, которые не являются ключевыми словами для создания модели.