Позвольте мне начать с того, что у меня нет опыта работы с R, KNN или наукой о данных в целом. Недавно я нашел Kaggle и играл с Digit Recognition конкурс/учебник.
В этом уроке они приводят пример кода, чтобы начать работу с базового представления:
# makes the KNN submission
library(FNN)
train <- read.csv("c:/Development/data/digits/train.csv", header=TRUE)
test <- read.csv("c:/Development/data/digits/test.csv", header=TRUE)
labels <- train[,1]
train <- train[,-1]
results <- (0:9)[knn(train, test, labels, k = 10, algorithm="cover_tree")]
write(results, file="knn_benchmark.csv", ncolumns=1)
Мои вопросы:
- Как я могу просмотреть ближайших соседей, которые были выбраны для конкретная строка тестов?
- Как я могу изменить, какой из этих десяти выбран?
для моего
results
?
Эти вопросы могут быть слишком широкими. Если это так, я бы приветствовал любые ссылки, которые могли бы указать мне по правильной дороге.
Возможно очень, что я сказал что-то, что здесь не имеет смысла. Если это так, пожалуйста, исправьте меня.