Здесь много написано о разработке рабочего процесса в R для статистических проектов. Наиболее популярным рабочим процессом является модель LCFD Джоша Рейха. С main.R
содержащим код:
source('load.R')
source('clean.R')
source('func.R')
source('do.R')
так что один source('main.R')
запускает весь проект.
Q: Есть ли причина, по которой этот рабочий процесс предпочитает тот, в котором интерпретационная работа по строке load.R
, clean.R
и do.R
заменяется функциями, которые вызывается main.R
Я не могу найти ссылку сейчас, но я где-то читал о том, что при программировании в R нужно преодолеть свое желание написать все в терминах вызовов функций, - что R был MEANT, чтобы быть написанным, это поэтапная интерпретирующая форма.
В: Действительно? Зачем?
Я был расстроен подходом LCFD, и я собираюсь, вероятно, написать все в терминах вызовов функций. Но прежде чем делать это, я хотел бы услышать от хороших людей SO о том, хорошая ли это идея или нет.
EDIT: проект, над которым я сейчас работаю, состоит в том, чтобы (1) читать в наборе финансовых данных, (2) очищать его (довольно активно), (3) оценивать некоторое количество, связанное с данными, используя мою оценку (4) Оценить то же количество с использованием традиционных оценок (5) Результаты отчета. Мои программы должны быть написаны таким образом, чтобы он выполнял работу (1) для разных эмпирических наборов данных, (2) для данных моделирования или (3) с использованием разных оценок. ТАКЖЕ, он должен следовать грамотному программированию и воспроизводимым руководящим принципам исследований, так что для новичков код должен запускать программу, понимать, что происходит и как ее настроить.