Первый плакат здесь, поэтому я постараюсь сделать как можно яснее на помощь, в которой я нуждаюсь. Я новичок в R, и это мой первый реальный независимый опыт программирования.
У меня есть данные о запасах акций около 2,5 лет, каждый день имеет свой собственный файл. Файлы имеют .txt и состоят из приблизительно 20-30 миллионов строк, и в среднем я думаю, что 360mb каждый. Пока я работаю по одному файлу. Мне не нужны все данные, содержащиеся в этих файлах, и я надеялся, что смогу использовать программирование для минимизации моих файлов.
Теперь моя проблема в том, что у меня возникают трудности с написанием правильного кода, поэтому R понимает, что мне нужно.
Позвольте мне сначала показать вам некоторые данные, чтобы вы могли получить представление об форматировании.
M977
R 64266NRE1VEW107 FI0009653869 2EURXHEL 630 1
R 64516SSA0B 80SHB SE0002798108 8SEKXSTO 40 1
R 645730BBREEW750 FR0010734145 8EURXHEL 640 1
R 64655OXS1C 900SWE SE0002800136 8SEKXSTO 40 1
R 64663OXS1P 450SWE SE0002800219 8SEKXSTO 40 1
R 64801SSIEGV LU0362355355 11EURXCSE 160 1
M978
Другая информация:
M732
D 3547742
A 3551497B 200000 67110 02800
D 3550806
D 3547743
A 3551498S 250000 69228 09900
Итак, как вы можете видеть, каждая строка начинается с буквы. Каждая буква означает, что означает линия. Например, R
означает сообщение каталога заказа книги, M
означает миллисекунды после последней секунды, H
означает сообщение о торговле акциями. Всего использовано 14 разных букв.
Я использовал функцию readLines
для импорта данных в R. Это, однако, кажется, занимает очень много времени для обработки R, когда я хочу работать с данными.
Теперь я хотел бы написать какую-то функцию If, которая говорит, что если первая буква R
, то из смещения с 1 по 4 код означает идентификатор сегмента рынка и т.д. и имеет R добавить столбцы к ним, чтобы я мог работать с данными более структурированным способом.
Каков наилучший способ импорта таких данных, а также создание какой-либо формы структуры, т.е. использовать уникальную идентификационную информацию в строке данных для анализа 1 акции одновременно.