Я работаю над приложением, которое импортирует тысячи строк, где каждая строка имеет такой формат:
|* 9070183020 |04.02.2011 |107222 |M/S SUNNY MEDICOS |GHAZIABAD | 32,768.00 |
Я использую следующий Regex
, чтобы разделить строки на нужные мне данные:
Regex lineSplitter = new Regex(@"(?:^\|\*|\|)\s*(.*?)\s+(?=\|)");
string[] columns = lineSplitter.Split(data);
foreach (string c in columns)
Console.Write("[" + c + "] ");
Это дает мне следующий результат:
[] [9070183020] [] [04.02.2011] [] [107222] [] [M/S SUNNY MEDICOS] [] [GHAZIABAD] [] [32,768.00] [|]
Теперь у меня есть два вопроса.
1. Как удалить пустые результаты. Я знаю, что могу использовать:
string[] columns = lineSplitter.Split(data).Where(s => !string.IsNullOrEmpty(s)).ToArray();
но есть ли встроенный метод для удаления пустых результатов?
2. Как удалить последний канал?
Спасибо за любую помощь.
С Уважением,
Yogesh.
РЕДАКТИРОВАТЬ:
Я думаю, что мой вопрос был немного непонят. Я никогда не думал о том, как я могу это сделать. Речь шла только о том, как я могу это сделать, изменив Regex
в приведенном выше коде.
Я знаю, что могу сделать это разными способами. Я уже сделал это с указанным выше кодом с предложением Where
и с альтернативным способом, который также (более двух раз) быстрее:
Regex regex = new Regex(@"(^\|\*\s*)|(\s*\|\s*)");
data = regex.Replace(data, "|");
string[] columns = data.Split(new[] { '|' }, StringSplitOptions.RemoveEmptyEntries);
Во-вторых, в качестве тестового примера моя система может анализировать 92k + таких строк менее чем за 1,5 секунды в исходном методе и менее чем за 700 миллисекунд во втором методе, где я никогда не найду более двух тысяч в реальном времени поэтому я не думаю, что мне нужно подумать о скорости здесь. На мой взгляд, думать о скорости в этом случае - преждевременная оптимизация.
Я нашел ответ на свой первый вопрос: его нельзя сделать с помощью Split
, поскольку такой опции не существует.
Ищем ответ на мой второй вопрос.