Сначала я просто создал себе регулярное выражение, которое будет соответствовать всем уникальным внешним путям библиотек в списке всех файлов заголовков в проекте. Я задал вопрос о создании этого регулярного выражения неделю назад.
Я начал вмешиваться, чтобы понять, как он будет себя вести при асинхронности и превращении в веб-рабочего. Для удобства и надежности я создал этот универсальный файл, который работает во всех трех режимах:
/** Will call result() callback with every match it founds. Asynchronous unless called
* with interval = -1.
* Javadoc style comment for Arnold Rimmer and other Java programmers:
*
* @param regex regular expression to match in string
* @param string guess what
* @param result callback function that accepts one parameter, string match
* @param done callback on finish, has no parameters
* @param interval delay (not actual interval) between finding matches. If -1,
* function will be blocking
* @property working false if loop isn't running, otherwise contains timeout ID
* for use with clearTimeout
* @property done copy of done parameter
* @throws heavy boulders
**/
function processRegex(regex, string, result, done, interval) {
var m;
//Please tell me interpreter optimizes this
interval = typeof interval!='number'?1:interval;
//And this
processRegex.done = done;
while ((m = regex.exec(string))) {
Array.prototype.splice.call(m,0,1);
var path = m.join("");
//It good to keep in mind that result() slows down the process
result(path);
if (interval>=0) {
processRegex.working = setTimeout(processRegex,
interval, regex, string,
result, done, interval);
// Comment these out for maximum speed
processRegex.progress = regex.lastIndex/string.length;
console.log("Progress: "+Math.round(processRegex.progress*100)+"%");
return;
}
}
processRegex.working = false;
processRegex.done = null;
if (typeof done=="function")
done();
}
processRegex.working = false;
Я создал тестовый файл, а не вставил его здесь. Я загрузил его на очень надежный веб-хостинг: Демо - тестовые данные.
Я нахожу очень удивительным то, что существует такое существенное различие между веб-работником и браузером RegExp. Результаты, которые я получил:
- Mozilla Firefox
-
[WORKER]: Time elapsed:16.860s
-
[WORKER-SYNC]: Time elapsed:16.739s
-
[TIMEOUT]: Time elapsed:5.186s
-
[LOOP]: Time elapsed:5.028s
-
Вы также можете видеть, что с моим конкретным регулярным выражением разница между синхронным и асинхронным циклами невелика. Я попытался использовать список совпадений вместо выражения lookahead, и результаты сильно изменились. Вот изменения старой функции:
function processRegexUnique(regex, string, result, done, interval) {
var matchList = arguments[5]||[];
... same as before ...
while ((m = regex.exec(string))) {
... same as before ...
if (matchList.indexOf(path)==-1) {
result(path);
matchList.push(path);
}
if (interval>=0) {
processRegex.working = setTimeout(processRegex, interval,
regex, string, result,
done, interval, matchList);
... same as before ...
}
}
... same as before ...
}
И результаты:
- Mozilla Firefox
-
[WORKER]: Time elapsed:0.062s
-
[WORKER-SYNC]: Time elapsed:0.023s
-
[TIMEOUT]: Time elapsed:12.250s
(обратите внимание на себя: он становится страннее каждую минуту) -
[LOOP]: Time elapsed:0.006s
-
Может ли кто-нибудь объяснить такую разницу в скорости?