Некоторое время в ближайшем будущем мне понадобится выполнить кросс-язычный подсчет слов, или если это невозможно, количество символов в перекрестном языке.
Под словом "счет" подразумевается точное количество слов, содержащихся в данном тексте, с использованием языка текста. Язык текста задается пользователем и будет считаться правильным.
По количеству символов я имею в виду подсчет символов "возможно в слове", содержащихся в данном тексте, с той же информацией о языке, которая описана выше.
Я бы предпочел бы бывший счет, но я знаю о трудностях. Я также знаю, что последнее количество намного проще, но очень предпочитает первое, если это вообще возможно.
Мне понравилось бы, если бы мне просто пришлось посмотреть на английский, но мне нужно рассмотреть каждый язык здесь, китайский, корейский, английский, арабский, хинди и т.д.
Я хотел бы знать, есть ли у Qaru какие-либо выводы о том, где начать поиск существующего продукта/метода для этого в PHP, поскольку я - хороший ленивый программист *
Простой тест, показывающий, как str_word_count с set_locale не работает, и функцию из страницы str_word_count php.net.