Я искал boost:: tokenizer, и я обнаружил, что документация очень тонкая. Возможно ли это сделать токенизацию строки, такой как "дельфин-обезьяна-бабуин", и сделать каждое слово маркером, а также каждую двойную тире? Из примеров я видел только отдельные ограничители символов. Является ли библиотека недостаточно продвинутой для более сложных разделителей?
Использование boost:: tokenizer со строковыми разделителями
Ответ 1
Похоже, вам нужно будет написать свой собственный TokenizerFunction, чтобы сделать то, что вы хотите.
Ответ 2
Использование iter_split позволяет использовать несколько символьных токенов.
В приведенном ниже коде будет приведено следующее:
дельфин
пн-ключ
бабуин
#include <iostream>
#include <boost/foreach.hpp>
#include <boost/algorithm/string.hpp>
#include <boost/algorithm/string/iter_find.hpp>
// code starts here
std::string s = "dolphin--mon-key--baboon";
std::list<std::string> stringList;
boost::iter_split(stringList, s, boost::first_finder("--"));
BOOST_FOREACH(std::string token, stringList)
{
std::cout << token << '\n'; ;
}
Ответ 3
Я знаю, что тема довольно старая, но она отображается в верхних ссылках в google при поиске "boost tokenizer по строке"
поэтому я добавлю свой вариант TokenizerFunction, на всякий случай:
class FindStrTFunc
{
public:
FindStrTFunc() : m_str(g_dataSeparator)
{
}
bool operator()(std::string::const_iterator& next,
const std::string::const_iterator& end, std::string& tok) const
{
if (next == end)
{
return false;
}
const std::string::const_iterator foundToken =
std::search(next, end, m_str.begin(), m_str.end());
tok.assign(next, foundToken);
next = (foundToken == end) ? end : foundToken + m_str.size();
return true;
}
void reset()
{
}
private:
std::string m_str;
};
после того, как мы сможем создать
boost::tokenizer<FindStrTFunc> tok("some input...some other input");
и использовать, как обычный токенизатор повышения
Ответ 4
Один из вариантов - попробовать boost:: regex. Не уверен в производительности по сравнению с пользовательским токенизатором.
std::string s = "dolphin--monkey--baboon";
boost::regex re("[a-z|A-Z]+|--");
boost::sregex_token_iterator iter(s.begin(), s.end() , re, 0);
boost::sregex_token_iterator end_iter;
while(iter != end_iter)
{
std::cout << *iter << '\n';
++iter;
}