Регулярное выражение для захвата всех вариаций тона кожи эмозинга

Я пытаюсь использовать регулярное выражение для захвата твитов, содержащих подстроку 👏, по крайней мере, дважды, поэтому я использую неискушенный ^.+ 👏 .+ 👏 .+$. Однако это не соответствует строкам, которые вместо этого содержат, например, 👏🏼.

Есть ли у меня разумный способ захватить эможи с любым изменением оттенка тона или без него, просто не помещая каждый из них в строку (например, [👏👏🏻👏🏼👏🏽👏🏾👏🏿])?

Ответ 1

Благодаря вышеприведенным комментариям, я обнаружил, что emojis, с которым я столкнулся в twitter, является unicode, а вариации тона кожи объединяют символы в диапазоне 1f3fb - 1f3ff.

http://unicode.org/reports/tr51/#Emoji_Modifiers_Table

Итак, для меня то, что я хотел, было 👏[\x{1f3fb}-\x{1f3ff}]?, а [\x{1f3fb}-\x{1f3ff}]? было чем-то, что я мог бы затем добавить рядом с любым немодифицированным emoji, чтобы включить изменения тона кожи.