Мне приходится анализировать неформальный английский текст с большим количеством коротких рук и местным жаргоном. Поэтому я думал о создании модели для тэг-стэнфорда.
Как создать собственный набор помеченных корпусов для тестера Stanford для обучения?
Каков синтаксис корпуса и как долго должен быть мой корпус для достижения желаемой производительности?