Автоматически обновляемые модели OpenNLP для русского языка.
Модели созданы на общедоступном материале новостных агентств:
Сбор данных осуществляется при помощи: gosquito
Разметка тегов осуществляется при помощи: digator-opennlp + digator-label-studio
Отображение справки:
user@localhost ~ $ docker run -ti --rm ghcr.io/livelace/opennlp-models:1.8.4
This container intended for quick evaluation of OpenNLP models for Russian language whose based on various news feeds.
For more details see: https://github.com/livelace/opennlp-models
Usage:
--type news. Model type.
--lang ru. Model language.
--entity all|date|event|fac|gpe|loc|money|org|per|time. Entity type.
Named entities recognition mode:
docker run -ti --rm ghcr.io/livelace/opennlp-models:1.8.4 --type news --lang ru --entity all
... write sentences
Распознавание именованных сущностей:
user@localhost ~ $ docker run -ti --rm ghcr.io/livelace/opennlp-models:1.8.4 --type news --lang ru --entity all
INFO: Type here:
Loading Token Name Finder model ... done (0.312s)
Приговор Марии Бутиной имеет антиправовой характер, он доказывает, что США ради геополитических интересов готовы нарушать фундаментальные принципы построения своей правовой системы, заявил РИА Новости председатель комитета Совета Федерации по конституционному законодательству Андрей Клишас.
Приговор <START:PER> Марии Бутиной <END> имеет антиправовой характер, он доказывает, что <START:GPE> США <END> ради геополитических интересов готовы нарушать фундаментальные принципы построения своей правовой системы, заявил <START:ORG> РИА Новости <END> председатель комитета <START:ORG> Совета Федерации <END> по конституционному законодательству <START:PER> Андрей Клишас. <END>