Spacy:如何手动设置竖条的POS标签? [英] SpaCy: How to manually set POS tag for vertical bar "|"?

查看:14
本文介绍了Spacy:如何手动设置竖条的POS标签?的处理方法,对大家解决问题具有一定的参考价值,需要的朋友们下面随着小编来一起学习吧!

问题描述

当文本由空格标记时,会根据上下文为竖条分配不同的POS标记,例如&Quot;ADV&Quot;、&Quot;Del&Quot;...而我希望";|";被识别为&puc";。是否有办法强制";|";使用此POS?

我尝试了此命令,但它不起作用。

nlp.tokenizer.add_special_case('|', [{ORTH: '|', POS: PUNC}])

推荐答案

我要在管道中添加一个简单的管道,紧跟在tagger

之后
def pos_postprocessor_pipe(doc) :
    for token in doc :
        if token.text == '|':
            token.pos_ = 'PUNCT'
    return doc

 nlp = spacy.load("en_core_web_sm")
 nlp.add_pipe(pos_postprocessor_pipe, name="pos_postprocessor", after='tagger')

这篇关于Spacy:如何手动设置竖条的POS标签?的文章就介绍到这了,希望我们推荐的答案对大家有所帮助,也希望大家多多支持IT屋!

查看全文
登录 关闭
扫码关注1秒登录
发送“验证码”获取 | 15天全站免登陆