如何从Doc对象生成.conllu? [英] How to generate .conllu from a Doc object?

查看:168
本文介绍了如何从Doc对象生成.conllu?的处理方法,对大家解决问题具有一定的参考价值,需要的朋友们下面随着小编来一起学习吧!

问题描述

在哪里可以找到Spacy将接受的示例.conllu文件?还是示例如何生成它?与IOB吗?

Where can I find an example .conllu file Spacy will accept ? or example how to generate it ? with IOB ?

尝试通过这种方式将我生成的.conllu文件转换为.json进行模型训练:

Trying to convert .conllu file I generated to .json for model training, this way :

 head_ix = token.head.i - sent[0].i + 1
 conll.append( (str(i), token.orth_, token.lemma_, token.tag_, token.ent_type_, str(head_ix), token.dep_) )

(您是否有正确的示例)

(Do you have correct example of doing this )

这是错误:

 $ python -m spacy convert spt3.conllu 

  .......
  File "/usr/local/lib/python2.7/dist-packages/spacy/cli/converters/conllu2json.py", line 25, in conllu2json
for i, (raw_text, tokens) in enumerate(conll_tuples):
  File "/usr/local/lib/python2.7/dist-packages/spacy/cli/converters/conllu2json.py", line 65, in read_conllx
id_, word, lemma, pos, tag, morph, head, dep, _1, iob = parts
ValueError: need more than 7 values to unpack

然后用这个:

        conll.append( (str(i), token.orth_, token.lemma_, token.tag_, '-', str(head_ix), token.dep_, str(head_ix), token.dep_, '-') )

错误是这样的:

head = (int(head) - 1) if head != "0" else id_
ValueError: invalid literal for int() with base 10: 'amod'

推荐答案

文本性可以做到这一点:

from textacy.export import doc_to_conll
doc_to_conll(doc)

这篇关于如何从Doc对象生成.conllu?的文章就介绍到这了,希望我们推荐的答案对大家有所帮助,也希望大家多多支持IT屋!

查看全文
登录 关闭
扫码关注1秒登录
发送“验证码”获取 | 15天全站免登陆