将初始输出导出为Spacy的培训输入格式 [英] Export inception output to spacy's training input format
本文介绍了将初始输出导出为Spacy的培训输入格式的处理方法,对大家解决问题具有一定的参考价值,需要的朋友们下面随着小编来一起学习吧!
问题描述
我使用Inestination 0.11.0(https://inception-project.github.io/)来注释我的培训数据。 我想用PYTHON SPACY来使用这个训练数据。我可以在《盗梦空间》中看到几种我可以输出的格式,但我不确定哪一种最适合Spacy。
我看不到任何有关将这些导出的文件转换为Space格式的文档。
我可以编写一个新脚本来执行此转换。在这样做之前,我想知道是不是有人已经解决了这个问题,并能给出一些建议?我应该选择哪种导出格式,以便更容易转换为Spacy的格式?
推荐答案
将数据导出为CONLLU可能是最直接的方法。Spacy可以使用converter script:python -m spacy convert /path/to/input/doc.connlu /path/to/output/doc.jsonl -c conllu
将CONLLU文档转换为其预期的格式。
您会发现它支持CONLL文档的转换,但不是很明显支持哪种CONLL格式。您可以尝试使用上面的-c
参数。
这篇关于将初始输出导出为Spacy的培训输入格式的文章就介绍到这了,希望我们推荐的答案对大家有所帮助,也希望大家多多支持IT屋!
查看全文