将初始输出导出为Spacy的培训输入格式 [英] Export inception output to spacy's training input format

查看:40
本文介绍了将初始输出导出为Spacy的培训输入格式的处理方法,对大家解决问题具有一定的参考价值,需要的朋友们下面随着小编来一起学习吧!

问题描述

我使用Inestination 0.11.0(https://inception-project.github.io/)来注释我的培训数据。 我想用PYTHON SPACY来使用这个训练数据。我可以在《盗梦空间》中看到几种我可以输出的格式,但我不确定哪一种最适合Spacy。

我看不到任何有关将这些导出的文件转换为Space格式的文档。

我可以编写一个新脚本来执行此转换。在这样做之前,我想知道是不是有人已经解决了这个问题,并能给出一些建议?我应该选择哪种导出格式,以便更容易转换为Spacy的格式?

推荐答案

将数据导出为CONLLU可能是最直接的方法。Spacy可以使用converter scriptpython -m spacy convert /path/to/input/doc.connlu /path/to/output/doc.jsonl -c conllu将CONLLU文档转换为其预期的格式。

您会发现它支持CONLL文档的转换,但不是很明显支持哪种CONLL格式。您可以尝试使用上面的-c参数。

这篇关于将初始输出导出为Spacy的培训输入格式的文章就介绍到这了,希望我们推荐的答案对大家有所帮助,也希望大家多多支持IT屋!

查看全文
登录 关闭
扫码关注1秒登录
发送“验证码”获取 | 15天全站免登陆