python - nltk无法把'-'连接符分词出来?
本文介绍了python - nltk无法把'-'连接符分词出来?的处理方法,对大家解决问题具有一定的参考价值,需要的朋友们下面随着小编来一起学习吧!
问题描述
问 题
比如co-author,我希望分出co、author,但是nltk好像无法分出。
text_tokenized=[word.lower() for word in word_tokenize(item)]
解决方案
word = 'co-author'
word.split('-') # ['co', 'author']
这篇关于python - nltk无法把'-'连接符分词出来?的文章就介绍到这了,希望我们推荐的答案对大家有所帮助,也希望大家多多支持IT屋!
查看全文