UnicodeDecodeError:"ascii"编解码器无法解码位置中的字节0xc3 [英] UnicodeDecodeError: 'ascii' codec can't decode byte 0xc3 in position

查看：152 发布时间：2020/5/18 1:23:02 python-2.7 nltk

本文介绍了UnicodeDecodeError:"ascii"编解码器无法解码位置中的字节0xc3的处理方法，对大家解决问题具有一定的参考价值，需要的朋友们下面随着小编来一起学习吧！

问题描述

当我尝试从nltk中的标记文本中提取一些模式时，出现错误:UnicodeDecodeError:'ascii'编解码器无法解码位置79的字节0xc3:序数不在range(128)中.首先，我没有这个错误，但是只有在安装了一些软件包之后我才知道.

When I try to extract some pattern from a tagged text in nltk, I have the error: UnicodeDecodeError: 'ascii' codec can't decode byte 0xc3 in position 79: ordinal not in range(128). Firstly I had not this error, but I got it only after installing some packages.

这是代码:

# -*- coding: utf-8 -*-
import codecs
import sys
import re
import sys
import nltk
from nltk.corpus import *

k =  nltk.corpus.brown.tagged_words('myfile')
for (w1,t1), (w2,t2) in nltk.bigrams(k):
    if t1 == 'NN' and  t2 == 'AJ':
       print w1, w2

这是代码的全部输出.

Traceback (most recent call last):
File "/home/fathi/egfe.py", line 12, in <module>
for (w1,t1), (w2,t2) in nltk.bigrams(k):
File "/usr/local/lib/python2.7/dist-packages/nltk/util.py", line 442, in bigrams
for item in ngrams(sequence, 2, **kwargs):
File "/usr/local/lib/python2.7/dist-packages/nltk/util.py", line 419, in ngrams
history.append(next(sequence))
File "/usr/local/lib/python2.7/dist-packages/nltk/corpus/reader/util.py", line 291, in  iterate_from
tokens = self.read_block(self._stream)
File "/usr/local/lib/python2.7/dist-packages/nltk/corpus/reader/tagged.py", line 241, in read_block
for para_str in self._para_block_reader(stream):
File "/usr/local/lib/python2.7/dist-packages/nltk/corpus/reader/util.py", line 564, in read_blankline_block
line = stream.readline()
File "/usr/local/lib/python2.7/dist-packages/nltk/data.py", line 1095, in readline
new_chars = self._read(readsize)
File "/usr/local/lib/python2.7/dist-packages/nltk/data.py", line 1322, in _read
chars, bytes_decoded = self._incr_decode(bytes)
File "/usr/local/lib/python2.7/dist-packages/nltk/data.py", line 1352, in _incr_decode
return self.decode(bytes, 'strict')
UnicodeDecodeError: 'ascii' codec can't decode byte 0xc3 in position 79: ordinal not in range(128)

UnicodeDecodeError:"ascii"编解码器无法解码位置中的字节0xc3 [英] UnicodeDecodeError: 'ascii' codec can't decode byte 0xc3 in position

问题描述

推荐答案

相关文章

其他开发最新文章

热门教程

热门工具

登录关闭

UnicodeDecodeError:"ascii"编解码器无法解码位置中的字节0xc3 [英] UnicodeDecodeError: &#39;ascii&#39; codec can&#39;t decode byte 0xc3 in position

问题描述

推荐答案

相关文章

其他开发最新文章

热门教程

热门工具

登录 关闭

UnicodeDecodeError:"ascii"编解码器无法解码位置中的字节0xc3 [英] UnicodeDecodeError: 'ascii' codec can't decode byte 0xc3 in position

登录关闭