UNI $ C $岑codeError:“字符映射”codeC无法连接code字 [英] UnicodeEncodeError: 'charmap' codec can't encode characters

查看:207
本文介绍了UNI $ C $岑codeError:“字符映射”codeC无法连接code字的处理方法,对大家解决问题具有一定的参考价值,需要的朋友们下面随着小编来一起学习吧!

问题描述

我想刮一个网站,但它给我一个错误。

I'm trying to scrape a website, but it gives me an error.

我用下面的code:

import urllib.request
from bs4 import BeautifulSoup

get = urllib.request.urlopen("https://www.website.com/")
html = get.read()

soup = BeautifulSoup(html)

print(soup)

和我得到了以下错误:

File "C:\Python34\lib\encodings\cp1252.py", line 19, in encode
    return codecs.charmap_encode(input,self.errors,encoding_table)[0]
UnicodeEncodeError: 'charmap' codec can't encode characters in position 70924-70950: character maps to <undefined>

我能做些什么来解决这个问题?

What can I do to fix this?

推荐答案

我固定它通过添加 .EN code(UTF-8)

这意味着打印(汤)变成打印(soup.en code(UTF-8))

这篇关于UNI $ C $岑codeError:“字符映射”codeC无法连接code字的文章就介绍到这了,希望我们推荐的答案对大家有所帮助,也希望大家多多支持IT屋!

查看全文
登录 关闭
扫码关注1秒登录
发送“验证码”获取 | 15天全站免登陆