python2.7字符编码:首先decode('utf-8)然后保存的时候又encode('utf-8)有没有必要?
本文介绍了python2.7字符编码:首先decode('utf-8)然后保存的时候又encode('utf-8)有没有必要?的处理方法,对大家解决问题具有一定的参考价值,需要的朋友们下面随着小编来一起学习吧!
问题描述
问 题
想请教一下python2.7下字符编码的两个问题。
python2.7爬虫爬取一个utf-8的中文网页,为了对防止乱码首先decode('utf-8')转化为unicode。然后如果将这些unicode编码的内容保存到文件的时候有调用encode('utf-8')以utf-8编码保存有没有必要?
# -*-coding:utf-8 -*-的作用是不是保存当前.py文件为utf-8编码?
解决方案
1.有必要
decode('utf-8')的作用是将utf8编码的字符串解码为unicode,而unicode是python最接受的字符串编码格式,不会因为各个工具库对字符编码处理不好而带来问题。
2.是的
coding:utf-8的作用是指定当前这个python代码文件里面所有字符串的编码
这篇关于python2.7字符编码:首先decode('utf-8)然后保存的时候又encode('utf-8)有没有必要?的文章就介绍到这了,希望我们推荐的答案对大家有所帮助,也希望大家多多支持IT屋!
查看全文