python 如何读取windows-1252格式文本?

查看:1047
本文介绍了python 如何读取windows-1252格式文本?的处理方法,对大家解决问题具有一定的参考价值,需要的朋友们下面随着小编来一起学习吧!

问题描述

问 题

这是一个GPS log文件,编码方式看sublimetext显示是windows-1252格式
][1]

我想读取这个文件一行打印用下面代码:

#!user/bin/python3

fin=open('gpsdebug.log.20100101000042.c','rt',encoding="windows-1252")
lines = fin.readline()
fin.close()
print(lines)

提示报错:

Traceback (most recent call last):
  File "strline.py", line 8, in <module>
    lines = fin.readline()
  File "/usr/lib/python3.5/encodings/cp1252.py", line 23, in decode
    return codecs.charmap_decode(input,self.errors,decoding_table)[0]
UnicodeDecodeError: 'charmap' codec can't decode byte 0x9d in position 3504: character maps to <undefined>

不知道问题出在哪里?

补充:
删除文本文档中一部分乱码字符可以正常读取,如果不处理这些字符有办法跳过吗?

解决方案

fin=open('gpsdebug.log.20100101000042.c','rt',encoding="windows-1252",errors='ignore')

这篇关于python 如何读取windows-1252格式文本?的文章就介绍到这了,希望我们推荐的答案对大家有所帮助,也希望大家多多支持IT屋!

查看全文
登录 关闭
扫码关注1秒登录
发送“验证码”获取 | 15天全站免登陆