关于UnicodeDecodeError: 'gbk' codec can't decode byte的解决办法

问题描述
错误原因
解决办法
结果
完整问题与代码

问题描述

最近在学《Python编程：从入门到实践》，在做到例题 10-10：常见单词时遇到了如下报错信息：

在这里插入图片描述

报错原因：UnicodeDecodeError: ‘gbk’ codec can’t decode byte

错误原因

Python 的 open 方法默认编码取决于平台，如果是 Windows 平台，默认编码是 gbk，如果文件是 utf-8 编码，就会报这个错误。

解决办法

将打开文件的代码：

open(filename, 'r')

改为：

open(filename, 'r', encoding='utf-8')

结果

在这里插入图片描述

问题解决，程序能正常运行了。

完整问题与代码

访问项目Gutenberg（http://gutenberg.org/ ），并找一些你想分析的图书。下载这些作品的文本文件或将浏览器中的原始文本复制到文本文件中。你可以使用方法count() 来确定特定的单词或短语在字符串中出现了多少次。例如，下面的代码计算’row’ 在一个字符串中出现了多少次：

>>> line = "Row, row, row your boat">>> line.count('row') 2 >>> line.lower().count('row') 3

请注意，通过使用lower() 将字符串转换为小写，可捕捉要查找的单词出现的所有次数，而不管其大小写格式如何。编写一个程序，它读取你在项目Gutenberg中获取的文件，并计算单词’the’ 在每个文件中分别出现了多少次。

代码：

def count_word(filename, word):    try:        with open(filename, 'r', encoding='utf-8') as file_object:            contents = file_object.read()    except FileNotFoundError:        print("\nSorry, the file " + filename[6:] + " doesn't exist.")    else:        count = contents.count(word)        return countfile_names = ["books/Alice's Adventures in Wonderland by Lewis Carroll.txt",              "books/The Masque of the Red Death by Edgar Allan Poe.txt",              "books/Pride and Prejudice by Jane Austen.txt"]keyword = 'the'for file_name in file_names:    count = count_word(file_name, keyword)    if count:        message = "\nWord '" + keyword + "' appears " + str(count) + " times in " + file_name[6:-4] + "."        print(message)

运行结果：

在这里插入图片描述

注：此时，在 books 文件夹中暂时删除了 Alice’s Adventures in Wonderland by Lewis Carroll.txt。

来源地址：https://blog.csdn.net/ProgramNovice/article/details/126712944

文章详情

关于UnicodeDecodeError: ‘gbk‘ codec can‘t decode byte的解决办法

关于UnicodeDecodeError: 'gbk' codec can't decode byte的解决办法

问题描述

错误原因

解决办法

结果

完整问题与代码

软考中级精品资料免费领

相关文章

猜你喜欢

关于UnicodeDecodeError: ‘gbk‘ codec can‘t decode byte的解决办法

解决 UnicodeDecodeError: ‘utf-8‘ codec can‘t decode byte错误的Python方案

UnicodeDecodeError: ‘utf-8‘ codec can‘t decode byte 0xc0 in position 0: invalid start byte报错解决

关于Cannot resolve xxx的解决办法

python中关于中文报错的解决办法

关于安装VMware Tools灰色的解决办法

关于Error:EPERM:operation not permitted,mkdir...的几种解决办法对比

mybatis-plus关于savebatch,saveorupdatebatch遇到的坑及解决办法

Android 关于“NetworkOnMainThreadException”问题的原因分析及解决办法

关于idea中出现nbsp和zwsp的完美解决办法

关于python pycharm中输出的内容不全的解决办法

关于解决module java.base does not “opens java.lang“ to unnamed module @333291e3的办法

关于sql server日志变得超大的删除解决办法

最近关于Navicat到期的完美解决办法（亲测有效）

关于Windows更新页面显示错误的可能解决办法

关于CentOs系统自带python和yum卸载后的解决办法

关于VS2019 C++项目同时出现LNK2005 和LNK1169 error 的解决办法

关于vmware中的某个虚拟机死机且无法关机问题的快速解决办法

安卓开发之关于外部存储不可用的解决办法（Android studio）

关于微软商店无法加载页面显示错误代码0x80131500的解决办法

文章详情

关于UnicodeDecodeError: ‘gbk‘ codec can‘t decode byte的解决办法

关于UnicodeDecodeError: 'gbk' codec can't decode byte的解决办法

问题描述

错误原因

解决办法

结果

完整问题与代码

软考中级精品资料免费领

相关文章

猜你喜欢

关于UnicodeDecodeError: ‘gbk‘ codec can‘t decode byte的解决办法

解决 UnicodeDecodeError: ‘utf-8‘ codec can‘t decode byte错误的Python方案

UnicodeDecodeError: ‘utf-8‘ codec can‘t decode byte 0xc0 in position 0: invalid start byte报错解决

关于Cannot resolve xxx的解决办法

python中关于中文报错的解决办法

关于安装VMware Tools灰色的解决办法

关于Error:EPERM:operation not permitted,mkdir...的几种解决办法对比

mybatis-plus关于savebatch,saveorupdatebatch遇到的坑及解决办法

Android 关于“NetworkOnMainThreadException”问题的原因分析及解决办法

关于idea中出现nbsp和zwsp的完美解决办法

关于python pycharm中输出的内容不全的解决办法

关于解决module java.base does not “opens java.lang“ to unnamed module @333291e3的办法

关于sql server日志变得超大的删除解决办法

最近关于Navicat到期的完美解决办法（亲测有效）

关于Windows更新页面显示错误的可能解决办法

关于CentOs系统自带python和yum卸载后的解决办法

关于VS2019 C++项目同时出现LNK2005 和LNK1169 error 的解决办法

关于vmware中的某个虚拟机死机且无法关机问题的快速解决办法

安卓开发之关于外部存储不可用的解决办法（Android studio）

关于 微软商店无法加载页面 显示错误代码0x80131500的解决办法

关于微软商店无法加载页面显示错误代码0x80131500的解决办法