python爬取页面的时候如何过滤非GBK编码的不读取?

三角形符号2022-10-10  7

python在抓取页面时如何过滤非GBK编码的未读页面?python在抓取页面时如何过滤非GBK编码的未读页面?简介:是我想爬的一页的数据。这个页面是GBK的,但是里面会有人回复非GBK的帖子,比如“伞伞伞”。如果字符像这样爬出来想要解码( # 039;gbk # 039)将报告一个错误>: gt gtnew.decod
转载请注明原文地址:https://juke.outofmemory.cn/read/1988658.html

最新回复(0)