永发信息网

用python获取的网页源码怎么提取中文

答案:2  悬赏:0  手机版
解决时间 2021-02-23 04:53
当我获取源码html,type(html)返回,然后我尝试html.decode()时报错UnicodeDecodeError: 'utf-8' codec can't decode byte 0xb6 in position 275: invalid start byte。。。。。。怎么搞啊,想用re提取源码里的中文,或者怎么把网页已中文的形式保存下来?????
最佳答案
不会python以前用VC写过一个 你需要吗? 查看原帖>>

满意请采纳
全部回答
审查元素显示的其实就是格式化之后的源代码,你可以用对比一下。 下面是一个python3使用urllib库读取源代码的例子,如果要处理成审查元素那样的格式,需要对
我要举报
如以上问答信息为低俗、色情、不良、暴力、侵权、涉及违法等信息,可以点下面链接进行举报!
大家都在看
幻影车神三表演马戏插曲的歌曲叫什么名字?
睡着和入睡还有他们的过去分词怎么说用英语怎
重制版对电脑配置要求没那么高的,别被什么10
美利达自行车孟州旗舰店在哪里啊,我有事要去
哪种离子液体的性能较好且价格便宜???求教
为什麼我用usb数据线连接了nds和pc,但没有反
哺源多催乳有没有效果
SEM,SEO该如何学习,除了看书还有什么方法?
流亡黯道台服新手选什么职业 新手职业选择推
ps机不能正常使用,常期显示柜员签到l。
中山发艺在什么地方啊,我要过去处理事情
今年东华大学美术专业220分,文化课多少能进
在欧洲,有一座教堂被称为“罗马基督教的中心
花参村林场地址有知道的么?有点事想过去
清华大学一天有多少项发明专利?
推荐资讯
康复路去含光路凯德广场怎么坐车
我想贷款我只有身份证能贷多少
女人脸色黄是不是气血不好?该怎么调?
河南科技大学电子信息工程学院毕业证书上写的
男朋友眼间距太宽怎么办
实况足球2017用键盘怎么切换防守队员
在Excel单元格输入字符型数字时,需要在数字前
小蜜蜂手把瓶外卖专供1号体验店在什么地方啊
甲队n天修路a米,乙队m天修路b米,现两队一起修
男主很强的漫画
有哪些女明星是近视
刚做完点阵祛痘印 医院不让洗脸 然后每天敷面
正方形一边上任一点到这个正方形两条对角线的
阴历怎么看 ?