如何处理百度抓取异常的页面?
答案:4 悬赏:0 手机版
解决时间 2021-11-29 22:02
- 提问者网友:你给我的爱
- 2021-11-29 10:23
如何处理百度抓取异常的页面?
最佳答案
- 五星知识达人网友:神的生死簿
- 2021-11-29 11:17
要看具体的问题,再针对问题解决抓取异常的问题
网站抓取异常分析:
网站抓取异常分析:
- 域名到期(或者域名转出等出现暂时不能访问就会出现抓取异常)
服务器不稳定
网站程序有问题
robots.txt文件里设置了拒绝百度蜘蛛抓取的代码
网站被挂马
- 查询域名是否到期,到期了需续费恢复正常
服务器不稳定 咨询供应商及其解决稳定问题并修复
网站程序有问题找建站程序员检测问题并修复
robots.txt文件里拒绝百度蜘蛛抓取的代码删除掉并更新
网站被挂马,要查询挂马文件在哪里并删除,恢复网站,更改登录名和密码,安全密保要从新设置,防止下次被挂马
全部回答
- 1楼网友:北方的南先生
- 2021-11-29 14:12
它可以帮助你检查错误的链接,不仅仅是URL链接,还包行DNS解析失败、服务器链接、robots.txt 文件等问题,几乎所有网站都会出现抓取错误。 网 站站长工具将错误分为两类:网站错误(site errors)和链接地址错误(URL errors)。如果在一个网站上出现多个抓取错误,那么你的网站信任度会下降,甚至会影响到排名,当然这工具对于百度优化同样有效。那么应当如何解决 Google网站管理员工具的抓取错误呢。 通过Googlebot抓取的错误分类就看知道是什么导致抓取错误的原因了。 一、HTTP的错误 当一个网站上的网页(例如,当用户在浏览器中访问您的网页或Googlebot抓取页面时)到您的服务器发出请求,服务器返回HTTP状态码响应请求。 如果出现403状态,可以不用理睬,这表明是你的主机阻止了Googlebot抓取。对于所有HTTP状态码的列表文件,可以参考Google HTTP状态码帮助页面。 二、Sitemap中的错误 Sitemap错误往往会造成404错误页面,或在当前地图返回一个404错误页面,如果出现404错误页面请检查Sitemap中所有的链接, Google会不断抓取你已经删除的Sitemap,这点很郁闷,但也有办法解决:确保旧的Sitemap已经在管理员工具中被删除。如果不想被抓取,确保旧Sitemap出现404或者重新定向到新的Sitemap。 来自Google员工Susan Moskwa解释道: 阻止Googlebot的爬行,最好的办法是使这些网址(例如旧的sitemaps)出现404,当我们看到一个URL多次出现404后,Googlebot会停止爬行。 三、重定向错误 有些错误是因为301从定向引起的,执行重定向后要注意什么: 1:确保他们返回到正确的HTTP状态码。 2:确保没有任何循环重定向。 3:确保重定向指向有效的网页,而不是404页,或其他错误页,如503(服务器错误)或403(禁止抓取) 4:确保重定向不是指向一个空页面。 四、404错误 404错误可能会出现在以下几个方面: 1:删除了网站上的网页; 2:改变了网页的名称; 4:链接到了一个不存在的页面; 5:其他网站链接到你网站上一个不存在的页面; 6:网站迁移到一个新的域名不完全匹配的网站。 五、受robots.txt限制 还有一个原因是robots.txt文件阻止了Googlebot的抓取,如果出现大量抓取错误,第一步应该检查robots.txt 六、软404错误 通 常情况下,当有人请求的页面不存在,服务器将返回一个404(未找到)错误。除了在响应请求的页面不存在返回404代码,服务器也将显示一个404页。 这可能是一个标准的“未找到文件”的消息,或旨在提供更多信息的用户,它可能是一个自定义页面。
- 2楼网友:青灯有味
- 2021-11-29 13:22
百度抓取异常,是有4种不同的情况的,要看你是哪种情况啦
- 3楼网友:woshuo
- 2021-11-29 11:43
可以选择修改;至于结构调整方案,等你改完了再说吧,一步一步来。追问现在那些链接打开都是404,我并不知道他本来链接到什么地方,怎么办
我要举报
如以上问答信息为低俗、色情、不良、暴力、侵权、涉及违法等信息,可以点下面链接进行举报!
大家都在看
推荐资讯