百度蜘蛛304问题的总结

上传人:众众****夺宝 文档编号:227339192 上传时间:2023-08-11 格式:DOCX 页数:1 大小:11.26KB
收藏 版权申诉 举报 下载
百度蜘蛛304问题的总结_第1页
第1页 / 共1页
资源描述:

《百度蜘蛛304问题的总结》由会员分享,可在线阅读,更多相关《百度蜘蛛304问题的总结(1页珍藏版)》请在装配图网上搜索。

1、百度蜘蛛304问题的总结 关于百度蜘蛛304问题的总结年前上线本网站,历经HTTP改https重定向,大量发文章寻求百度收录各个难关,这段时间查看网站日志发现里面全是百度蜘蛛访问首页304问题,当时没有在意;过了3天必应收录直线收录从500调到180,再查看日志里面大局部都是蜘蛛访问首页304问题,赶忙在度娘搜寻各种解决这个问题资料,然而统统不论用还是304,实在是没有方法。 过了两天,想查一下到底百度蜘蛛遇到什么障碍造成304代码,以前总是用百度站长平台诊断抓取内容页测试,忽略了首页也能诊断抓取。尝试首页抓取诊断,一诊断发现了最大的问题首页所有汉字都是乱码,这下明白了本源就在这里:查看源码发

2、现里面包含了UTF-8,下面居然还有个。果决删除这个害人的GB231,再次测试抓取诊断乱码搞定了!过了几个小时查看网站日志304彻底解决了。网上其他解决304问题办法附在下方以便再与此问题时方便查看:1、效劳器缓存设置缓存的作用直接点击首页会发现还是之前访问的页面,而F5重新加载后才会显示新的页面,这其实就是缓存的缘故。另外,有的时候和一些较大的网站换友情链接也会遇到,对方加了友链之后首页不会马上显示,会因为缓存而需要过一段时间才能显示。2、网站结构问题如果网站结构不能有效的让蜘蛛顺利爬行,也就是说虽然蜘蛛有抓取,但由于网站结构问题导致蜘蛛前后两次抓取内容相同,或者说蜘蛛每次抓取首页都只抓了那块固定的内容,则就势必导致蜘蛛对首页的抓取返回304状态码。4、网站内容问题说都是网站内容长期采集或是伪原创也能导致蜘蛛返回该状态码,因为网站内容采集或伪原创确实会降低网站质量,导致百度不收录等情况,搜索蜘蛛也会认为网站内容不具备收录的意义,则也就不会抓取新的内容而返回没有更新的状态。度蜘蛛304问题的确很头疼

展开阅读全文
温馨提示:
1: 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
2: 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
3.本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
关于我们 - 网站声明 - 网站地图 - 资源地图 - 友情链接 - 网站客服 - 联系我们

copyright@ 2023-2025  zhuangpeitu.com 装配图网版权所有   联系电话:18123376007

备案号:ICP2024067431-1 川公网安备51140202000466号


本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知装配图网,我们立即给予删除!