网站不收录的原因总结
日期:2017-01-28 / 人气:1443
相信很多站长都遇到过这种情况,网站都很久了,就是不收录,这是什么情况呢?今天合肥网站优化小编来带大家一起分析。
一、是否知道这个页面的存在
对页面进行收录当然首先就必须要知道有这个页面,蜘蛛都不知道这个页面,谈何收录?这一点主要分为2大类:搜索引擎找不到网页入口和不让搜索引擎抓取。
1.搜索引擎找不到网页入口
很多时候不是你更新了文章搜索引擎就要来抓取收录的,要怎么让蜘蛛知道你的更新呢?除了有规律的更新,可以向百度站长平台主动提交URL或者是提交站点地图,也可以让搜索引擎被动收集,这就是通过外链让蜘蛛知道你的网页,还有很多时候蜘蛛来到了你的网站,却找不到你更新的链接,因为网站的链接结构做得太复杂或是内链结构差,以致搜索引擎在抓取时间类不会爬到网站深处的页面,这也造成蜘蛛不知道该页面的存在。所以不管怎么样,第一步我们要保证页面能被蜘蛛看到,关于这一点可以通过查看网站日志来判断蜘蛛是否来访过。
2.不让搜索引擎抓取
很多网站有意无意的直接在robots文件屏蔽了百度或网站部分页面,却整天在找原因为什么蜘蛛不来抓取我的页面,这能怪百度吗?你都不让别人进门了,百度是怎么收录你的网页?所以有必要时常去检查一下网站robots文件是否正常。
二、是否可以正常的抓取
好了,蜘蛛发现了这个页面,也有权利抓取这个页面了,那能否正常抓取就是一个很大的问题,我们都知道蜘蛛抓取这个页面要从域名到DNS服务器再到网站空间,所以其中任何一个环节出现问题,蜘蛛都不能正常的抓取,首先域名需要备案,然后域名解析要正常,如果解析出现问题,域名是不能访问网站ip地址的,这个时候网站打不开,蜘蛛抓取不了页面。
再有就是经常提到的空间服务器了,服务器长期打不开那肯定是抓取不了的,这个大家都知道。并且如果服务器比较卡或者不稳定,就会影响蜘蛛的抓取,蜘蛛不能很好的去抓取页面或由于加载慢只抓取到网页一半,这就很大程度上影响了网站的收录。
三、是否达到收录标准
很多人觉得蜘蛛抓取就代表着收录,其实这是错误的,蜘蛛访问网站抓取页面并不代表就要收录你的网页,页面被抓取后要进行对比筛选,符合要求的才会被收录,为什么有的页面会被收录后又被吐出来?就是因为蜘蛛在不停的过滤,这个我们先不谈。既然是符合要求才会收录,那收录标准到底是什么呢?
1.行业不同标准也不同
这个是显而易见的,新闻类网站肯定比一般企业站容易收录,而对于医疗、博彩、成人用品等网站,标准肯定是更加严格,所以对于不同的行业,百度给予的收录标准也是不一样的。
2.不同的网站标准不同
百度有一个优先抓取的原则,对于绝大多数用户喜欢,权重高的网站收录得要快,就像新浪网、腾讯网收录得肯定要比一般网站要快,为什么?因为信任,这类网站本身就有其严格的过滤系统,在此类网站公布的内容百度基本是直接抓了就收,搜索引擎是互联网与用户的桥梁,它的目的就是给用户提供有价值的内容,你能为它提供良好的内容,它当然也会对你更好,这是互利的。所以搜索引擎不是做慈善,你的网站能给它什么?
3.主体收录标准
百度有一个收录标准值,对页面进行评分,满足评分收录,否则扔掉。这里小麦已经说过了,主要是从页面基础、站内、站外、用户四个方面进行评分,感兴趣的可以看一看,这里就简单谈一谈网站页面的内容:
(1)页面字数建议是在500-800字,内容健康良好,信息丰富;
(2)受众多: 文章要有一定得用户需求,也即用户检索需求的大小;
(3)时效性:写最新的东西用户和搜索引擎都喜欢;
(4)稀缺性: 稀缺主要是描述页面在互联网中的独特性。稀缺不等于无重复,只有对于大量完全无增益的重复页面,我们才应该认为其稀缺度较低。
四、是否有干净的域名
刚说了百度的收录标准,其实这一点也属于一个特别的标准,域名不干净同样是影响网站收录的一个重要原因,这个不干净我们分为2种情况。第一种就是域名在购买之前就有人用过了,不仅使用了而且还是用废了,这样的域名背景就是不干净,这就相当于以前如果你去考警察,如果家里是黑帮世家,那肯定是会影响你的,这和百度的收录是一个道理,严重的甚至域名直接作废。
另一种情况是我们经常说的降权,网站被降权这段时间是百度的一个审核期,网站的内容就算满足了上面所说的3点也可能收录慢或者是不收录,这个就需要我们坚持了。有恒心,能再次获得百度的信赖就会收录正常。
五、是否达到收录最大限度
等级不同的网站总收录的最大限度不同,日收录限制也不同。在新浪上更新1万篇文章可能会收录90%,但是如果在你的企业站更新1w篇文章可能是只会收录几十篇。这就是因为新浪的等级比你的高。等级不等于权重,权重只是等级的一个部分,等级是网站的重要程度,就像我们一个网站中不同页面的重要程度不一样,而在整个互联网不同网站的重要程度也不一样。所以中小型网站不要为了有大量的收录不断的去大量更新文章,这样的做法是错误的。不同的行业的更新的频率和数量是不一样,娱乐新闻行业可能需要几分钟更新一次,但是小型企业站可以几天或者几周更新一次都没有关系。
同时不同网站总收录最大限度也不一样,一个中小型新站目前的权重是1或者没有权重,那么它的收录限制维持在几十、几百到一千的数量。如果你发现不管你怎么更新做原创高质量的内容收录也上不去,可能就是因为网站权重处于一个阶段达到了收录限制,所以收录不可能上去。就好比家里的猫长得再大食量也没有猪多,所以猪分配的食物就自然要比猫多了,如果网站要突破这个收录的限制就要在权重上上升一个等级。
以上就是合肥网站优化小编整理的内容,更多相关资讯欢迎访问http://www.ahwlgs.cn/。