Google补充材料术语

原创 华熙网络  2016-09-23 18:34  阅读 8 次

补充材料(Supplemental Result), Google特有的一个术语,是Google辅助索引的一部分。对辅助索引进行抓取的限制少于主要索引。比如,一个网站网址的参量可能使该网站无法被抓取到主要索引中,但仍可能被抓取到Google 的补充索引里面。但是相似的现象也很可能在其他搜索引擎,补充材料就是说把一些权重比较低的页面放在一个独立于主索引数据的补充索引库中,补充索引库中的页面更新颖频率较低,排名到前面为主的机率也比较低。

在Google 的表现会非常差。因为当用户在Google 上进行搜索时,它展现的结果是主数据库中的网页,并非辅助数据库中的网页。一般情况下,根本无法在搜索结果里看见这些网页。如果网页被Google 列为补充材料,这对于网站来说是一件不幸的事情。被列为补充材料的网页,在搜索结果中的排名,都会表现非常差。如果网站本身的PR 值较高,情况会稍好。

从Google 自己提供的信息中,看不到任何有价值的资料。主要原因可能是网页的Head 部分的Description 书写不规范造成的和网页内容是复制的。

某位搜索引擎关注者曾经有6 个相同主题的网站,这些网站都是用同一个数据库生成的,其中有100 多个网页的内容几乎完全一样,而且都是用XHTML+CSS 技术制作。在这些网站中,只有一个网站的所有网页不是补充材料,其他的网站的页面,除了首页之外全部都是补充材料。因此怀疑补充材料是由于复制网页造成的。

在复制网页的情况下,补充材料是某一个特定的URL,而不是一个网页或者一个文件。一般来说是同一个文件,但是是两个不同的URL。这两个URL 有可能其中一个是正常网页,另外一个却是补充材料。
补充材料是针对特定的日期所抓取的网页快照,也就是说即使是相同的URL,在Google 数据库中也可能存在多个版本,其中一个版本是日期A 所抓取的新的内容,这个URL+这个特定的日期和网页快照,可能是在正常的数据库中。而另外一个日期B 所抓取的内容(同一个URL,比较老的内容),却可能是在补充材料数据库中。

在分析了不是补充材料的网站的网页后,还发现只有这个网站的Description 书写规范,Description 内容由成段的句子组成,与网页的内容吻合; 而被作为补充材料的网页,Description 内容书写得都很不规范,都是将关键词堆砌几遍。发现这个问题后,搜索引擎关注者将其中某些网站网页的Description 修改为规范的写法,以期观察。但是由于Google 几个月都不更新这些页面,无法观察到结果。于是,搜索引擎关注者又用同样的数据库,做了两个网站,这两个网站的内容与以前的网站几乎完全相同,但是Description 采用规范的写法。这两个网站被Google 收录后,所有网页都不是补充材料。

由此,得出结论,Google 补充材料形成的原因是: 网页的Description 写法不规范。

作为补充材料的网页,根据Google 的说法,只是一种辅助、补充的索引,并不作为主要索引,这些网页并非在Google 的主数据库中,而是在辅助数据库中。由于它们被Google 爬虫爬行的间隔时间非常长,很多时候几个月、甚至半年都不会被Google 爬虫造访,严重影响网页在Google 数据库中的更新。同时,这些网页的排名非常差,只有在搜索结果很少的时候,才会被Google 列出来。

补充材料对排名的影响
这个问题就比较复杂,要具体情况具体分析。像前面讲的,同一个URL 可能出现在不同的数据库中,新版本的URL 可能会出现在正常的主要关键词的搜索中。但是在其他关键词搜索中,它也可能出现在补充材料中。
如果你的网站有很多补充材料,有可能影响排名。但是如果这些补充材料都有一个相应的新的URL+日期+网页快照版本,对排名的影响就不大。如果这些补充材料没有新的版本,影响就比较大。

1. 网页的Description 写法不规范
解决网页被Google 列为补充材料的主要方法,就是规范书写Description 。不要在Description 里堆砌关键词,Description 的内容要与页面的内容吻合; 保持合理的网站结构,确保每个页面都有连接指向,并且连接不被埋藏得很深。

2. 有网址规范化问题
也就是带有www 和没有www 的两个网址版本都在数据库中,其中一个就有可能被标为补充材料。目前可以通过Google 提供的管理员工具来统一www 和无www 域名的网站。

3. 有时候已经被删除的网页
也就是实际上应该返回404 错误的URL,会被列为补充材料; 或者域名已经过期了,也有时会被标成补充材料。

4. 有时候站长在改动网页之后
新旧内容的两个版本的网页都会出现在Google 索引中; 糟糕的是,其中一个会被标为补充材料。

5. 复制内容网页
很多转载或抄袭的内容会被标为补充材料。因为Google 也没办法判断哪一个是原创的,所以有时候原创者也会遭殃。

6. 网页上相同或相似的内容太多
比如导航系统占网页内容比例比较大,而正文部分比较小。

本文地址:http://www.szsdseo.com/seoxyc/863.html
版权声明:本文为原创文章,版权归 华熙网络 所有,欢迎分享本文,转载请保留出处!

发表评论


表情