熊猫算法4.1来了google出大招打击英文及小语种采集内容

 Frankie   2014-09-26 15:49   5245 人阅读  4 条评论

 Panda 4.1 — Google’s 27th Panda Update — Is Rolling Out

熊猫算法一直被google寄予厚望用来打击低质量内容,在美国时间9月25日searchengineland.com撰文对熊猫panda 4.1算法做了进一步的解读,这一消息首先由Google在G+中发布主要用来打击低质量内容及内容非常匮乏的网站,在本周早些时候已经把panda 4.1放出来做试验了,据群里网友分析确实最近网站的流量受此影响波动不小,这里面有个小插曲:在9月23号searchengineland.com对即将到来的google算法更新理解为对PBns(private blog networks)博客站群的打击,而且很多站长都有祥实的数据和截图来说明,现在看起来google终于给了我们答案那就是panda 4.1更新了,同时google对新算法对搜索结果产生的影响也做了预测说明在3%~5%之间,这次更新与上个熊猫算法更新版本的不同点在哪里呢?google说了将会给哪些有好内容的高质量中/小型网站给予更好的排名。原文如下:

Based on user (and webmaster!) feedback, we’ve been able to discover a few more signals to help Panda identify low-quality content more precisely. This results in a greater diversity of high-quality small- and medium-sized sites ranking higher, which is nice.

如果想知道有没有被熊猫4.1算法击中,现在就可以看看你的网站流量,实际上会有所显现的,这几天陆续跟一些做外文采集站的朋友讨论流量变化,发现还是比较明显的流量及客户的询盘量都有所减少,特别是超过一定流量阀值的站,基本上直接都被踢除索引了,先是降权没排名,紧接着非常快就直接删除索引了,有几个信号大家可以注意下:一是网站在短时间内上了很多页面(大部分是采集),二是流量在短时间内冲高,有可能超过了google的警戒阀值,三是链接大部分出现在博客站上或者评论等低质量网站上。

其实在panda 4.1算法更新之前google曾经专门更新过站长指南里面关于低质量内容的条款:最新更新如下:

以下是自动生成的内容的一些示例:

由自动工具翻译且在发布之前未经过人工审核或管理的文字
由自动流程(例如马尔科夫链)生成的文字
使用自动列举同义词或模糊技术生成的文字
通过提取 Atom/RSS Feed 或搜索结果生成的文字
在不能增加足够价值的情况下组合或合并不同网页中的内容

以下是网站抄袭行为的一些示例:

复制和重新发布其他网站的内容,而不增加任何原创内容或无任何附加价值
复制其他网站的内容,对其略做修改(例如,替换同义词或使用自动技术)后重新发布
复制其他网站的内容Feed,而不进行特殊编排整理或没有给用户带来任何好处
专门嵌入来自其他网站的视频、图片等媒体内容,而不向用户提供实质性附加价值

本文地址:http://dothinking.cn/sem/panda4.1-google.html
版权声明:本文为原创文章,版权归 Frankie 所有,欢迎分享本文,转载请保留出处!

发表评论


表情

评论列表

  1. 广东硅谷学院
    广东硅谷学院  @回复

    学好IT好就业选硅谷IT,学技能拿文凭事半功倍,紧跟专业老师一起冲浪IT行业。我们有建设学习型专业师资团队,教师领跑学生紧跟随其后。(QQ:800015777 电话0754—88989555)http://www.sve.com.cn

  2. 熊猫算法更新
    熊猫算法更新  @回复

    这次好像对低质量内容网站的打击更大了,时间周期上更短了,google说基于站长们和用户们的报告分析,熊猫4.1已经掌握了许多低质量内容网站的信号了,算法打击更有针对性了。

    • google你太坏
      google你太坏 2014-09-26 16:48:01  回复

      @熊猫算法更新都做仿牌吗? 仿牌 被K正常 都在发垃圾外链,不光仿牌,人工伪原创的也受打击了,我们的编辑人员英语8级拼凑出来的内容,照样被算法抓到。

    • 没流量要哭了
      没流量要哭了 2014-09-26 16:41:48  回复

      @熊猫算法更新这次打击的不光是采集的,人工拼凑的内容也在打击范围之内,这次很凶 基本伪原创的多被波及。有抄袭的多被干掉了。最新做了些站,观察看,只要流量不超过一定的阀值,还是可以存活下来的,只是存活周期明显缩短了。有三个站直接site:domain.com索引为0了。