如果百度收了百篇同样的内容,在搜索文中的某关键词后,百度只会列出来几篇,其它的都会自动去重不显示。之所以百度来的流量大,就是因为去掉了很多重复的内容,还有垃圾的内容。研究去重就比研究优化要有意义的多。
在以前,眼镜蛇试过各种方法去重,但都不能逃过百度的高深算法。
替换法:将文中的逗号,我,你,他等之类常用的标点,字词替换为图片,来达到与原文不同的效果。字词替换法在收录一天内有效,但百度入库后又用更多的方法来对比分析重复度,还是认为新收的文章,和以前入库的文章是一样的。
段落颠倒法:相信这种方法也很多站长用过了,将第一段到第N段的顺序颠倒一下,让百度认识这篇文章和其它文章不同,但毫无用处。
整句颠倒法:以句号为分割点,将最后一句放第一句,倒数第二句放第二句。。。以此类推,经过测试,百度依然能识别内容是否与原来的重复。
还有很多能程序自动处理的方法眼镜蛇都试过了,发现针对百度去重,真没什么办法。百度中文判断重复,真的很厉害。
这就是为什么写一篇高质量的文章,会比转别人100篇文章的流量要大,因为你转的文章被去重了,搜索到的都是别人的。