網(wǎng)站要實現(xiàn)良好的收錄就不能存在過多重復性的內容,但對很多網(wǎng)站來說,有時重復性內容似乎不可避免,因為不論從站內因素還是站外因素,不論是圖片站還是產品站,稍微不注意就會產生過于相似的頁面。本文總結一下在日常的更新中,易產生重復內容的幾點原因,希望對站長有幫助。當然,這幾個原因并不是全部,只是我認為比較重要的幾部分,如果大家有更多這方面的總結,歡迎寫出來分享。
api易有重復內容
現(xiàn)在是大多數(shù)站長的首選。很多站長希望網(wǎng)站收錄較多、更新簡單,所以就使用了api站點。這類站點的特點即使比較容易獲得數(shù)據(jù),收錄量也會比較大。但缺點同樣明顯,那就是會產生大量的重復性頁面。百度現(xiàn)在對于這方面非常敏感,很多有足夠名氣的站也會在更新之后被K被降權。其它行業(yè)網(wǎng)站也有類似情況,網(wǎng)站只要存在大量的同質內容,就比較危險。比如一些音樂網(wǎng)站,小說網(wǎng)站等。排序產生相似頁面
一些產品量比較大的網(wǎng)站,往往有很多的排序功能,比如按時間排列、按銷售排名、按價格排名,這些不同的排序都是利用URL的動態(tài)參數(shù)而完成,所以算是不同的URL,但是,很多排序的頁面內容都過于類似,所以也會形成很多的重復內容。大家可以想試想,一個產品如果有幾種不同的排名組合,并且允許兩兩查詢,那么產生的URL就是幾十個,那么如果幾百個產品、幾千個甚至上萬個產品,那么這樣的URL就相當多,對于搜索引擎來說,這絕對非常不利。
網(wǎng)站圖片比較多
一些圖片站也是易產生重復內容的因素之一,特別是一些B2C類型的網(wǎng)站、圖片欣賞站等,由于圖片不能被搜索引擎抓取識別,它所能看到的是代碼以及少有的一些文字,所以很多URL頁面就會基本類似。這些重復內容不是和別的網(wǎng)站重復,更多的是和自身網(wǎng)站想比,所以,更加需要重視。當然,有些網(wǎng)站可能會寫一些ALT文字做注釋,但是這并不能保證完全減少重復頁面。最好的方法就是多加文案,做區(qū)別。
大量重復內容
現(xiàn)在雖然采集很流行,但是采集必須要有一定的規(guī)律和技術才行。完全采集并不是可取的辦法,我們需要找到最相關的行業(yè),然后把這些內容搬到我們網(wǎng)站上來,同時穿插一些不同的東西,然后做到原創(chuàng)化與唯一化。如果做不到唯一化,而是大量的直接去采集,就會生成很多重復內容。大家雖然也很明白這個道理,但是很多依舊是抱著采集10篇收錄一篇的心理,這樣采集足夠多的內容就會收錄一部分。不過這樣的效率比較低,可能當時收錄以后也有可能被刪除,因此建議大家不要做純粹的采集站。
網(wǎng)銷部宋紫薇發(fā)表于2012.8.15