在SEO優化中,復制內容是導致網站收錄速度慢、內容質量低、排名差的主要原因之一。復制內容的產生一般分為內部原因和外部原因。內部復制的內容大多是由于URL規范化或一些特殊頁面造成的內容重復,而外部原因主要是抄襲。文章采集軟件的普及和搜索引擎算法在原創內容層次上的局限性,導致了這種內容復制成本低、效果顯著。
1、注意URL的規范化
重復內容的處理方法需要從源代碼開始。只要URL在早期是標準化的,復制的內容在后期就不會生成。例如:每一篇文章使用固定鏈接,即使是從不同的目錄頁面打開,指向的文章都是同一篇文章,或者在某些情況下,需要使用301重定向將重復的內容轉移到你想參與排名的頁面上。
2、 注意檔案頁的設置
對于博客來說,復制由存檔頁面引起的內容是一個常見的問題。因為一個小博客站只有一個作者,所以作者的檔案頁面上顯示的內容往往和博客首頁上的內容相同,這就導致了兩個頁面的重復。處理這種情況有以下方法:
(1)將元索引標記添加到存檔頁以防止搜索引擎索引;
(2)robots文件disallow不抓取存檔頁;***后,通過nofolw標記,搜索引擎無法對其他頁的存檔頁的導入鏈接進行爬網。
3、 注意sessionid的設置
這類頁面往往是由不同訪問者的登錄引起的,導致頁面ID參數的改變和原始URL的改變。在這種情況下,我們通常使用規范的標簽,用戶不會看到不同的頁面,但是搜索引擎會將頁面權重集中在原始URL上,而不是帶有參數的URL上,從而避免復制內容對權重的分散和影響。
4、 重視原創作品的版權保護
這種情況比較難處理。畢竟,這是別人的網站,控制權不在我們手中。為了防止這種情況,我們建議在寫文章時,可以在文章底部添加版權信息并重新打印原始鏈接。在目前內容過度收錄的情況下,雖然版權信息往往被忽視,但總有一些網站管理員和我們一樣,也受到抄襲和抄襲內容的困擾。一般來說,他們會保持聯系,這不僅是對自己負責,也尊重他人的工作。對于搜索引擎來說,外部鏈接越多,就越容易被判斷為原創內容。