文章相似度,又稱內容相似度,指的是文字和語句在不同文章之間的相同或相似程度。當兩篇文章之間有更多共同點時,它們的相似度也會更高。
文章相似度可分為狹義和廣義。狹義指在同一個網站內兩篇文章之間具有較高的相似性;而廣義則指你網站內一篇與互聯網中某篇其他文章之間存在較高的相似性。
有兩種情況會導致出現較高的文本相似度:
一是詞匯限制。一個人使用詞匯是有限制因素存在,并且思維方式往往也容易導致他們寫出類別接近、表達方式類比以及具備更多共通點之文本。
二是涉及到了虛假原創和盜版等問題。段文杰極力反對大家使用虛假原創工具就因為其中一重要問題就體現其中。
那么,過高程度上提衛了斯天來說經以上?
首先,“過于類別化”的文章將越難被納入搜索引擎索引范圍中甚至根本進入不了索引范圍;
其次,“過于接近”的設計將拖低排名水準甚至從排名列表中消失。
而“過度的相似性”還會負面影響信譽。畢竟,對于搜索引擎和用戶來說,這樣的文章簡直就是垃圾作品啊!