老湿机香蕉久久久久久-亚洲成a人片在线观看天堂无码-黑人巨大猛烈捣出白浆-男女激情四射网站-澳门永久av免费网站-九九激情网-婷婷免费视频-亚洲色成人网站www永久四虎-中文在线а√天堂官网-日b视频免费观看-国产精品老牛影视-午夜精品影院-亚洲一区二区三区欧美-这里只有精品免费-偷拍青青草-亚洲欧美另类在线-小sao货水好多真紧h视频

您的位置:首頁>>網(wǎng)絡講堂>

百度蜘蛛如何判斷原創(chuàng)文章

日期:2010/1/16     閱讀:11600     發(fā)布者:撇捺電子商務有限公司
 原創(chuàng)文章在百度排名中要比為原創(chuàng)和網(wǎng)摘的效果好很多,對于網(wǎng)站整體權重的提升也有很大的幫助,而什么是原創(chuàng)性的文章,就要求我們的seo對這個有一個清楚的認識,正確了解百度蜘蛛如何辨別原創(chuàng)內(nèi)容就可以更好的加以利用,以最少的工作量達到我們想要的效果。 

 一、首先要明確一個概念:原創(chuàng) 偽原創(chuàng)

  原創(chuàng):簡單地理解就是第一次在網(wǎng)絡上發(fā)表的內(nèi)容,以前沒有出現(xiàn)過的內(nèi)容。

  偽原創(chuàng):就是從網(wǎng)站找來資料進行二次加工,二次修改之后的內(nèi)容,如修改標題,修改內(nèi)容,增加些文字或者減少一些文字等。

  那么搜索引擎對于原創(chuàng)的判斷是如何進行的呢?

  一般來講有以下幾個方面的因素決定:

  1、快照日期。

  2、蜘蛛抓取日期。

  3、頁面外鏈的多少。

  4、文章修改的程度。

  二、舉個例子如果你在www.yuanwa.com這個網(wǎng)站上發(fā)布了一片文章內(nèi)容。搜索引擎來到這個網(wǎng)站并且抓取到了這篇文章,放到數(shù)據(jù)庫,并且在收錄數(shù)據(jù)庫中沒有發(fā)現(xiàn)類似內(nèi)容,那么就會被認為是原創(chuàng)。

  在這點上有個細節(jié)需要注意:

  1:文章必須被收錄,如果沒有被收錄,肯定是在搜索數(shù)據(jù)庫中石找不到的,搜索引擎根本就找不到這篇文章,更談不上什么原創(chuàng)了。

  2:文章被轉載

  如果剛發(fā)表的一篇文章被其它轉載了,那么誰是原創(chuàng)呢?那要看誰更先被搜索引擎抓取到,也就是更新周期的問題了。如果a站發(fā)表,b站轉載,如果先抓取到a站,那么歸a,如果先抓取b站,那么原創(chuàng)就歸b站了,所以不是說你先發(fā)表了,原創(chuàng)就是你的,這個得看搜索引擎什么時間收錄了你的內(nèi)容。

  3、訪問時間

  如果蜘蛛先訪問了B站呢?

  1、當然權重給B站,一般的情況下都會這樣!

  2、如果B站轉載的文章帶了A站的原文章頁面鏈接呢?

  3、這就很明白了,剛收錄的時候,如果排名,兩條結果一起出現(xiàn),有可能還是B站的排名好一點。

  當然,文章轉載次數(shù)多了以后,A站的鏈接越多,對A站的文章越有好處,排名會慢慢變成A站在前面。

  如果另外轉載的文章帶的是B站頁面的鏈接呢?

  它們?nèi)绻袛嗖缓,就變成了一個鏈接流行度的比賽了。

  不過,如果都有很多外部鏈接,并且相差不大,那么判斷的規(guī)則應該回到原點,誰先被收錄誰就是原創(chuàng)。

  4、快照日期

  快照日期顯示時間最早的,一般就是原創(chuàng)了吧!

  不一定,這個說法要在一個更新周期之內(nèi),比如說文章發(fā)表后一周內(nèi),快照時間越早的地址將越有被認可為原創(chuàng)的可能。

  但如果文章都發(fā)表了幾個月了,說不定搜索引擎已經(jīng)重新獲取過快照了,快照的日期就變了!

  還有其它的可能嗎?

  有,一般比如百度收錄,他可能會有一個收錄的數(shù)據(jù)庫,經(jīng)過過濾后,收錄的內(nèi)容才會到搜索結果里來。在這個期間就有一些問題了,比如A站首次發(fā)表,B站轉載。蜘蛛先訪問A站再訪問B站。而后可能先把B站的結果放出來了,而A站還在數(shù)據(jù)庫里。

  所以說搜索引擎沒有收錄并不表示搜索引擎蜘蛛沒有訪問過這些內(nèi)容,也許在搜索引擎的庫存里已經(jīng)有記錄了,只是你查的時間沒有放出來而已,就像25號才放出來的內(nèi)容,但是快照是20號的,這就是搜索引擎的庫存內(nèi)容,同時這也是檢驗原創(chuàng)的核心時間點。

  這種情況一般出現(xiàn)在新站與老站之間,A站發(fā)表,B站轉載,但A站在搜索引擎的信任度并不高的時候。不過只要是A站先被訪問到的,原創(chuàng)權還是A站的,這是最難分出來的情況,因為我們不知道蜘蛛先訪問哪個站,除非你知道兩個站的網(wǎng)站空間日志內(nèi)容,能看到搜索引擎對兩個頁面的訪問時間。

  5、偽原創(chuàng)

  偽原創(chuàng)也會被認為是原創(chuàng)?

  大多時候是這樣的,搜索引擎蜘蛛不能明確分別這些東西,因為它的思維太程式化了。如果你的標題改過,文章的段落改過,那么蜘蛛將很難確定這篇文章是否有過收錄,也許它可以確定有部分內(nèi)容是重復的,但它也不能因為這些而將這篇文章確認為是轉載!當然,隨著搜索引擎程式設計的提高,應該會有一個相似度的東西出來,比如文字內(nèi)容相似度超過百分之幾就會被認為是轉載。

網(wǎng)站制作

0635-8899346 / 18106357068

我要建設網(wǎng)站
更多>>成功案例
新绛县| 黄龙县| 茶陵县| 绵阳市| 台山市| 舟山市| 府谷县| 南漳县| 仲巴县| 绿春县| 墨脱县| 高州市| 景宁| 满洲里市| 临桂县| 卢湾区| 彭泽县| 若羌县| 阆中市| 武山县| 绵竹市| 灵武市| 克山县| 灵山县| 五台县| 沙洋县| 中西区| 福州市| 莱阳市| 巫山县| 长阳| 秦皇岛市| 昌宁县| 嘉黎县| 巴林右旗| 邯郸市| 清水河县| 望都县| 禹州市| 托里县| 浏阳市|