日韩欧美综合-国产色影院-黄色欧美大片-奶茶视频黄色-无码粉嫩虎白一线天在线观看-亚洲天堂手机在线-亚洲欧美日本在线-日本特级黄色-亚洲tv在线-婷婷激情综合-亚洲精品无-成人免费黄色-亚洲色图久久久-色噜噜狠狠狠综合曰曰曰-精品久久久精品-蜜臀av在线播放-国产美女高潮流白浆视频

解決因服務(wù)器而導(dǎo)致的蜘蛛抓取失敗

作者:樂購科技 來源: 2012-01-27 11:59:13 閱讀 我要評論 直達(dá)商品

  服務(wù)器是網(wǎng)站生存的基礎(chǔ),不論是什么原因造成的服務(wù)器封禁,都直接影響蜘蛛的抓取,影響網(wǎng)站的用戶體驗(yàn),不利于seo工作的展開。重慶seo奕杉其將以自己的親身經(jīng)歷,結(jié)合網(wǎng)絡(luò)上一些朋友對這類問題的分析,總結(jié)出造成服務(wù)器封禁的三點(diǎn)主要原因:

  一、服務(wù)器不穩(wěn)定

  現(xiàn)在的服務(wù)器多如牛毛,價(jià)格也各不相同,質(zhì)量方面也是相差甚遠(yuǎn),站長們往往在選擇的時(shí)候都是“只認(rèn)價(jià)不認(rèn)質(zhì)”, 有的空間商為了節(jié)省資源,故意屏蔽掉spider(蜘蛛)的IP,導(dǎo)致spider抓取失敗,網(wǎng)站頁面就無法被搜索引擎收錄。

  解決方法:選擇有實(shí)力的正規(guī)空間商,盡可能保證您的網(wǎng)站穩(wěn)定。服務(wù)器和空間的穩(wěn)定性需要一定的技術(shù)實(shí)力來保障,一些沒有實(shí)力的空間商,可能無力提供良好的服務(wù),服務(wù)的穩(wěn)定性無法保證。我們可以很形像的打個(gè)比喻:如果將“人”比喻為網(wǎng)站內(nèi)容,那么服務(wù)器就是我們的“家”,它為我們擋風(fēng)避雨,為我們的生存提供了一個(gè)優(yōu)良的環(huán)境,而服務(wù)器的好壞將影響我們所能承受的風(fēng)險(xiǎn)。我想,誰都不愿意住在沒有安全保障的屋子里,拿自己的生命開玩笑,同理,網(wǎng)站也是如此!如果您現(xiàn)在的服務(wù)器不理想,有必要另選時(shí),請暫時(shí)讓舊服務(wù)器能夠使用一段時(shí)間,并且做301跳轉(zhuǎn),盡量減少更換服務(wù)器帶來的一系列損失。

  二、人為操作失誤

  對搜索引擎蜘蛛認(rèn)識不夠,對一些冒充搜索引擎spider的IP無法正確判斷,繼而誤封搜索引擎IP。這樣會導(dǎo)致搜索引擎不能成功抓取網(wǎng)站,無法成功抓取新網(wǎng)頁,以及將之前已經(jīng)成功抓取并收錄的頁面判定為無效鏈接,然后搜索引擎將會對這些死鏈接進(jìn)行清除,繼而網(wǎng)站頁面收錄減少,最終導(dǎo)致網(wǎng)站在搜索引擎的排名下降。

  解決方法:正確認(rèn)識各搜索引擎蜘蛛,而搜索引擎使用的 IP 地址會隨時(shí)發(fā)生變化,為確保能夠正確識別各搜索引擎IP,您可以使用DNS反查方式來確定抓取來源的IP是否屬于正規(guī)搜索引擎,防止誤封。

  例如查Baiduspider:在linux平臺下,您可以使用host ip命令反解ip來判斷是否來自Baiduspide的抓取。Baiduspider的hostname以 *.baidu.com 或 *.baidu.jp 的格式命名,非 *.baidu.com 或 *.baidu.jp 即為冒充。

  $ host 123.125.66.120

  120.66.125.123.in-addr.arpa domain name pointer

  baiduspider-123-125-66-120.crawl.baidu.com.

  host 119.63.195.254

  254.195.63.119.in-addr.arpa domain name pointer

  BaiduMobaider-119-63-195-254.crawl.baidu.jp.

  三、保護(hù)性的偶然封禁。

  1、如果網(wǎng)站的訪問量過大,超過自身負(fù)荷,服務(wù)器會根據(jù)自身負(fù)荷進(jìn)行保護(hù)性的偶然封禁。這種封禁是短暫性的,只要訪問量下降到服務(wù)器的承受范圍之內(nèi),那么服務(wù)器就會正常工作。

  2、還有一種情況是spider造成的,搜索引擎為了達(dá)到對目標(biāo)資源較好的檢索效果,蜘蛛需要對您的網(wǎng)站保持一定量的抓取。搜索引擎會根據(jù)服務(wù)器承受能力,網(wǎng)站質(zhì)量,網(wǎng)站更新等綜合因素來進(jìn)行調(diào)整, 建立一個(gè)合理的站點(diǎn)抓取壓力。但是會有一些例外,在壓力控制不好的情況下,服務(wù)器會根據(jù)自身負(fù)荷進(jìn)行保護(hù)性的偶然封禁。

  解決方法:1、如果是訪問量造成的壓力,那么恭喜你,說明你的網(wǎng)站已經(jīng)擁有可觀的訪問人數(shù),我們就應(yīng)該升級服務(wù)器,來滿足不段增長的訪問量。2、如果是spider造成的,我們可以采用如下方式來減輕spider對服務(wù)器產(chǎn)生的壓力:A、利用robots文件,屏蔽掉不想被spider抓取的頁面。B、采用nofollow標(biāo)簽,屏蔽不想被spider爬行的鏈接。C、頁面中較長的CSS、JS代碼移到外部文件。D、刪減多余代碼。應(yīng)當(dāng)注意的是,以上兩種情況在返回的代碼中盡量不要使用404,建議返回503(其含義是“Service Unavailable”)。這樣spider會過段時(shí)間再來嘗試抓取這個(gè)鏈接,如果那個(gè)時(shí)間站點(diǎn)空閑,那它就會被成功抓取了。

  最后,希望站長盡量保持站點(diǎn)的穩(wěn)定,對于暫時(shí)不想被搜索引擎抓取的頁面,使用正確的返回碼告知搜索引擎,如果確實(shí)不想被搜索引擎抓取或者索引,可以寫robots信息告知。

  作者:奕杉其

  來源:重慶seo

  文章鏈接:本文來自http://www.137sv.com/seotechnique/27.html轉(zhuǎn)載請注明來源,并保留來源的完整性,謝謝。


  推薦閱讀

  SEO案例分享之如何恢復(fù)被刪站的醫(yī)療網(wǎng)站

大家好,今天大年初三了,也算是年后的第一篇文章!做seo的我們,過年也無法正常休息,手頭握著好多站,雖然說不用天天更新,但是有一些站是節(jié)前接的,seo優(yōu)化后排名還沒上來,只能靠過節(jié)時(shí)間抽空去更新,才能有機(jī)會>>>詳細(xì)閱讀


本文標(biāo)題:解決因服務(wù)器而導(dǎo)致的蜘蛛抓取失敗

地址:http://www.sh-jijian.com/a/34/20120127/26263.html

樂購科技部分新聞及文章轉(zhuǎn)載自互聯(lián)網(wǎng),供讀者交流和學(xué)習(xí),若有涉及作者版權(quán)等問題請及時(shí)與我們聯(lián)系,以便更正、刪除或按規(guī)定辦理。感謝所有提供資訊的網(wǎng)站,歡迎各類媒體與樂購科技進(jìn)行文章共享合作。

網(wǎng)友點(diǎn)評
我的評論: 人參與評論
驗(yàn)證碼: 匿名回答
網(wǎng)友評論(點(diǎn)擊查看更多條評論)
友情提示: 登錄后發(fā)表評論,可以直接從評論中的用戶名進(jìn)入您的個(gè)人空間,讓更多網(wǎng)友認(rèn)識您。
聂拉木县| 蓬溪县| 蓬莱市| 大新县| 肥西县| 苏尼特左旗| 肇源县| 盐城市| 铁岭县| 龙岩市| 尼玛县| 大同市| 井冈山市| 儋州市| 临颍县| 噶尔县| 精河县| 翁牛特旗| 吴桥县| 方山县| 梨树县| 乌审旗| 新田县| 东莞市| 晋宁县| 保靖县| 理塘县| 禹州市| 宁德市| 景宁| 白水县| 浪卡子县| 阳泉市| 涞源县| 布拖县| 神农架林区| 佛教| 威信县| 镇平县| 塘沽区| 钟山县|