自從自己從事SEO網(wǎng)站優(yōu)化以來,自己慢慢的去關(guān)注網(wǎng)站日志。網(wǎng)站日志分析成為自己每天工作的第一件事情,每天一到公司第一時間就是對昨天的網(wǎng)站日志進行分析。也許部分站長們還不會分析網(wǎng)站日志,也有少部分覺得分析網(wǎng)站日志就是在浪費時間,天天看著那些數(shù)據(jù)有什么作用。這里小編覺得至少有四點我們可以了解到。 第一、 確定是否有蜘蛛過來爬行 如何確定是否有蜘蛛過來爬行: 1、 通過觀看網(wǎng)站日志代碼進行觀看,這個針對分析高手 2、 通過網(wǎng)站日志分析工具進行觀看,這個比較適合新手使用 通過網(wǎng)站日志分析工具可以直接查看站點有哪些頁面已經(jīng)被蜘蛛爬行抓取了。 第二、 客戶ip便知蜘蛛類型。 1、220.181.108.*ip段的百度蜘蛛(提權(quán)蜘蛛) 2、123.125.71.*ip段的百度蜘蛛(劣質(zhì)文章捉取蜘蛛) 3、123.125.68.*ip段的百度蜘蛛(考察蜘蛛) 4、117.28.255.*ip段的百度蜘蛛(假冒蜘蛛) 第三、 檢測頁面狀態(tài)正常與否 通過網(wǎng)址日志我們可以直接的服務器響應代碼看出我們的頁面哪些有問題,哪些正常的。一般情況下返回的狀態(tài)碼是200的話說明正常,出現(xiàn)404的話,說明頁面出現(xiàn)問題。 第四、 搜索引擎對站點的友好程度 從網(wǎng)站日志,我們可以直接的看出蜘蛛來我們站點的爬行次數(shù),爬行次數(shù)越多說明蜘蛛對我們的站點越友好。 通過上圖我們可以直接的看出蜘蛛對我們站點的爬行次數(shù)了,但是這里面的爬行次數(shù)里面也存在冒牌的蜘蛛,所以我們還需要通過客戶ip進行確認哪些是真正的蜘蛛,哪些是冒牌的。 下面再對以上四點進行進一步的探知: 針對上面第一、我們可以直接的查看哪些頁面被爬行抓取了,哪些沒有。隨著算法的不斷更新,新站的考察期越來越長了,以至于好多新站長更新的文章通過site:域名,查收錄都沒有顯示。這大部分是因為搜索引擎滯留了沒有及時釋放。 針對上面第二、我們可以通過客戶ip辨別站點安全信息及文章內(nèi)容質(zhì)量怎樣 根據(jù)不同的IP我們可以分析網(wǎng)站是個怎樣的狀態(tài),以下常見的百度蜘蛛IP: 1、123.125.68.*常來,別的來的少,那么站點進入沙盒,或被者降權(quán)的可能性非常高。 2、220.181.68.*每天只增加沒有減少,則是進入沙盒或者被降權(quán)的預兆。 3、220.181.7.*、123.125.66.* 搜索引擎開始要抓取東西。 4、121.14.89.*擺脫了新站考察期。 5、203.208.60.*站點開始不正常。 6、210.72.225.*這個ip段不間斷巡邏各站。 7、220.181.108.*高質(zhì)量文章內(nèi)容頁或首頁抓取。 一般成功抓取返回代碼都是 200 0 0返回,若返回狀態(tài)顯示304 0 0代表網(wǎng)站沒更新,蜘蛛來過,但沒抓取。如果是 200 0 64,那么也別擔憂,這只不過是一些動態(tài)頁面的抓取。 針對上面第三、如果服務器返回狀態(tài),比如200 表示正常訪問。404 表示頁面不存在。304代表網(wǎng)頁還沒更新。這些都可以通過網(wǎng)站日志里面的代碼直接看出來的。如果大量的出現(xiàn)404的話,那么非常有必要對這些404的頁面進行采取措施。我們可以用robots.txt協(xié)議來屏蔽這些頁面,不讓搜索引擎來爬行這個頁面。 針對上面第四、真的蜘蛛來的次數(shù)越多越好! 好了,對網(wǎng)站日志就介紹里面。網(wǎng)站日志可以通過以下兩種方式獲得: 1、 ftp空間log文件夾 2、 登入你站點的服務器,通常網(wǎng)站日志位置C:WINDOWS/system32/LogFiles 尊重原創(chuàng),注明出處,你就是在為互聯(lián)網(wǎng)環(huán)境凈化做出自己的一份努力。 本文章由皇冠網(wǎng)http://www./huangguanseo/120.html運營部編撰發(fā)布,文章首發(fā)皇冠營銷網(wǎng) - 關(guān)注SEO,SEM優(yōu)化發(fā)展趨勢分享營銷推廣技巧博客,轉(zhuǎn)載請留原創(chuàng)鏈接,謝謝配合。 注:相關(guān)網(wǎng)站建設技巧閱讀請移步到建站教程頻道。 |
|