1、什么是網(wǎng)站日志
網(wǎng)站日志是記錄web服務(wù)器接收處理請求以及運行時錯誤等各種原始信息的以·log結(jié)尾的文件,確切的講,應(yīng)該是服務(wù)器日志。網(wǎng)站日志最大的意義是記錄網(wǎng)站運營中比如空間的運營情況,被訪問請求的記錄。通過網(wǎng)站日志可以清楚的得知用戶在什么IP、什么時間、用什么操作系統(tǒng)、什么瀏覽器、什么分辨率顯示器的情況下訪問了你網(wǎng)站的哪個頁面,是否訪問成功
所謂的網(wǎng)站日志,就是網(wǎng)站所在服務(wù)器接受用戶的各種請求的時候進(jìn)行的處理狀況的記錄,無論是正常處理或者是出了各種錯誤,都會在網(wǎng)站日志中記錄下來,其文件結(jié)尾以。log為擴展名。
2、網(wǎng)站日志舉例
從網(wǎng)站上下載下的網(wǎng)站日志,在txt文本中就可以看到以下數(shù)據(jù):
222.208.186.66--GET/HTTP/1.1-200-32229-http://www.100181.com-Mozilla/4.0(compatible;MSIE6.0;WindowsNT5.0)
222.208.186.66——這是用戶的IP地址,相信大家都能輕易看懂。知道了用戶的IP,你甚至可以通過查詢來得知用戶是來自哪個國家、哪個省份、哪個城市的。查詢得知,這個IP來自國內(nèi)北京地區(qū)。不同的網(wǎng)站其用戶群會有比較明顯的區(qū)別,比如我的博客肯定大多數(shù)訪問者是來自沈陽的,而有的網(wǎng)站其用戶沒有什么明顯的地域區(qū)別。用戶IP配合下面的關(guān)鍵詞等信息可以讓你更加有效的分析網(wǎng)站的用戶體驗做得夠不夠好。
——這里講的是發(fā)生該處理請求的具體時間。這里的時間是2014年8月30日7點16分41秒,后面的+0800則指的是時區(qū),即所在地方相對應(yīng)英國倫敦格林尼治時間,+0800代表的是東八區(qū)的時間。
GET——這是服務(wù)器的處理動作,一共只有兩種:GET和POST。在網(wǎng)站日志中絕大部分都是GET,只有在進(jìn)行CGI處理的時候才會出現(xiàn)POST,否則絕大多數(shù)時間服務(wù)器的響應(yīng)都是GET,也就是用戶從服務(wù)器上獲取了頁面或者別的文件。注意了,GET后面還有一個“/”,這里代表的是用戶訪問的頁面,只有一個斜杠自然代表訪問的是網(wǎng)站首頁。
HTTP/1.1——這個代表用戶訪問該頁面的時候,是通過HTTP1.1協(xié)議進(jìn)行傳輸?shù),也就是超文本傳?.1版本協(xié)議。這個我們不必理會,因為網(wǎng)站日志中除了你可能用FTP之外,普通用戶基本都是通過HTTP協(xié)議來進(jìn)行訪問的(個別提供FTP下載的網(wǎng)站除外)。
200-32229——代表的是用戶訪問頁面的時候返回的狀態(tài)碼。以下就一些代碼做個解釋:
1**:請求收到,繼續(xù)處理2**:操作成功收到,分析、接受3**:完成此請求必須進(jìn)一步處理4**:請求包含一個錯誤語法或不能完成5**:服務(wù)器執(zhí)行一個完全有效請求失敗
100——客戶必須繼續(xù)發(fā)出請求101——客戶要求服務(wù)器根據(jù)請求轉(zhuǎn)換HTTP協(xié)議版本
200——交易成功201——提示知道新文件的URL202——接受和處理、但處理未完成203——返回信息不確定或不完整204——請求收到,但返回信息為空205——服務(wù)器完成了請求,用戶代理必須復(fù)位當(dāng)前已經(jīng)瀏覽過的文件206——服務(wù)器已經(jīng)完成了部分用戶的GET請求
300——請求的資源可在多處得到301——刪除請求數(shù)據(jù)302——在其他地址發(fā)現(xiàn)了請求數(shù)據(jù)303——建議客戶訪問其他URL或訪問方式304——客戶端已經(jīng)執(zhí)行了GET,但文件未變化305——請求的資源必須從服務(wù)器指定的地址得到306——前一版本HTTP中使用的代碼,現(xiàn)行版本中不再使用307——申明請求的資源臨時性刪除
400——錯誤請求,如語法錯誤
401——請求授權(quán)失敗
402——保留有效ChargeTo頭響應(yīng)
403——請求不允許
404——沒有發(fā)現(xiàn)文件、查詢或URl
405——用戶在Request-Line字段定義的方法不允許
406——根據(jù)用戶發(fā)送的Accept拖,請求資源不可訪問
407——類似401,用戶必須首先在代理服務(wù)器上得到授權(quán)
408——客戶端沒有在用戶指定的餓時間內(nèi)完成請求
409——對當(dāng)前資源狀態(tài),請求不能完成
410——服務(wù)器上不再有此資源且無進(jìn)一步的參考地址
411——服務(wù)器拒絕用戶定義的Content-Length屬性請求
412——一個或多個請求頭字段在當(dāng)前請求中錯誤
413——請求的資源大于服務(wù)器允許的大小
414——請求的資源URL長于服務(wù)器允許的長度
415——請求資源不支持請求項目格式
416——請求中包含Range請求頭字段,在當(dāng)前請求資源范圍內(nèi)沒有range指示值,請求也不包含If-Range請求頭字段
417——服務(wù)器不滿足請求Expect頭字段指定的期望值,如果是代理服務(wù)器,可能是下一級服務(wù)器不能滿足請求
500——服務(wù)器產(chǎn)生內(nèi)部錯誤501——服務(wù)器不支持請求的函數(shù)502——服務(wù)器暫時不可用,有時是為了防止發(fā)生系統(tǒng)過載503——服務(wù)器過載或暫停維修504——關(guān)口過載,服務(wù)器使用另一個關(guān)口或服務(wù)來響應(yīng)用戶,等待時間設(shè)定值較長505——服務(wù)器不支持或拒絕支請求頭中指定的HTTP版本。
以上就是簡單對一段網(wǎng)站日志進(jìn)行的分析,當(dāng)然實際上大多數(shù)時候我們根本不需要這樣人工去查看網(wǎng)站日志,有大把的網(wǎng)站日志工具可以供我們使用分析網(wǎng)站日志。不過當(dāng)你的網(wǎng)站出現(xiàn)了一些問題的時候,那么一般的日志分析軟件就無法幫助你進(jìn)行分析的,你必須需要自己去查看日志了。
轉(zhuǎn)載請保留原文地址: http://headlineschannel.com/show-457.html