在網站根目錄中增加一個檔案叫robots.txt,內容我只寫了:
User-agent: *
Disallow:
允許所有搜尋引掣將我的網站內容編入索引,未做任何限制。為什麼要增加這個檔案呢?因為近來在後台的錯誤記錄檔中發現,大部份的搜尋機器人在進來網站內部翻攪之前,都會去讀取根目錄下的robots.txt這個檔案,但在預設的wordpress安裝下,並不會產生這個檔案,所以我發現雖然機器人沒有找到這個檔案,但是wordpress還是會送出含有整個檔頭的錯誤頁面給它,而一天之中機器人造訪的次數不計其數,因此無意間流量大增,但增加的都是錯誤頁面的流量,再加上之前從MT跳船到WP,但有許多spambot還是繼續向原來MT的路徑發送垃圾留言,這可能也是導致流量驚人的原因。
以上這些都是我的猜想與假設,因為對於本站的高流量實在有著許多的不解,從cpanel裡看不出所以然來,總流量高得嚇人,可是單看網域的流量,其實是小的很,而且也沒放檔案給人下載,或者是該考慮換主機商的時候吧!
另外舉例來說,若要限制搜尋引掣索引其中一個資料夾,如images,那麼可以把規則寫成這樣:
User-agent: *
Disallow: /images/
而我只是因為想要減少錯誤頁面的送出流量,所以在robots.txt中沒有限制任何不被索引的資料夾。
ps.誰知道好的主機商請介紹一下哦!