天蠶在你身邊
不方便打電話?讓天蠶聯絡你
什么是 robots.txt ?
robots.txt 是一個純文本文件,通過在這個文件中聲明該網站中不想被 robots 訪問的部分,這樣,該網站的部分或全部內容就可以不被搜索引擎收錄了,或者指定搜索引擎只收錄指定的內容。 當一個搜索機器人訪問一個站點時,它會首先檢查該站點根目錄下是否存在 robots.txt ,如果找到,搜索機器人就會按照該文件中的內容來確定訪問的范圍,如果該文件不存在,那么搜索機器人就沿著鏈接抓取。 robots.txt 必須放置在一個站點的根目錄下,而且文件名必須全部小寫。 網站 URL相應的 robots.txt 的 URL
robots.txt 的語法
"robots.txt" 文件包含一條或更多的記錄,這些記錄通過空行分開(以 CR,CR/NL, or NL 作為結束符),每一條記錄的格式如下所示:
"<field>:<optionalspace><value><optionalspace>" 。 在該文件中可以使用 # 進行注解,具體使用方法和 UNIX 中的慣例一樣。該文件中的記錄通常以一行或多行 User-agent 開始,后面加上若干 Disallow 行 , 詳細情況如下:
User-agent:
Disallow :
下面是一些 robots.txt 基本的用法:
l 禁止所有搜索引擎訪問網站的任何部分:
地址:重慶市渝中區(qū)上清寺鑫隆達B座28-8
郵編:400015
電話:023-63612462
EMAIL:cnjl_net@163.com