阅读文章
文件 robots.txt 的新增特点及 REP meta 标签
来源:网络摘录 日期:2008-06-18 23:13 点击:98
现在生成的报告也好多了。你可以在一行中知道多个问题的答案(如果有的话)。不像早期版本,一行仅第一个遇到的问题给出答案。同时,我们也在其他用以分析和验证的功能上取得了改进。
假设你负责域名 www.example.com,你希望搜索引擎索引你网站的除/ images 文件夹之外的一切内容。您还想确保你的网站地图被搜索引擎知道,那么你可以使用以下内容作为你的 robots.txt 文件:
disallow images
user-agent: *
Disallow:
sitemap: http://www.example.com/sitemap.xml
你可以访问站长中心,使用 robots.txt 分析工具对你的网站进行测试,用这两个 URL 作测试:
http://www.example.com
/archives
站长工具的较早版本将会报错:

改进版会告诉你关于robots.txt文件的更多信息:

你可以在
我们还希望确保你听说过新的 unavailable_after 元标签,该标签由 Dan Crow 数周前在谷歌
让我们假设你的一个促销活动有效期截至 2007 年年底。在 www.example.com/2007promotion.html 的源码开始,你可以使用以下行:
<META NAME="GOOGLEBOT"
CONTENT="unavailable_after: 31-Dec-2007 23:59:59 EST">
另一个令人振奋的消息是新的 X-Robots-Tag 指令。它增加了
X-Robots-Tag: unavailable_after: 31 Dec
2007 23:59:59 EST
请记住,REP META 标签可用于实现针对页面索引控制的 noarchive,nosnippet,及现在的 unavailable_after 标签。这和 robots.txt 不同,robots.txt 是对整个域名进行控制的。我们是应博客们和网站管理员的要求而增加这些特性的,请试用。如果你有其他的建议,也请随时提出。想问一些问题?请在我们的