今天看到国平在他的博客(这里谢谢一个朋友的提醒,原来是语句不通的,当时没留意)里分享了一个很好的seo工具:Lynx,现在把里面的部分内容转过来了:

Lynx是一个文本浏览器,它的出现,恰好是第一个爬虫程序诞生的时候。有相当大的理由相信他们的是一样的理念。而且现在维护和更新Lynx的人员,有些也在维护其他开源的爬虫程序。HTTrack 是一个比较宏观的爬虫模拟器。而Lynx就更细节一些,也更实用一点。

《google网站质量指南》 的第一页 ,就已经建议大家去用Lynx这个工具区检测你的网站:

使用诸如 Lynx 的文本浏览器来检查您的网站,因为大多数搜索引擎信息采集软件查看您网站的方式与 Lynx 几乎一样。如果诸如 Javascript、Cookie、会话 ID、框架、DHTML 或 Flash 等复杂功能造成您无法在文本浏览器中看到整个网站,则搜索引擎信息采集软件在抓取您的网站时可能会遇到问题。

Lynx在seo方面有什么功能呢?它首先是能以一个可视化的角度来展现爬虫看到了什么内容。用它可以挨个检查你的网页给搜索引擎爬虫展现了怎么样的内容。然后才是其他的一些功能:

  • 可以检测网页的隐藏链接,提示是“Hidden links:”
  • 可以检测网页代码的完整性。如果提示有“Bad HTML”就要注意一下。
  • 可以和IE一样查看源文件。 命令在附录中。
  • 对cookie的跟踪是特别对待的。会提示你是不是跟踪cookie。
  • 对框架和表单的处理和爬虫是一样的。
  • URL太多参数,会造成浏览困难。
  • 可以查看网页返回的http头信息。

这里有两个浏览器插件,一个是给 Firefox的,一个是给IE 的。

1、下载Lynx 在线版 for IE                           IE卸载文件

2、下载Lynx 在线版 for Firefox

装上了插件后,在你浏览一个网页的时候,在网页上点击右键的弹出菜单里,会有“以Lynx方式查看”的选项。这样非常方便平常大家查看网页。由于这个工具放在国外的虚拟主机上,可能速度有点慢的。我还不知道有多少人会用这个工具,到时候可能有短暂的时间会使用不了。

为了更好的推广这个工具,大家可以在自己的网站上,加上这个工具。

代码为:

<form action=”http://lynx.semyj.com/lynxview.php” enctype=”application/x-www-form-urlencoded” method=”get” target=”_blank”>

URL:

<input id=”url” style=”width: 300px;” name=”url” type=”text” value=”http://” /> <input type=”submit” value=”查看” />

</form>

附录:Lynx的简要使用说明

Share