怎样阻止51yes弹出关于sa.aspx的窗口

DataScraper提取网站数据时,可能会遇到弹出窗口的情况,DataScraper能够自动关闭目标网站弹出的窗口,但是,最近大量网站会弹出询问是否存储sa.aspx文件的对话框,该文件是由http://count6.51yes.com 发布的,count后面的数字会变。Firefox并不知道该怎样处理aspx文件,缺省情况下,会询问用户怎样处理这些文件,用户可以选择打开或者存储。这种弹出窗口虽然不影响DataScraper的继续运行,但是,由于不能自动关闭,仍然会造成资源消耗。

下面讲解几种解决方案。



修改Firefox的选项

选择Firefox菜单“工具”-〉“选项”,选择“应用程序”,可以看到Firefox对各种内容采取的动作,缺省情况下,对aspx总是询问,可以改成“保存文件”,除了对aspx这样处理外,对其它内容类型也可以这样处理。



修改hosts文件

将属于51yes.com域名的主机名都列到hosts中,并且地址解析成127.0.0.1,有下面这些项目:

  • 127.0.0.1 count1.51yes.com
  • 127.0.0.1 count2.51yes.com
  • 127.0.0.1 count3.51yes.com
  • 127.0.0.1 count4.51yes.com
  • 127.0.0.1 count5.51yes.com
  • 127.0.0.1 count6.51yes.com
  • 127.0.0.1 count7.51yes.com
  • 127.0.0.1 count8.51yes.com
  • 127.0.0.1 count9.51yes.com
  • 127.0.0.1 count10.51yes.com
  • 按规律写,直到
  • 127.0.0.1 count50.51yes.com

这样可以避免访问51yes.com的主机。当然,如果文件不是来自51yes.com,则需要增加那个目标网站的地址解析项。例如,从point.tool.hexun.com也会下载point.aspx文件。

如果在Vista下编辑c:\WINDOWS\system32\drivers\etc\hosts文件,运行记事本(notepad)程序时要用管理员身份,否则无法存盘。



禁止Javascript

企业版网站数据提取程序DataScraper有以下三个选项:

  • 是否允许下载需要插件才能解释的内容
  • 是否允许下载图片
  • 是否允许Javascript

将这些选项设置成false,可以大大提高网站数据提取速度,也可以用来解决这个问题。因为,弹出上述询问窗口的网站是流量监测和统计网站,用javascript实现监测功能,如果禁止Javascript运行,即可阻止上述窗口。



其它解决方法

选择Firefox菜单“工具”-〉“选项”,选择“应用程序”,可以看到对aspx文件的配置,在这个界面上无法删除配置项目的,但是,通过人工的方法可以办到。参考手动添加firefox未关联的协议,可以编辑Profiles目录下的mimeTypes.rdf,将关于aspx的项目删除。如果是Vista操作系统,该文件可能位置是:C:\Users\xx用户名\AppData\Roaming\Mozilla\Firefox\Profiles\i37szftb.default 。关于怎样操作这些选项,还可以参考在应用程序里添加内容类型

也许这个方法算得上是根除上述问题的方法。