21#
Fuller 管理员 发表于 2017-2-8 22:04:11 | 只看该作者
我还是加载不了,你在MS谋数台上把规则加载好,然后在地址栏输入这个新网址,等加载好内容后,选择菜单 规则-〉刷新网页结构,再选择菜单 规则-〉分析页面 ,看看失败原因是什么
举报 使用道具
22#
Fuller 管理员 发表于 2017-2-8 22:06:27 | 只看该作者
也可能是我家里的网络不行,在办公室是能加载这个规则的,在家连规则也加载不了了
举报 使用道具
23#
1501802756 初级会员 发表于 2017-2-8 22:49:40 | 只看该作者
Fuller 发表于 2017-2-8 22:04
我还是加载不了,你在MS谋数台上把规则加载好,然后在地址栏输入这个新网址,等加载好内容后,选择菜单 规 ...

试了,规则加载是修改前的规则,不是修改后的规则,分析不了规则修改后是否通用?
但是单独对这两个链接进行规则修改,使用contains函数,勾选关键内容,又是可以的。

举报 使用道具
24#
1501802756 初级会员 发表于 2017-2-8 22:50:33 | 只看该作者
Fuller 发表于 2017-2-8 22:04
我还是加载不了,你在MS谋数台上把规则加载好,然后在地址栏输入这个新网址,等加载好内容后,选择菜单 规 ...

所以不知道问题出在哪里?
举报 使用道具
25#
Fuller 管理员 发表于 2017-2-8 23:20:01 | 只看该作者
1501802756 发表于 2017-2-8 22:49
试了,规则加载是修改前的规则,不是修改后的规则,分析不了规则修改后是否通用?
但是单独对这两个链接 ...

你说的修改是不是手工编辑规则?然后点击“保存修改”按钮保存的?
如果是手工修改的规则,一定要用“保存修改”按钮做保存,不能用工具条上的“存规则”,因为“存规则”按钮永远是最新自动生成的规则,会把手工修改的冲掉。

所以,操作顺序很重要,要先“存规则”,再手工修改后“保存修改”。

下载加载规则的时候,是看不到手工修改的部分的。比如,抓取某个网页失败了,你想加载规则做分析,无法加载手工修改的内容。

只能通过观察DS打数机的抓取结果来判断手工修改是否有效
举报 使用道具
26#
1501802756 初级会员 发表于 2017-2-9 10:55:40 | 只看该作者
Fuller 发表于 2017-2-8 23:20
你说的修改是不是手工编辑规则?然后点击“保存修改”按钮保存的?
如果是手工修改的规则,一定要用“保 ...

是点击“保存修改”保存修改后的规则。你试一下提取这几个页面就知道了。
http://www.trademal.com/global/i ... _SDN_BHD/index.html
http://www.trademal.com/global/i ... _Sdn_Bhd/index.html
http://www.trademal.com/global/i ... n_Berhad/index.html

举报 使用道具
27#
Fuller 管理员 发表于 2017-2-9 11:11:05 | 只看该作者
1501802756 发表于 2017-2-9 10:55
是点击“保存修改”保存修改后的规则。你试一下提取这几个页面就知道了。
http://www.trademal.com/globa ...

“保存修改”的规则,下次加载不了,只能加载自动生成的规则,所以,我也看不了你的规则修改的是否合适。

下次如果点击工具条上的“存规则”,也会把“保存修改”的内容给冲掉
举报 使用道具
28#
ym 版主 发表于 2017-2-9 11:28:29 | 只看该作者
1501802756 发表于 2017-2-9 10:55
是点击“保存修改”保存修改后的规则。你试一下提取这几个页面就知道了。
http://www.trademal.com/globa ...

不用修改数据规则,直接对整理箱的抓取内容设置自定义xpath(容器节点不支持自定义xpath),再点击“存规则”,修改的程序不会被覆盖,参考教程《自定义xpath:精确采集》
举报 使用道具
29#
1501802756 初级会员 发表于 2017-2-9 11:47:33 | 只看该作者
ym 发表于 2017-2-9 11:28
不用修改数据规则,直接对整理箱的抓取内容设置自定义xpath(容器节点不支持自定义xpath),再点击“存规 ...

直接对整理箱的抓取内容设置自定义xpath,好像不能勾选关键内容?提示有错误。
容器节点上,能不能修改规则?
你试了提取上面的那个页面吗?

举报 使用道具
30#
1501802756 初级会员 发表于 2017-2-9 11:54:42 | 只看该作者
Fuller 发表于 2017-2-9 11:11
“保存修改”的规则,下次加载不了,只能加载自动生成的规则,所以,我也看不了你的规则修改的是否合适。 ...

<?xml version="1.0" encoding="UTF-8"?>
<xsl:stylesheet version="1.0" xmlns:xsl="http://www.w3.org/1999/XSL/Transform" >
<xsl:template match="/">
<内容>
<xsl:apply-templates select="//tr[contains(td[1]/text(), 'Telephone')]/td[position()=1 and count(./text())>0]" mode="内容"/>
</内容>
</xsl:template>


<xsl:template match="//tr[contains(td[1]/text(), 'Telephone')]/td[position()=1 and count(./text())>0]" mode="内容">
<item>
<名称>
<xsl:value-of select="text()"/>
</名称>
<电话>
<xsl:value-of select="following-sibling::td[position()=1]/text()"/>
</电话>
</item>
</xsl:template>
</xsl:stylesheet>

这是我修改的规则,你可以复制测试一下,我手工测试就成功的。

举报 使用道具
您需要登录后才可以回帖 登录 | 立即注册

精彩推荐

  • 360或火绒等杀毒软件导致GooSeeker爬虫软件
  • 话题分析(NMF模型和LDA模型)软件的安装和
  • 运行Apple无法验证的程序的方法
  • 文本聚类分析软件的安装和使用方法
  • 利用AI阅读和分析文本:扣子COZE记录用户反

热门用户

GMT+8, 2025-5-4 11:40