练习2:FreeFormat法创建映射
上一页 | 下一页
 
  步骤二(续1):FreeFormat映射。
 
【目的】:寻找可采用FreeFormat映射方法的标志(id或class)。若有,则进行FreeFormat映射。
【实际操作】
再看第二个信息属性"地址电话":
1 点击浏览器窗口首条记录的地址部分,据序号提示,找到对应节点"LI"(本例:892行),展开见含地址内容的子节点text。两节点相应的id或class均无值。
以下过程为寻找可在此使用FreeFormat映射的节点
2/3/5 这些节点的class都有值,但这些节点并不包容我们想要的地址信息。不可用于(针对此信息属性的)FreeFormat映射。
4 872行节点UL是精准对应节点的父父节点,且有class值"detail",包容我们想要的地址信息,可用于(针对此信息属性的)FreeFormat映射。
提示:若想提取的只是页面上的单一元素,只要其上级父节点的class或id有值,即可采用FreeFormat映射。但要提取的是页面上的多条记录,则能够采用FreeFormat映射的节点条件如下:
1 此字段首值精准对应节点的各级父节点;
2 且父节点不可包容两条及以上记录的内容;
3 且父节点的class或id有值(名称),且值在各条记录中要完全相同;
才可用于针对此字段(信息属性)的FreeFormat映射。
另,若多级父节点符合条件,一般选取较近的。
 
Copyright(c) 2007-2010, Fuller Hua. All Rights Reserved.