练习2:FreeFormat法创建映射 | |||
![]() |
步骤二(续1):FreeFormat映射。 | ||
【目的】:寻找可采用FreeFormat映射方法的标志(id或class)。若有,则进行FreeFormat映射。 | |||
【实际操作】 再看第二个信息属性"地址电话": 1 点击浏览器窗口首条记录的地址部分,据序号提示,找到对应节点"LI"(本例:892行),展开见含地址内容的子节点text。两节点相应的id或class均无值。 以下过程为寻找可在此使用FreeFormat映射的节点: 2/3/5 这些节点的class都有值,但这些节点并不包容我们想要的地址信息。不可用于(针对此信息属性的)FreeFormat映射。 4 872行节点UL是精准对应节点的父父节点,且有class值"detail",包容我们想要的地址信息,可用于(针对此信息属性的)FreeFormat映射。 提示:若想提取的只是页面上的单一元素,只要其上级父节点的class或id有值,即可采用FreeFormat映射。但要提取的是页面上的多条记录,则能够采用FreeFormat映射的节点条件如下: 1 此字段首值精准对应节点的各级父节点; 2 且父节点不可包容两条及以上记录的内容; 3 且父节点的class或id有值(名称),且值在各条记录中要完全相同; 才可用于针对此字段(信息属性)的FreeFormat映射。 另,若多级父节点符合条件,一般选取较近的。 |
|||
Copyright(c) 2007-2010, Fuller Hua. All Rights Reserved. |