本帖最后由 ShelleyWu 于 2016-9-6 16:57 编辑
http://www.koreamold.com/eng/suppliers/company/main.asp 第一层主题: L1_Sim_Click 第二层主题: L2_Sim_Click
步骤1(点击公司名): 第一层做了点击公司, 到第二层去抓取公司细节资料。(L1_Sim_Click -> L2_Sim_Click)
步骤2(点击List返回): 进入第二层主题并采集数据, 在第二层点击List回到第一层, 想要再点击第二个公司。(L2_Sim_Click -> ???)
这个步骤的问题是, 如果第二层指定的目标主题名是L1_Sim_Click,回到第一层会重头点击, 如果改为指定L2_Sim_Click, 会报错, 但第一页可以执行下去。
步骤3(翻页): 重复10次步骤1+步骤2, 点击下一页(2, 3, ...next), 这个一直没成功, 老是跳转不过去, 试过爬虫和连续动作都没能成。而且, 如果使用连续动作, 分页目标主题名应为第一个, 但是就和点击公司的规则矛盾了呀 (L1_Sim_Click -> L1_Sim_Click, 翻页未能成功)
点击下一页包含1,2,3,…一直到next, 每翻一页点一次, 我试了爬虫的相对线索, 在只考虑第一层的时候有成功, 相对线索定位再1跟next。但是分层级采数据就会失败
主要教程好多都是针对有下级线索的阿, 像这种只有javascript的跳转来跳转去, 连续点击不知道能不能做到这么复杂的动作, 如果不行, 可以用啥取代呢
|
共 25 个关于本帖的回复 最后回复于 2016-10-19 15:05