爬取微博热点话题时,使用样例复制总是漏掉第一条数据是怎么回事?百度上说要使用绝对定位,应该怎么实现呢?

{L~A`84S}(@B)JI4]MRR]%4.png (18.06 KB, 下载次数: 895)

测试的输出信息

测试的输出信息

RM(S{JMH5QBVD~RGQCH)RXN.png (74.58 KB, 下载次数: 919)

想要爬的列表

想要爬的列表
举报 使用道具
| 回复

共 9 个关于本帖的回复 最后回复于 2017-4-13 12:00

沙发
Fuller 管理员 发表于 2017-4-12 16:17:47 | 只看该作者
把你的主题名发出来,我加载分析一下试试,第一条除了TOP1的颜色不一样以外,其他都一样,可能就是因为这个颜色造成的
举报 使用道具
板凳
jianjian520520J 初级会员 发表于 2017-4-12 16:45:19 | 只看该作者
Fuller 发表于 2017-4-12 16:17
把你的主题名发出来,我加载分析一下试试,第一条除了TOP1的颜色不一样以外,其他都一样,可能就是因为这个 ...

主题名HotTopic_demo,谢谢了!
举报 使用道具
地板
xandy 论坛元老 发表于 2017-4-12 17:01:59 | 只看该作者
jianjian520520J 发表于 2017-4-12 16:45
主题名HotTopic_demo,谢谢了!

问题出在你内容映射错了,你重新加载规则,将第一个li里头对应的内容做映射,然后测试就正常了
举报 使用道具
5#
jianjian520520J 初级会员 发表于 2017-4-12 17:54:19 | 只看该作者
xandy 发表于 2017-4-12 17:01
问题出在你内容映射错了,你重新加载规则,将第一个li里头对应的内容做映射,然后测试就正常了
...

不知道为什么还是不行,我是先内容映射了,然后再样例复制。内容映射选中的是具体每个#text,样例复制是选中top1和top2样例的LI标签,你刚刚说的让我吧li里面的内容做映射是什么意思呀?谢谢你!

IOMHNPC3BQR5BM}(QB8}_}Q.png (20.08 KB, 下载次数: 862)

IOMHNPC3BQR5BM}(QB8}_}Q.png

QJTZ0O{Q2UUOM0TAM$(`$[P.png (45.32 KB, 下载次数: 933)

QJTZ0O{Q2UUOM0TAM$(`$[P.png

7L4DXV09H_FH12UB@Q5U]%A.png (200.83 KB, 下载次数: 877)

7L4DXV09H_FH12UB@Q5U]%A.png
举报 使用道具
6#
Fuller 管理员 发表于 2017-4-12 18:31:18 | 只看该作者
jianjian520520J 发表于 2017-4-12 17:54
不知道为什么还是不行,我是先内容映射了,然后再样例复制。内容映射选中的是具体每个#text,样例复制是 ...

是不是把这个主题删除了?怎么搜不到了
举报 使用道具
7#
jianjian520520J 初级会员 发表于 2017-4-12 18:48:25 | 只看该作者
Fuller 发表于 2017-4-12 18:31
是不是把这个主题删除了?怎么搜不到了

现在可以查了,刚刚不小心删了,可以再帮我看看吗?
举报 使用道具
8#
Fuller 管理员 发表于 2017-4-12 19:32:59 | 只看该作者
jianjian520520J 发表于 2017-4-12 18:48
现在可以查了,刚刚不小心删了,可以再帮我看看吗?

你应该用top1那个内容做内容映射或者做直观标注,你却用了top2,所以就会少第一个
举报 使用道具
9#
jianjian520520J 初级会员 发表于 2017-4-13 09:47:19 | 只看该作者
Fuller 发表于 2017-4-12 19:32
你应该用top1那个内容做内容映射或者做直观标注,你却用了top2,所以就会少第一个
...

现在第一条数据出来了,但是其他的数据都没有榜单排名了,主题名还是HotTopic_demo,谢谢!

[ZXGBUNVPS4RFEQK7N3RJ49.png (27.28 KB, 下载次数: 897)

[ZXGBUNVPS4RFEQK7N3RJ49.png

SKRY$UA2{BP4ZZO%LL}L{NY.png (4.33 KB, 下载次数: 888)

SKRY$UA2{BP4ZZO%LL}L{NY.png
举报 使用道具
10#
Fuller 管理员 发表于 2017-4-13 12:00:00 | 只看该作者
jianjian520520J 发表于 2017-4-13 09:47
现在第一条数据出来了,但是其他的数据都没有榜单排名了,主题名还是HotTopic_demo,谢谢!
...

因为榜单排名第一个是红色的,@class值不一样,要避免使用@class值,可以点击“定位”按钮,选择绝对定位


绝对定位的适应性比较差,那么可以手工做定位标志映射,跳过不合适的定位标志,也能解决这个问题



如上图,我手工做了定位标志映射,选择了@class='title W_autocut',而不用下面的那个定位标志
举报 使用道具
您需要登录后才可以回帖 登录 | 立即注册

精彩推荐

  • Gephi社会网络分析-马蜂窝游记文本分词并同
  • Gephi社会网络分析-基于马蜂窝游记文本以词
  • 知乎话题文本根据词语间距筛选后生成共词矩
  • 马蜂窝游记文本分词后以词语间距为筛选条件
  • 学习使用apriori算法挖掘关联关系

热门用户

GMT+8, 2024-5-18 14:40