规则是“aliexpress单品抓取-网页代码版”
https://www.aliexpress.com/store ... 32_32807407823.html
问题1:在详情描述模块那里,我用高级设置抓取这部分的网页代码,在测试里能够体现出来,也能生成xml文件,但是问题在上传xml压缩包到网站转换excel文件的时候,会出现混乱,应该是网页代码影响了excel文件的生成,有什么办法可以 解决?期望代码按照文本格式放到一个excel单元格里面!
问题2:我想要采集详情描述里面的图片的网址,不需要其他的东西(很多图片的参数也不要),只要@scr的内容,自定义xpath应该怎样写才行?
问题3:关于采集了速卖通平台系统的产品参数模块得到的文本信息是有多个回车的,可以通过编写xpath将这种多个连续的回车键变成1个吗?希望那些项目不是换行了2-3行,换行一次就行。
|
本帖子中包含更多资源
您需要 登录 才可以下载或查看,没有帐号?立即注册
x
|
|
|
|
共 12 个关于本帖的回复 最后回复于 2017-5-30 15:55