有个代码无论是用正则提取还是前后提取都失败了。请教!
我在建立一个亚马逊的reviewer的profile的邮箱提取任务,但是到了最后一步,一直失败,无论是正则提起还是前后提取,希望有大神能够提点一下,感激不尽!!!!!以下上图和网站网站:https://www.amazon.com/gp/profile/amzn1.account.AHYBX6EANOOCEYI4S4XXDBLXKD5Q/ref=cm_cr_arp_d_pdp?ie=UTF8
这有一个特点,当你没有登录亚马逊账号的时候是没有看到在左边About版块有一个Send an Email的链接的,但是这个选项并不是一个链接,只是点了以后会打开一个用来发邮件的办公软件。
在附件中我放了几张网页源代码和检查元素的截图
另外,我试过爬取整个网页的源代码下来也不行,不知道是不是我用错了代码:^(?<content>[\s\S]*?)$
希望有大神能够指点一下我。感激不尽。我的QQ是351087332。邮箱是351087332@qq.com
登录后抓包看看信息 leweizxl 发表于 2018-1-2 17:34
登录后抓包看看信息
昨天在测试中可以成功了,但是保存任务运行以后发现就不行了,他的保存结果很奇怪,都是
输出结果为:[标签:内容][标签:标题]
[标签:内容][标签:标题]
请问这情况是什么原因呢,谢谢您的帮助。 cookie 放了吗 sidian 发表于 2018-1-3 10:22
昨天在测试中可以成功了,但是保存任务运行以后发现就不行了,他的保存结果很奇怪,都是
输出结果为:[标 ...
保存模板的标签和采集标签是否一致对比下看看 longouxiu 发表于 2018-1-3 11:03
cookie 放了吗
是默认模板没有设置好,现在已经能够正常运行啦。谢谢~~~ leweizxl 发表于 2018-1-3 13:23
保存模板的标签和采集标签是否一致对比下看看
是保存模板没有设置一个对应的,看了官网的视频以后。现在已经能够全部正常运行了。谢谢大神的指点~~~ 可以加我qq2260822064,我也许可以帮你
页:
[1]