adfdamao 发表于 2018-3-16 14:15:06

求助:不知所措

我做了一个规则采集网站新闻数据并导出成本地文件
最初是好用的,突然有一天采集不到内容,又过了几天有好用了,然后现在又不好用了
规则我是没检查出问题,
请求各位大神方便的时候帮我看看原因,谢谢
规则我放在附件里了

leweizxl 发表于 2018-3-16 14:20:56

您的这个描述应该就是封ip的问题   可以尽量降低采集的速度

adfdamao 发表于 2018-3-16 16:12:40

leweizxl 发表于 2018-3-16 14:20
您的这个描述应该就是封ip的问题   可以尽量降低采集的速度

你说的是线程数和请求间隔吗?我增大到2000ms也不行。
而且在采集测试单页时也居然采集不到数据。

leweizxl 发表于 2018-3-16 16:29:37

adfdamao 发表于 2018-3-16 16:12
你说的是线程数和请求间隔吗?我增大到2000ms也不行。
而且在采集测试单页时也居然采集不到数据。 ...

重新获取下网页cookie试试看呢

adfdamao 发表于 2018-3-19 10:24:42

试了,也没不好使,我甚至怀疑我规则写的不对。
然后我用了<title></title>这个唯一的标识符也没采集到内容
一脸懵B呢

leweizxl 发表于 2018-3-19 11:30:24

adfdamao 发表于 2018-3-19 10:24
试了,也没不好使,我甚至怀疑我规则写的不对。
然后我用了这个唯一的标识符也没采集到内容
一脸懵B呢 ...

具体请联系企业QQ800019423在线咨询下

jinanhuochetou 发表于 2018-3-21 18:01:54

我碰到和你一样的问题。规则没问题, IP也代理换了。就是抓取不下来内容。

枕边人 发表于 2018-3-27 15:35:14

jinanhuochetou 发表于 2018-3-21 18:01
我碰到和你一样的问题。规则没问题, IP也代理换了。就是抓取不下来内容。 ...

你可以试试 把网址携带的参数 没有用的参数删了   哪些参数也可以改变网页数据

枕边人 发表于 2018-3-27 15:37:22

你试试 把网址带的参数 没用的都删了参数也能改变网页的数据的
页: [1]
查看完整版本: 求助:不知所措