951963 发表于 2019-3-12 10:20:13

求解各位大神们帮忙看一下这个网站的如何写采集规则?

https://www.bjggzyfw.gov.cn/cmsbj/jyxxggjtbyqs/index.html

leweizxl 发表于 2019-3-12 12:53:03

源码里有数据直接根据源码采集即可

951963 发表于 2019-3-12 13:01:17

leweizxl 发表于 2019-3-12 12:53
源码里有数据直接根据源码采集即可

根据数据源采集不到,所以我想知道原因

leweizxl 发表于 2019-3-13 08:44:46

951963 发表于 2019-3-12 13:01
根据数据源采集不到,所以我想知道原因

规则里加上cookie后看下

951963 发表于 2019-3-13 15:48:03

leweizxl 发表于 2019-3-13 08:44
规则里加上cookie后看下

还是不行好像网址开头为https的就采不出网址,我今天也遇到一个这样的网站

leweizxl 发表于 2019-3-13 16:37:45

951963 发表于 2019-3-13 15:48
还是不行好像网址开头为https的就采不出网址,我今天也遇到一个这样的网站 ...

可以做的 照文档处理下

951963 发表于 2019-3-19 15:54:49

leweizxl 发表于 2019-3-13 16:37
可以做的 照文档处理下

为什么只有在抓包软件打开的情况下才能采集出来,关闭抓包软件就不可以呢?

leweizxl 发表于 2019-3-20 08:51:01

951963 发表于 2019-3-19 15:54
为什么只有在抓包软件打开的情况下才能采集出来,关闭抓包软件就不可以呢? ...

不会的对应都加上cookie和user-agent了吗

951963 发表于 2019-3-21 09:52:37

leweizxl 发表于 2019-3-20 08:51
不会的对应都加上cookie和user-agent了吗

加上了,但是就是已关闭抓包软件采不出来了,打开抓包软件就可以

leweizxl 发表于 2019-3-21 13:19:05

leweizxl 发表于 2019-3-20 08:51
不会的对应都加上cookie和user-agent了吗

联系下QQ474391168提供下规则看看
页: [1]
查看完整版本: 求解各位大神们帮忙看一下这个网站的如何写采集规则?