火车头对于返回的json内容怎么将整个页面的内容全部提取

星韵依旧 发表于 2019-4-27 08:32:21

火车头对于返回的json内容怎么将整个页面的内容全部提取？因为返回的内容经常有变化（前后的特征标签），所以前后截取、和xpath都不能用，正则正常的也没办法，有大神指导怎么采集劝业内容的吗。

leweizxl 发表于 2019-4-27 08:41:09

直接正则^(?<content>[\s\S]*?)$

星韵依旧 发表于 2019-4-27 08:43:46

本帖最后由星韵依旧于 2019-4-27 09:26 编辑

leweizxl 发表于 2019-4-27 08:41
直接正则^(?[\s\S]*?)$
正则提取？

星韵依旧 发表于 2019-4-27 08:50:43

leweizxl 发表于 2019-4-27 08:41
直接正则^(?[\s\S]*?)$

正则匹配里吗？开始和结束符不识别，放上去还是采集不到内容

星韵依旧 发表于 2019-4-27 08:56:14

leweizxl 发表于 2019-4-27 08:41
直接正则^(?[\s\S]*?)$

谢谢弄好了

leweizxl 发表于 2019-4-27 09:19:10

星韵依旧发表于 2019-4-27 08:56
谢谢弄好了

好

kindaovo 发表于 2019-10-23 17:00:54

请问楼主怎么解决的啊？

页: [1]

火车采集器软件交流官方论坛's Archiver