星韵依旧 发表于 2019-4-27 08:32:21

火车头对于返回的json内容怎么将整个页面的内容全部提取

火车头对于返回的json内容怎么将整个页面的内容全部提取?因为返回的内容经常有变化(前后的特征标签),所以前后截取、和xpath都不能用,正则正常的也没办法,有大神指导怎么采集劝业内容的吗。

leweizxl 发表于 2019-4-27 08:41:09

直接正则^(?<content>[\s\S]*?)$

星韵依旧 发表于 2019-4-27 08:43:46

本帖最后由 星韵依旧 于 2019-4-27 09:26 编辑

leweizxl 发表于 2019-4-27 08:41
直接正则^(?[\s\S]*?)$
正则提取?

星韵依旧 发表于 2019-4-27 08:50:43

leweizxl 发表于 2019-4-27 08:41
直接正则^(?[\s\S]*?)$

正则匹配里吗?开始和结束符不识别 ,放上去还是采集不到内容

星韵依旧 发表于 2019-4-27 08:56:14

leweizxl 发表于 2019-4-27 08:41
直接正则^(?[\s\S]*?)$

谢谢 弄好了

leweizxl 发表于 2019-4-27 09:19:10

星韵依旧 发表于 2019-4-27 08:56
谢谢 弄好了

kindaovo 发表于 2019-10-23 17:00:54

请问楼主怎么解决的啊?
页: [1]
查看完整版本: 火车头对于返回的json内容怎么将整个页面的内容全部提取