2170236598 发表于 2019-2-27 16:25:09

好像火车头采集不了这种网页


只采集标题和正文,正文里包含有表格,要求是发布输出到WORD后,正文内容排版格式不变。
http://www.runoob.com/python/python-reg-expressions.html

leweizxl 发表于 2019-2-28 08:55:26

直接获取全部信息

2170236598 发表于 2019-2-28 14:44:52

请问什么样操作?

leweizxl 发表于 2019-3-8 13:46:30

2170236598 发表于 2019-2-28 14:44
请问什么样操作?

直接正则 ^(?<content>[\s\S]*?)$
页: [1]
查看完整版本: 好像火车头采集不了这种网页