moonwey 发表于 2011-4-26 11:33:19

请高手指点一下如何获取 无规则字串(页面源码无规则)

火车头采集的时候如何获取页面全部代码?

比如页面源码是0E3714B312180E0F0F74   这样的字串(字串无规则)   只有一行   而没有<html></html>这样的常规标记   

采集的时候 开头字串 结尾字串   如果都不写的话采集不到任何东西   直接 [参数]也不行   (?<content>[\s\S]*?)也获取不了


请问 这样的情况如何获取全部页面代码

denguj 发表于 2011-4-26 13:06:45

那你换一个啊,肯定不行的
http://www.frostid.com/

moonwey 发表于 2011-4-26 14:44:40

换什么?有高手出来指点一下应该怎么做……

moonwey 发表于 2011-4-26 14:45:43

换什么?有高手出来指点一下应该怎么做……

303718 发表于 2011-4-26 14:47:45

正则应该行的呀。

moonwey 发表于 2011-4-26 14:50:02

(?<content>[\s\S]*?) 这个就是正则取全部   但是火车头定义的是必须有 开始字串 和 结束字串结果就是取不到任何

moonwey 发表于 2011-5-15 01:45:36

求解~~~~~~~~~~~~~~~~~
页: [1]
查看完整版本: 请高手指点一下如何获取 无规则字串(页面源码无规则)