请高手指点一下如何获取无规则字串（页面源码无规则）

moonwey 发表于 2011-4-26 11:33:19

火车头采集的时候如何获取页面全部代码？

比如页面源码是0E3714B312180E0F0F74 这样的字串（字串无规则）只有一行而没有<html></html>这样的常规标记

采集的时候开头字串结尾字串如果都不写的话采集不到任何东西直接 [参数]也不行 (?<content>[\s\S]*?)也获取不了

请问这样的情况如何获取全部页面代码

denguj 发表于 2011-4-26 13:06:45

那你换一个啊，肯定不行的
http://www.frostid.com/

moonwey 发表于 2011-4-26 14:44:40

换什么？有高手出来指点一下应该怎么做……

moonwey 发表于 2011-4-26 14:45:43

换什么？有高手出来指点一下应该怎么做……

303718 发表于 2011-4-26 14:47:45

正则应该行的呀。

moonwey 发表于 2011-4-26 14:50:02

(?<content>[\s\S]*?) 这个就是正则取全部但是火车头定义的是必须有开始字串和结束字串结果就是取不到任何

moonwey 发表于 2011-5-15 01:45:36

求解~~~~~~~~~~~~~~~~~

页: [1]

火车采集器软件交流官方论坛's Archiver

请高手指点一下如何获取 无规则字串（页面源码无规则）

请高手指点一下如何获取无规则字串（页面源码无规则）