dantj 发表于 2007-11-25 03:41:13

如何在指定区域内采集内容标签?

比如说:设置0级,xxx.htm是我要采集内容的页面,要采集的页面代码例如
<imsg>aa</imsg>
若干不规则代码
<--a>
若干不规则代码
<imsg>bb</imsg>
若干不规则代码
<--b>
<imsg>cc</imsg>我只想采集BB怎么做?

我没有想到办法

如果能制定采集区域<--a>到<--b>区域并采规则开头是<imsg>结尾是</imsg>那么就能采集到BB了 希望火车头能增加这个功能呀

我要采集的页面类似http://tv.qq.com/left_menu.htm 我只要采集热播节目里的内容

rq204 发表于 2007-11-25 10:14:07

<imsg>(*)<imsg>


</imsg>

dantj 发表于 2007-11-25 18:15:57

中间有回车用(*)好像不行吧???????

或干代码中间有很多回车用(*)好像不行吧???????

dantj 发表于 2007-11-25 18:17:22

用<imsg>(*)<imsg>
</imsg>
采集到的应该是
若干不规则代码
<--a>
若干不规则代码
<imsg>bb
而不是单单BB呀
页: [1]
查看完整版本: 如何在指定区域内采集内容标签?