如何在指定区域内采集内容标签?
比如说:设置0级,xxx.htm是我要采集内容的页面,要采集的页面代码例如<imsg>aa</imsg>
若干不规则代码
<--a>
若干不规则代码
<imsg>bb</imsg>
若干不规则代码
<--b>
<imsg>cc</imsg>我只想采集BB怎么做?
我没有想到办法
如果能制定采集区域<--a>到<--b>区域并采规则开头是<imsg>结尾是</imsg>那么就能采集到BB了 希望火车头能增加这个功能呀
我要采集的页面类似http://tv.qq.com/left_menu.htm 我只要采集热播节目里的内容 <imsg>(*)<imsg>
</imsg>
中间有回车用(*)好像不行吧???????
或干代码中间有很多回车用(*)好像不行吧??????? 用<imsg>(*)<imsg></imsg>
采集到的应该是
若干不规则代码
<--a>
若干不规则代码
<imsg>bb
而不是单单BB呀
页:
[1]