kflx 发表于 2007-8-4 20:12:00

请教个问题

我在采集一个站的时候 他的页面连接是这样的
<td align='right'><select id='dedepagetitles' >
<option value='139.html'>1、播放列表:第18话</option>
<option value='139_2.html'>2、播放列表:第17话</option>
<option value='139_3.html'>3、播放列表:第16话</option>
<option value='139_4.html'>4、播放列表:第15话</option>
<option value='139_5.html'>5、播放列表:第14话</option>
<option value='139_6.html'>6、播放列表:第13话</option>
<option value='139_7.html'>7、播放列表:第12话</option>
<option value='139_8.html'>8、播放列表:第11话</option>
<option value='139_9.html'>9、播放列表:第10话</option>

这样的怎么设置让火车头也采集139_*.html这些页啊 他不是http://*这样的

kflx 发表于 2007-8-4 20:32:46

我在采集网址的地方设置了自定义 <option value='[参数1]'>(*)</option>
现在是可以读取出正确的页面 可我设置好的采集内容规则却不采集内容了 只采集了页面的地址。。。。
页: [1]
查看完整版本: 请教个问题