|
 
- UID
- 52333
- 帖子
- 105
- 活跃度
- 235 点
- 火车车厢
- 34 节
- 注册时间
- 2007-6-28
|
2楼
发表于 2008-3-6 19:49
| 只看该作者
这个是比较简易的,可能是设置的时候出错。
过程:
1.设置编码为gb2312,内容标签的开始字符串为<TD style="TABLE-LAYOUT(*)>,结束字符串为<p align='center'>。
2.设置分页区域,点选“全部列出模式”。
3.因为源代码中分页区的字符串为
<p align='center'><b><font color='red'>[1]</font> <a href='/thesis/2008/21362_2.html'>[2]</a> <a href='/thesis/2008/21362_2.html'>下一页</a> </b></p><SPAN id=ad3></SPAN></TD>
所以,
“从”填写:<p align='center'>
“到”填写:</p>
点选“自动识别分页”,“分页内容合并连接代码”可以填写“<br><br>”。经过测试可以采集到这2页内容。 |
|