zv88 发表于 2009-1-19 10:46:58

ali68ls414

nawsber 发表于 2009-1-19 20:39:12

第一个和第三个的网址都挂了,第一个打不开,第三个说域名不存在。

chinacatia 发表于 2009-1-25 01:30:14

呵呵终于知道如何学习 火车了,呵呵支持已下

lhnlj2 发表于 2009-2-3 14:59:52

学习中......

Jarvis 发表于 2009-2-16 16:05:30

第1项,我测试的是http://bbs.readnovel.com/htm_data/51/0802/292757.html
████████████████████████████████████
█此页面包含多个分页:
█1:http://bbs.readnovel.com/htm_data/51/0802/292757.html
█2:http://bbs.readnovel.com/read.php?tid=292757&page=2
█3:http://bbs.readnovel.com/read.php?tid=292757&page=3
█4:http://bbs.readnovel.com/read.php?tid=292757&page=4
█有分页匹配的标签,比如内容注意选中标签编辑框中的[该标签在分页中匹配]
████████████████████████████████████
【标题】: 【谦谦君语】一个卑鄙刑警生前的感情经历-《小说论坛》
【贴子】: <br><font size='4'><font color='darkblue'>一个卑鄙刑警生前的感情经历

页面内容分页区域/样式设置中,我选的是"上下页/上n页下n页模式
从><< </a>(*)<b>(*)</b>到> >></a>

其它几项未做(成).

benfeng 发表于 2009-2-16 16:36:11

来个测试先.

yuewolf 发表于 2009-2-23 17:42:08

呃~~不用测了新手

hackbiao 发表于 2009-2-28 12:15:16

5555555555555555

diaogou 发表于 2009-3-4 18:33:26

值得一试~

Jarvis 发表于 2009-3-9 12:40:42

以下是Jarvis做的,"免费版"
火车手测试1
http://bbs.readnovel.com/htm_data/51/0807/334049.html
标题<title>
</title>
删除掉 -《小说论坛》
内容(选中分页,循环)
<span class='tpc_content'>
</span><br>
删除<font color=gray>[ 此贴被(*)重新编辑 ]</font>
作者(选中分页,循环)
<font color=#000066 face=Gulim>
</font>
分页,列出全部模式
从<form name=jump method=post>(*)<b>(*)</b>
到total )</td>

测试3
http://city.qzone.qq.com/html/user/searchpro.htm#mod=0&act=city&nl=3&cd=110000
具体测试用例
http://city.qzone.qq.com/html/user/searchpro.htm#mod=0&act=city&nl=3&cd=110000&pg=2
要点:a.同时采集多页面,"依据规则对默认页地址替换生成地址",将http://city.qzone.qq.com/html/user/searchpro.htm#mod=0&act=city&nl=3&cd=(\d+)&pg=(\d+)替换为http://city.qzone.qq.com/json.php?mod=sososearch&act=page&type=city&jsontype=str&callback=searchProCb&nl=3&cd=$1&pg=$2
b.昵称"TI":"到"
QQ号"QQ":"到"

测试5
http://www.waga.com/content/1130216/
分页"全部列出模式"
<ul class="text00">到</ul>
其它"视频地址"为playMovie((*), '到'

测试6
http://jobs.zhaopin.com/P8/CC1353/0977/J900/005/CC135309778J90000537000.htm?f=ss
公司名document.write ("到");
这个可能更简单
页: 1 2 3 [4] 5 6 7 8
查看完整版本: TEST YOURSELF 采集水平自我测试