calendarli 2008-7-9 10:33
任务规则设置
网址页列表 没有规律 么样办呢我在搜索的这个网站的价格的时候,发现该网站的列表的网址很奇怪:第一页:[url=http://www.pcmall.com/pcmall/search/search~id~210401584~search~1600%2D2000+lumens+Projectors.asp]http://www.pcmall.com/pcmall/search/search~id~210401584~search~1600%2D2000+lumens+Projectors.asp[/url]
第二页:
[url=http://www.pcmall.com/pcmall/search/search.asp]http://www.pcmall.com/pcmall/search/search.asp[/url]
这样的情况,我该怎么设置任务规则呢?
管理员提示得看post的提示:
<form name="form1" method="post" action="submitdetail.asp">
post 是这样的,我没弄明白这个与网页列表是什么关系,可以具体么?
非常感谢!!
soarb 2008-7-9 10:59
<input name="search" id="newsearch" size="15" class="searchforms"/>
<input type="submit" id="submit1" name="submit1" value="Find" class="searchforms"/>
<input type="hidden" id="NavID_Search" name="NavID_Search" value="false"/>
<!-- parameters required for search -->
<!-- <input type="hidden" id="CatalogIDList" name="CatalogIDList" value="2,4">-->
<!-- <input type="hidden" id="AccountID" name="AccountID" value="" > -->
<!-- <input type="hidden" id="PType" name="PType" value="E" > -->
<!-- <input type="hidden" id="ShowCaseID" name="ShowCaseID" value="" > -->
<!-- <input type="hidden" id="Tier" name="Tier" value="0" > -->
<!-- <input type="hidden" id="RankGroupID" name="RankGroupID" value="2" >-->
<!-- <input type="hidden" id="mallname" name="mallname" value="pcmall" >-->
<!-- <input type="hidden" id="shopperid" name="shopperid" value="76734EBA2FDB41C29290D9C4F4431B40" >-->
<!-- <input type="hidden" id="Type" name="Type" value="3" > -->
<input type="hidden" id="CurDSN" name="CurDSN" value="simple">
<input type="hidden" id="calledfrom" name="calledfrom" value="1" >
<input type="hidden" id="incimage" name="incimage" value="on" >
用这个结合get的url可以猜解出来你需要的列表.
不过,我能访问你给的第一个列表,说明没有随机值的用户验证.大可不必考虑这些
calendarli 2008-7-9 14:53
re
上面第一个页面是可以正常收集所需要的数据。
不过后面页面的网址变得太奇怪了,弄不明白是怎么回事......
再加上对火车头采集器 不是很熟,请明确提示一下,应该怎样处理这个问题。。。。谢谢...