offersfirst 发表于 2012-7-28 08:34:02

请教一个问题,如何将淘宝网分页的总页数作参数传递送分页链接?

请教一个问题,如何将分页的总页数作参数传递送分页链接?
你好!!
本人采集淘宝的产品信息页,欲采集包括
宝贝详情 、评价详情、成交记录等三个部分的信息,由于“评价详情”分页中的“上一页、下一页”等文字信息无法在网页的具体位置找到,但是我可以采集到“评价详情”分页的总数,并且希望用这个分页的总数,去生成分页的序列网址,可是,我熬夜一个晚上,却没有在软件中找到这个给分页网址加上序列的控件。
在分页的网址中有一个关键字
currentPageNum=
后页跟随的是序号。现将我所测试的这两个页面的 “任务文件”发给您公司的技术员看看,是不是我遇到的问题,在您的软件中早已经有更好的解决方法?为了实现这个功能,我已经将 评价详情和宝贝详情 分开了,能不能实现在一个任务中完成全部的作业?
我测试的,网址,是

http://taobao.com/item.htm?id=7097625038

只要是带http://item   这个都是可以用这个 任务文件采集。

offersfirst 发表于 2012-7-28 08:35:57

本人会跟踪后继的解决问题的回答。谢谢!!

offersfirst 发表于 2012-7-28 16:15:17

为什么没有人跟我解答?   我觉得这是贵公司在软件中需要解决的问题,增设分页序号参数(等差、等比参数),增设 数学函数(相除、相乘、相减、相加) ,要不然,还要自己懂得 编写程序做接口。

offersfirst 发表于 2012-7-28 16:22:48

{:soso_e136:}

offersfirst 发表于 2012-8-3 02:27:51

今天晚上又用 火车V7 采集淘宝的帮派(论坛),发现采集内容的时候,用循环标签,出现多个”循环记录“为空,我把网页源代码打开一分析,这次是V7火车的循环采集功能在 标签匹配上出错了!而且由于淘宝的抵抗采集的原因, 循环标签的关键字前面会多次出现冗余的无效代码,比如任意空格,回车符,tab键符号的随机组合,并且在循环的关键字上多出现一次,这样,就使得多个循环标签无法形成”配偶“关系,希望循环标签可以选择从第几次开始采集。丢弃某次冗余出现的循环标签关键字。用火车头采集,看来不懂得自己编写插件,用起来是很纠结的。

offersfirst 发表于 2012-8-3 02:30:38

自己顶起!!自己顶起!!自己顶起!!

xl530 发表于 2014-3-14 23:34:05

LZ,一年多以前的问题解决了吗?遇到了投了同样的问题。
页: [1]
查看完整版本: 请教一个问题,如何将淘宝网分页的总页数作参数传递送分页链接?