求助:变量如何设?
我要采集http://www.cnss.cn/xwzx/jdxw/此页面的文章.但里面的文章网址会多个后缀,如:http://www.cnss.cn/xwzx/jdxw/200706/t20070615_127697.html
上面有色部分有两个变量,一个是:200706/t20070615,每篇文章的发表时间不同,它的变量就不同.
还有一个变量是:127697 ,如何设置?
请高手指点一下,或者帮我设置好粘在后面.
谢谢了!!! (*)
用这个代替试试看 原帖由 天毅 于 2007-6-19 08:22 发表
(*)
用这个代替试试看
试过呀。
但是:它有两个变量,一个是时间,一个是顺序码。
用(*)是要设数字变化范围的,而且只能设一个变量。
老兄,有时间帮我具体在火车头上操作一下,就知道我的难处了。况且我还是个新手,还有许多东西要学的。
谢谢啦。。。。。。。 根本不用去管他啊。内容页面包括这个:xwzx/jdxw就行啊 原帖由 yscdc 于 2007-6-19 12:15 发表
根本不用去管他啊。内容页面包括这个:xwzx/jdxw就行啊
但是数字如果留空不能保存呀???
如图:
请高手帮我设一下,以作参考。谢谢!
你的举手之劳,成全我的一片痴心。 晕,你看第二页的链接是:http://www.cnss.cn/xwzx/jdxw/index_1.htm
第三页是:http://www.cnss.cn/xwzx/jdxw/index_2.htm
第一页是:http://www.cnss.cn/xwzx/jdxw/index.htm
第一页单独加,从第二页到后来的用:http://www.cnss.cn/xwzx/jdxw/index_(*).htm 原帖由 yscdc 于 2007-6-19 15:34 发表
晕,你看第二页的链接是:http://www.cnss.cn/xwzx/jdxw/index_1.htm
第三页是:http://www.cnss.cn/xwzx/jdxw/index_2.htm
第一页是:http://www.cnss.cn/xwzx/jdxw/index.htm
第一页单独加,从第二页到后来 ...
老兄,说的有理,可是不能采集内容呀.你在自己的火车头上具体操作一下行吗?如能,帮我把它的设置,包括内容规则粘贴在下面,可以吗?谢谢!!!! 汗可以先采集列表页面 然后导出二级节点为文本
再把文本导入作为一级节点…………
这样就可以实现用:内容页面包括这个:xwzx/jdxw 来进行采集页面了
我还以为是什么问题呢 呵呵:lol
页:
[1]