lcbaoz 发表于 2007-6-19 01:01:31

求助:变量如何设?

我要采集http://www.cnss.cn/xwzx/jdxw/此页面的文章.

但里面的文章网址会多个后缀,如:http://www.cnss.cn/xwzx/jdxw/200706/t20070615_127697.html

上面有色部分有两个变量,一个是:200706/t20070615,每篇文章的发表时间不同,它的变量就不同.

还有一个变量是:127697 ,如何设置?

请高手指点一下,或者帮我设置好粘在后面.

谢谢了!!!

天毅 发表于 2007-6-19 08:22:58

(*)
用这个代替试试看

lcbaoz 发表于 2007-6-19 11:47:16

原帖由 天毅 于 2007-6-19 08:22 发表
(*)
用这个代替试试看


试过呀。

但是:它有两个变量,一个是时间,一个是顺序码。

用(*)是要设数字变化范围的,而且只能设一个变量。

老兄,有时间帮我具体在火车头上操作一下,就知道我的难处了。况且我还是个新手,还有许多东西要学的。

谢谢啦。。。。。。。

yscdc 发表于 2007-6-19 12:15:24

根本不用去管他啊。内容页面包括这个:xwzx/jdxw就行啊

lcbaoz 发表于 2007-6-19 12:48:27

原帖由 yscdc 于 2007-6-19 12:15 发表
根本不用去管他啊。内容页面包括这个:xwzx/jdxw就行啊

但是数字如果留空不能保存呀???
如图:

请高手帮我设一下,以作参考。谢谢!

你的举手之劳,成全我的一片痴心。

yscdc 发表于 2007-6-19 15:34:56

晕,你看第二页的链接是:http://www.cnss.cn/xwzx/jdxw/index_1.htm
第三页是:http://www.cnss.cn/xwzx/jdxw/index_2.htm
第一页是:http://www.cnss.cn/xwzx/jdxw/index.htm
第一页单独加,从第二页到后来的用:http://www.cnss.cn/xwzx/jdxw/index_(*).htm

lcbaoz 发表于 2007-6-19 18:51:29

原帖由 yscdc 于 2007-6-19 15:34 发表
晕,你看第二页的链接是:http://www.cnss.cn/xwzx/jdxw/index_1.htm
第三页是:http://www.cnss.cn/xwzx/jdxw/index_2.htm
第一页是:http://www.cnss.cn/xwzx/jdxw/index.htm
第一页单独加,从第二页到后来 ...

老兄,说的有理,可是不能采集内容呀.你在自己的火车头上具体操作一下行吗?如能,帮我把它的设置,包括内容规则粘贴在下面,可以吗?谢谢!!!!

天毅 发表于 2007-6-20 10:36:59

汗可以先采集列表页面 然后导出二级节点为文本
再把文本导入作为一级节点…………
这样就可以实现用:内容页面包括这个:xwzx/jdxw 来进行采集页面了

我还以为是什么问题呢 呵呵:lol
页: [1]
查看完整版本: 求助:变量如何设?