fisio 发表于 2008-10-14 20:34:30

询问一个简单问题

假如我要收集网站为
http://www.paidan.net/*/*.html
其中第一个*从 1--10;第二个*从1--1000
开始采集地址应该怎么设置,希望能用批量或者正则提取

上面那个用程序来说就是
for(i=1;i<10;i++){
for(j=1;j<1000;j++){
    {http://www.paidan.net/(i)/(j).html
}
}

aven 发表于 2008-10-14 20:34:31

可以有个bat来枚举一下就行了

@echo off
for /l %%i in (1,1,12) do ( for /l %%j in (1,1,12) do echo http://www.paidan.net/%%i/%%j.html >>list.txt)

把上面的代码存成.bat文件 会生成一个list.txt里面是你想要的网址,再导入火车

p.s. 
(1,1,12)每一个1是起始值,第二个是增量,第三个是最大值
上面是两个循环嵌套,所以会生成12*12=144条,

花子 发表于 2008-10-14 20:36:47

两个 参数?ali69ls

fisio 发表于 2008-10-14 20:49:41

是啊
两个参数
怎么处理呢?

批量哪里只能有一个参数:(

rq204 发表于 2008-10-14 22:34:45

自己整个,然后导入程序

faunus 发表于 2008-10-15 13:18:16

方案一:
让火车把批量地址变量整灵活点

方案二:
自己整一下,最简单用EXCEL来生成,啥都能干。
干净一点写个JS脚本。
页: [1]
查看完整版本: 询问一个简单问题