331661921 发表于 2009-10-12 00:23:21

采集时速度很慢,出现The operation has timed out 指点下思路

帮我想下:采集一个网址,比如是http://bbs.admin5.com/thread-1323954-1-3.html如果我只是想要 网址中的内容 如1323954 这个网址中的数字,不要网页内容 有没有什么好的方法?
我自己搞的在这个网页源代码中找 那串数字,然后用正则提出来了,可是,网页源代码中有,实际网页页面中根本没有这个数字,导致采集时速度很慢,出现The operation has timed out指点下思路,谢谢了

331661921 发表于 2009-10-12 08:10:17

up!~~~~~~~~~~~~~~

火车头 发表于 2009-10-12 10:34:29

在标签的【所属页面】 里选择 【采集页地址】

然后从 【thread-】 开始 到 【-】 结束。即可提取到你要的数字。

The operation has timed out把HTTP设置的Keep-Alive勾去掉试试

331661921 发表于 2010-1-20 12:20:36

感谢啊感谢啊感谢啊感谢啊!ali68ls
页: [1]
查看完整版本: 采集时速度很慢,出现The operation has timed out 指点下思路