火车采集器软件交流官方论坛

 找回密码
 加入会员
搜索
火车采集器V9版免费下载火车浏览器 - 可视采集,万能群发,全自动脚本工具
查看: 5996|回复: 6

请问“正则提取”链接中的“脚本规则”与“实际链接”设置

[复制链接]
发表于 2009-2-8 19:07:35 | 显示全部楼层 |阅读模式
本帖最后由 jumphoho 于 2009-2-8 19:12 编辑

假如一个www.abcd.com中有如下代码(option value后面的""内的为链接部份内容,我想在前面加上www.abcd.com/

                                    <OPTION value="view7.php?id=1396">09016</OPTION>
                                    <OPTION value="view7.php?id=1395">09015</OPTION>
                                    <OPTION value="view7.php?id=1394">09014</OPTION>
                                    <OPTION value="view7.php?id=1393">09013</OPTION>
                                    <OPTION value="view7.php?id=1392">09012</OPTION>
                                    <OPTION value="view7.php?id=1391">09011</OPTION>
                                    <OPTION value="view7.php?id=1390">09010</OPTION>
                                    <OPTION value="view7.php?id=1389">09009</OPTION>
                                    <OPTION value="view7.php?id=1388">09008</OPTION>
                                    <OPTION value="view7.php?id=1387">09007</OPTION>
                                    <OPTION value="view7.php?id=1386">09006</OPTION>
                                    <OPTION value="view7.php?id=1385">09005</OPTION>
                                    <OPTION value="view7.php?id=1384">09004</OPTION>
                                    <OPTION value="view7.php?id=1383">09003</OPTION>
                                    <OPTION value="view7.php?id=1382">09002</OPTION>
                                    <OPTION value="view7.php?id=1381">09001</OPTION>
                                    <OPTION value="view7.php?id=1380">08206</OPTION>

我想根据以代码生成提取地址如  http://www.abcd.com/view7.php?id=1396
                     http://www.abcd.com/view7.php?id=1395
                             http://www.abcd.com/view7.php?id=1394  

                                                      ................                           
                                                      等等依次类推

请问我要如何设置"脚本规则”与“实际链接”
做了以上设置后,提取地址时说“没有提取到任何地址,请修改规则”

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有帐号?加入会员

x
 楼主| 发表于 2009-2-8 19:19:37 | 显示全部楼层
高手帮忙呀,小弟先谢谢啦
发表于 2009-2-8 19:49:31 | 显示全部楼层
你的这个是错误的 你应该先划取一个分页连接的范围 然后用[参数1]获取
发表于 2009-2-8 20:49:25 | 显示全部楼层
好像是不对的
发表于 2009-2-10 00:04:45 | 显示全部楼层
本帖最后由 连通 于 2009-2-10 00:30 编辑

源地址: http://www.js-lottery.com/play7_download1.php

源代码: 从 <OPTION value="">选 择   </OPTION>
到 </select>
脚本规则: <OPTION value="[参数]">(*)</OPTION>

实际连接: http://www.js-lottery.com/[参数1]

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有帐号?加入会员

x
发表于 2009-2-10 01:20:49 | 显示全部楼层
楼上的不错哈~~~~
发表于 2009-7-25 21:52:45 | 显示全部楼层
看完帖子很有帮助。

根据帖子的指导完成了新浪女性频道二级栏目的采集。

之前卡在了列表地址的过滤上,新浪很变态,列表地址都是用javascript写的,dede和phpcms的采集模块都没搞定,用火车的正则就很好解决了。

再次感谢楼主抛砖引玉,感谢 连通 的详细解释。

小弟的站 www.imditan.com 楼梯地毯    www.taoob.cn 淘客站 (不看也罢^_^)
您需要登录后才可以回帖 登录 | 加入会员

本版积分规则

QQ|手机版|Archiver|火车采集器官方站 ( 皖ICP备06000549 )

GMT+8, 2025-8-30 00:50

Powered by Discuz! X3.4

Copyright © 2001-2020, Tencent Cloud.

快速回复 返回顶部 返回列表