jumphoho 发表于 2009-2-8 19:07:35

请问“正则提取”链接中的“脚本规则”与“实际链接”设置

本帖最后由 jumphoho 于 2009-2-8 19:12 编辑

假如一个www.abcd.com中有如下代码(option value后面的""内的为链接部份内容,我想在前面加上www.abcd.com/)

                                    <OPTION value="view7.php?id=1396">09016</OPTION>
                                    <OPTION value="view7.php?id=1395">09015</OPTION>
                                    <OPTION value="view7.php?id=1394">09014</OPTION>
                                    <OPTION value="view7.php?id=1393">09013</OPTION>
                                    <OPTION value="view7.php?id=1392">09012</OPTION>
                                    <OPTION value="view7.php?id=1391">09011</OPTION>
                                    <OPTION value="view7.php?id=1390">09010</OPTION>
                                    <OPTION value="view7.php?id=1389">09009</OPTION>
                                    <OPTION value="view7.php?id=1388">09008</OPTION>
                                    <OPTION value="view7.php?id=1387">09007</OPTION>
                                    <OPTION value="view7.php?id=1386">09006</OPTION>
                                    <OPTION value="view7.php?id=1385">09005</OPTION>
                                    <OPTION value="view7.php?id=1384">09004</OPTION>
                                    <OPTION value="view7.php?id=1383">09003</OPTION>
                                    <OPTION value="view7.php?id=1382">09002</OPTION>
                                    <OPTION value="view7.php?id=1381">09001</OPTION>
                                    <OPTION value="view7.php?id=1380">08206</OPTION>

我想根据以代码生成提取地址如http://www.abcd.com/view7.php?id=1396
                   http://www.abcd.com/view7.php?id=1395
                             http://www.abcd.com/view7.php?id=1394

                                                      ................                           
                                                      等等依次类推

请问我要如何设置"脚本规则”与“实际链接”
做了以上设置后,提取地址时说“没有提取到任何地址,请修改规则”

jumphoho 发表于 2009-2-8 19:19:37

ali68ls高手帮忙呀,小弟先谢谢啦

明炫网络 发表于 2009-2-8 19:49:31

你的这个是错误的 你应该先划取一个分页连接的范围 然后用[参数1]获取

懷念過去↑文 发表于 2009-2-8 20:49:25

好像是不对的

连通 发表于 2009-2-10 00:04:45

本帖最后由 连通 于 2009-2-10 00:30 编辑

源地址: http://www.js-lottery.com/play7_download1.php

源代码: 从 <OPTION value="">选 择   </OPTION>
到 </select>
脚本规则: <OPTION value="[参数]">(*)</OPTION>

实际连接: http://www.js-lottery.com/[参数1]

GoTop 发表于 2009-2-10 01:20:49

楼上的不错哈~~~~

cl78931 发表于 2009-7-25 21:52:45

看完帖子很有帮助。

根据帖子的指导完成了新浪女性频道二级栏目的采集。

之前卡在了列表地址的过滤上,新浪很变态,列表地址都是用javascript写的,dede和phpcms的采集模块都没搞定,用火车的正则就很好解决了。

再次感谢楼主抛砖引玉,感谢 连通 的详细解释。

小弟的站 www.imditan.com 楼梯地毯    www.taoob.cn 淘客站 (不看也罢^_^)
页: [1]
查看完整版本: 请问“正则提取”链接中的“脚本规则”与“实际链接”设置