zjf1990 发表于 2010-10-17 16:07:46

版主牛人帮忙啊………………分页采集……………………

本帖最后由 zjf1990 于 2010-10-17 16:18 编辑

内容页: http://www.gvodzi.net/Movie.ASP?ID=12312
分页设置好了采集到的如下
████████████████████████████████████
█此页面包含多个分页:
█1:http://www.gvodzi.net/Movie.ASP?ID=12312
█2:http://www.gvodzi.net/Play/?1-12312-1-4.Html
█3:http://www.gvodzi.net/Play/?1-12312-2-4.Html
█4:http://www.gvodzi.net/Play/?1-12312-3-4.Html
█5:http://www.gvodzi.net/Play/?1-12312-4-4.Html
█有分页匹配的标签,比如内容注意选中标签编辑框中的[该标签在分页中匹配]
████████████████████████████████████

现在的问题是如何把第一个去掉,就是这个█1:http://www.gvodzi.net/Movie.ASP?ID=12312

zjf1990 发表于 2010-10-17 16:27:07

{:1_201:}顶上去……………………

zjf1990 发表于 2010-10-17 16:35:43

^^^^^^^^^^^^^^^^^^^^^^

afanfan2007 发表于 2010-10-17 16:36:38

本帖最后由 afanfan2007 于 2010-10-17 16:51 编辑

这里开始 <td colspan="2" align="left">
这里结束 </table>

zjf1990 发表于 2010-10-17 16:47:16

回复 4# afanfan2007


    好像没什么关系吧?分页我都完整获取到了啊

afanfan2007 发表于 2010-10-17 16:52:05

回复 5# zjf1990

图上传错了

zjf1990 发表于 2010-10-17 17:01:57

回复 6# afanfan2007

{:1_201:}还是不行啊…按你设置的和我的一样啊
████████████████████████████████████
█此页面包含多个分页:
█1:http://www.gvodzi.net/Movie.ASP?ID=12312
█2:http://www.gvodzi.net/Play/?1-12312-1-4.Html
█3:http://www.gvodzi.net/Play/?1-12312-2-4.Html
█4:http://www.gvodzi.net/Play/?1-12312-3-4.Html
█5:http://www.gvodzi.net/Play/?1-12312-4-4.Html
█有分页匹配的标签,比如内容注意选中标签编辑框中的[该标签在分页中匹配]
████████████████████████████████████
我主要是想把第一个地址删除1:http://www.gvodzi.net/Movie.ASP?ID=12312

zjf1990 发表于 2010-10-17 17:02:19

只是采集分页的东西

afanfan2007 发表于 2010-10-17 17:20:29

如果想要地址直接用标签采集就行了 。

zjf1990 发表于 2010-10-17 17:34:11

回复 9# afanfan2007


    用标签回车换行有问题……………………
页: [1] 2
查看完整版本: 版主牛人帮忙啊………………分页采集……………………