msblast 发表于 2010-3-12 17:34:44

文章列表是上一页下一页怎么提取 每一个列表呢?

因为列表很多而且没有规律 不可能手工或者想到添加

列表页上下页之间都是上一页 和 下一页 这样的连接 没有那种1 2 3 4的
也就是说进入每个列表 才能有下一列表页的连接

vus520 发表于 2010-3-12 17:52:54

多访问几个页面,看链接的规律,如果实再没有规律,那就手动吧。

msblast 发表于 2010-3-12 19:51:27

恩 其实我也会C#.NET 嘿嘿
定义个哈希表 然后正则找网址 然后循环载入网址再找网址 载入网址都放入哈希表里不允许重复
应该可以的吧 虽然很浪费系统资源。。。。生成出来 加入就好了
做好了发上来
还是希望火车头有更好的算法

killer110 发表于 2010-3-15 20:57:29

内容页面有分页可以处理 要是列表页也能那样处理就好了

tonyrech888 发表于 2010-3-15 22:56:11

二楼正解{:4_180:}
http://www.boctongs.com

vision99 发表于 2010-3-18 12:13:43

帮顶帮顶帮顶帮顶

wuxiguacom 发表于 2010-3-19 18:06:01

写正则就好 呵呵呵呵呵呵
页: [1]
查看完整版本: 文章列表是上一页下一页怎么提取 每一个列表呢?