xizhanbo 发表于 2008-9-8 13:13:26

一个特殊的网页,谁能帮忙采集,小妹感激不尽!

我有一个特殊的网址,不知道怎么批量采集列表里子文章的里的内容,小妹感激不尽,建立批量采集的网址是:http://www.cqvip.com/asp/vipsearch.asp,如果这个网址打不开,可以打开这个网址:http://www.cqvip.com/channel/dianzidx/,然后点击最左边列表的任意一个,这样打开的页面和第一个链接打开的页面是一样的。
我要采集的内容是列表里文章链接页面里的标题和关键字,(内容页面网址类似于http://www.cqvip.com/qk/82463X/200706/24737316.html)



感谢各位!

xizhanbo 发表于 2008-9-8 16:27:01

补充一下,那网页列表链接的html代码

div class="wqk"><span class="tip"><a href="javascript:WriterSearch('申屠留芳');">申屠留芳</a> </span><span class="kanm"><a href="/QK/90998X/" target="_blank">《淮海工学院学报》</a></span><span class="qi"><a href="/QK/90998X/200104/" target="_blank">2001年 第4期</a></span><span class="tip"><a href="javascript:ClassSearch('TH112.1','5616596','动画设计与五杆机构运动图谱分析','申屠留芳');">相关文献</a></span></div>
</div>

连通 发表于 2008-9-9 06:48:50

打开这个网址:http://www.cqvip.com/channel/dianzidx/,然后点击最左边列表的任意一个,这样打开的页面和第一个链接打开的页面是一样的。


不是一样呀,不难采的。

[ 本帖最后由 连通 于 2008-9-9 06:54 编辑 ]

xyz5200 发表于 2008-9-9 08:27:30

很容易采吧。哈哈。

xizhanbo 发表于 2008-9-9 09:24:52

回复:xyz5200

大哥哥,帮帮我做个例子好吗?我是初学者,只会链接完整的放在html里的采集,或者给我找个采集真正网址的视频。谢谢了

xizhanbo 发表于 2008-9-9 11:03:17

我开始测试网址采集的结果是这样的

我开始测试网址采集的结果是这样的:http://www.cqvip.com/asp/\"javascript:historySearch('"+OptionText+"')\"
如果这样的怎么建立网址采集规则?

lixiangliao 发表于 2008-9-15 20:56:54

这个很方便的吧,看起来是比较方便的

inglove 发表于 2010-1-24 21:15:25

自己写一个采集的规则,禁用火车头自带的网址规则,
<div class="wtitle"><a href="/要采集的网址" target="_blank">(*)</a></div>
页: [1]
查看完整版本: 一个特殊的网页,谁能帮忙采集,小妹感激不尽!