一个特殊的网页,谁能帮忙采集,小妹感激不尽!
我有一个特殊的网址,不知道怎么批量采集列表里子文章的里的内容,小妹感激不尽,建立批量采集的网址是:http://www.cqvip.com/asp/vipsearch.asp,如果这个网址打不开,可以打开这个网址:http://www.cqvip.com/channel/dianzidx/,然后点击最左边列表的任意一个,这样打开的页面和第一个链接打开的页面是一样的。我要采集的内容是列表里文章链接页面里的标题和关键字,(内容页面网址类似于http://www.cqvip.com/qk/82463X/200706/24737316.html)
感谢各位!
补充一下,那网页列表链接的html代码
div class="wqk"><span class="tip"><a href="javascript:WriterSearch('申屠留芳');">申屠留芳</a> </span><span class="kanm"><a href="/QK/90998X/" target="_blank">《淮海工学院学报》</a></span><span class="qi"><a href="/QK/90998X/200104/" target="_blank">2001年 第4期</a></span><span class="tip"><a href="javascript:ClassSearch('TH112.1','5616596','动画设计与五杆机构运动图谱分析','申屠留芳');">相关文献</a></span></div></div> 打开这个网址:http://www.cqvip.com/channel/dianzidx/,然后点击最左边列表的任意一个,这样打开的页面和第一个链接打开的页面是一样的。
不是一样呀,不难采的。
[ 本帖最后由 连通 于 2008-9-9 06:54 编辑 ] 很容易采吧。哈哈。
回复:xyz5200
大哥哥,帮帮我做个例子好吗?我是初学者,只会链接完整的放在html里的采集,或者给我找个采集真正网址的视频。谢谢了我开始测试网址采集的结果是这样的
我开始测试网址采集的结果是这样的:http://www.cqvip.com/asp/\"javascript:historySearch('"+OptionText+"')\"如果这样的怎么建立网址采集规则? 这个很方便的吧,看起来是比较方便的 自己写一个采集的规则,禁用火车头自带的网址规则,
<div class="wtitle"><a href="/要采集的网址" target="_blank">(*)</a></div>
页:
[1]