aven 2008-5-25 04:09
强烈建议完善对这样站的采集!!!!
内容为JS且JS路径与网址没直接关系,[url=http://www.bookgg.com/library.j?page_type=BooKChapter&Bid=70506&CId=3975856][color=#0000ff]http://www.bookgg.com/library.j?page_type=BooKChapter&Bid=70506&CId=3975856[/color][/url]
内容JS<script type="text/javascript" src="BookCont/2008-4/24/V101C3975856.js">
就是上面的网址,其内容是JS,这倒不说什么,关键是JS的路径无法由当前采集网址替换得到
各位高手有什么高招没,请指教!
[size=4][color=blue]如果火车能在一个标签内先根据规则提取当前页面中地址,再对结果中的地址进行采集这样就好了,[/color][/size]