强烈建议完善对这样站的采集!!!!
内容为JS且JS路径与网址没直接关系,http://www.bookgg.com/library.j?page_type=BooKChapter&Bid=70506&CId=3975856内容JS<script type="text/javascript" src="BookCont/2008-4/24/V101C3975856.js">
就是上面的网址,其内容是JS,这倒不说什么,关键是JS的路径无法由当前采集网址替换得到
各位高手有什么高招没,请指教!
如果火车能在一个标签内先根据规则提取当前页面中地址,再对结果中的地址进行采集这样就好了, 支持火车。。。。历史帖子回顾中。
页:
[1]