分享一个火车头DEDE论文规则并求待完善
一下是本人昨天写的规则已经测试成功,准备今日来发。可是。。。。。。。。。。。。。。。。。。。。郁闷。。。。。。。。。。。
本人今天试验了好多次,连分页都才不来。。。。。。。。。。
这个是昨日本人成功采集的规则:
www.lunwenwang.com
标题规则不用填写
内容规则:
<div class="content">
</b></p></div>
排除
<div class="ggad"><script type="text/javascript"><!--
google_ad_client = "pub-3290427407984166";
google_alternate_ad_url = "http://lwwzx.com/250.htm";
google_ad_width = 250;
google_ad_height = 250;
google_ad_format = "250x250_as";
google_ad_type = "text_image";
//2007-02-04: lunwenwangAD300
google_ad_channel = "3053940932";
google_color_border = "FFFFFF";
google_color_bg = "F9FCFE";
google_color_link = "000000";
google_color_text = "000000";
google_color_url = "000000";
//--></script>
<script type="text/javascript"
src="http://pagead2.googlesyndication.com/pagead/show_ads.js">
</script></div>
排除:
<p align='center'><b><font color='red'>[(*)]</font>
<a href='/Freepaper/Legalpaper/criminallawpaper/20(*)/Freepaper_(*)_(*).html'>(*)</a>
<font color='red'>[(*)]</font>
<a href='(*)'>(*)</a>
排除段落。字体。颜色。代码。等标记。
另外灵活处理不同栏目的采集问题
上面处理的是民法学论文的采集归则
大部分使用
对一部分正在研究中。。
凌晨或晚上采集对服务器压力小。
哈哈
自言自语
希望自己进步
!如果我把这个发表了出来
希望大家顶下啊
网站友情连接:www.qjqm.cn
提供技术支持。Q:394023065
测试页面成功
然后再作者出处等。
分页处理:
起:<p align='center'><b><font color='red'>
终:</b></p></div>
</div>
测试成功。。
OK
!
怎么回事啊
昨天的规则今天全弄了上去
竟然连分页都没有采集成功
分页
我看说明应该就是那样的啊
为什么呢?
郁闷。。。
什么原因?
空格
?
没有错。
分页都采不来!
很郁闷。。。。。。。。。。。。。。。。。。。。。。。。。。
哪位朋友指点下。。。。。。。。。。。。。。。。。。。。
现在本人重新写了规则,却连分页都采集不来
很是郁闷。。。。
高手指点一二。
本人从不不思考就来提问题。
所以请高手指点下具体的措施与解决办法。。。。。。。。。。。。
页:
[1]