目前已知火车头尚不完美的地方
本帖最后由 kenperseus 于 2010-3-12 11:18 编辑1.分页
2.空标签
1.分页
关于这一点,是我碰巧看见网页某个室内设计的网站,现在忘了网址...它的分页规则是用语言生成倒转顺序,再用CSS倒转样式这样形成的.而且没有上下页
举例:
普通的分页应该是12345,而它生成前台分页代码是倒序,即54321,再利用CSS倒转这个观看的顺序,超牛的...
PS:最底部附代码
2.标签空内容
关于这一点,是指当采集源里某个特定的标签出现空白内容时,即会显示[标签:标签名]...
详细举例:
比如采集手机参数
网址一:http://product.pconline.com.cn/mobile/htc/280871_detail.html
网址二:http://product.pconline.com.cn/mobile/nokia/397900_detail.html
请打开以上两个太平洋手机报价的手机参数网址,留意中间"基本功能——电子词典"
HTC这台手机拥有"电子词典",我们在火车头里写采集规则时肯定要写一个"电子词典"的标签,然后采目标页"电子词典"后面的内容,得到标签内容,是吧?
所以当你采集HTC这个网页的时候,你采集并发布后的内容会是"电子词典:支持电子词典"("电子词典:"是写在网页代码里的,固定的.而"支持电子词典"则是此标签采集来的内容)
问题来了,HTC这台手机有"电子词典",但NOKIA这台没有"电子词典",所以,当你固定了"电子词典"这个标签后,采集NOKIA这台手机时,采集并发布后的内容则会是"电子词典:[标签:电子词典]"("电子词典:"是固定网页代码,而"[标签:电子词典]"则是火车头因为没采到内容,显示出来的多余文字)
这个缺憾是我觉得最讨厌的!望关注...
倒转生成分页代码再用CSS倒转浏览的顺序,演示:
<!DOCTYPE HTML PUBLIC "-//W3C//DTD HTML 4.0 Transitional//EN">
<HTML>
<HEAD>
<TITLE>标题</TITLE>
<META NAME="Generator" CONTENT="EditPlus">
<META NAME="Author" CONTENT="">
<META NAME="Keywords" CONTENT="">
<META NAME="Description" CONTENT="">
</HEAD>
<BODY>
<h1></h1><br />
<div id="artbody">正文</div>
<div id="page" style="float:right;text-algin:right">
<ulstyle="float:right;text-algin:right">
<listyle="float:right;text-algin:right"><a href="hello-6.htm">第6页</a></li>
<listyle="float:right;text-algin:right"><a href="hello-5.htm">第5页</a></li>
<listyle="float:right;text-algin:right"><a href="hello-4.htm">第4页</a></li>
<listyle="float:right;text-algin:right"><a href="hello-3.htm">第3页</a></li>
<listyle="float:right;text-algin:right"><a href="hello-2.htm">第2页</a></li>
<listyle="float:right;text-algin:right"><a href="hello-1.htm">第1页</a></li>
</ul>
</div>
</BODY>
</HTML> 第一个不会!!!!!
第二个好解决.... 模块里面出现的标签, 都要做规则里写出来, 不然就直接发布出来 标签名了 第一个不会!!!!!
第二个好解决.... 模块里面出现的标签, 都要做规则里写出来, 不然就直接发布出来 标 ...
都市乞丐 发表于 2010-3-12 10:38 http://bbs.locoy.com/images/common/back.gif
或者第二条是我表达的不够清楚,我修改一下 回复 2# 都市乞丐
现在修改好了!我想你应该明白了!我实在没办法解决这个问题... 2,如果模块中调用了[标签:电子词典]这个标签,在规则中没有建立这个标签的话,发布出来就是'[标签:电子词典]',这可以算作是一个不完美的地方,部份用户看到这里也茫然无措,然而解决办法却很简单,在任务中建立此标签即可。
1,这个问题确实比较BT,不过2010版的内置分页接口也能处理这样的页面。敬请期待! 哟西~~~~~~~~~~~~~~~~~~~{:4_180:}
页:
[1]