火车采集器软件交流官方论坛

 找回密码
 加入会员
搜索
火车采集器V9版免费下载火车浏览器 - 可视采集,万能群发,全自动脚本工具
查看: 2973|回复: 5

目前已知火车头尚不完美的地方

[复制链接]
发表于 2010-3-12 09:25:35 | 显示全部楼层 |阅读模式
本帖最后由 kenperseus 于 2010-3-12 11:18 编辑

1.分页
2.空标签


1.分页
关于这一点,是我碰巧看见网页某个室内设计的网站,现在忘了网址...它的分页规则是用语言生成倒转顺序,再用CSS倒转样式这样形成的.而且没有上下页
举例:
普通的分页应该是12345,而它生成前台分页代码是倒序,即54321,再利用CSS倒转这个观看的顺序,超牛的...
PS:最底部附代码

2.标签空内容
关于这一点,是指当采集源里某个特定的标签出现空白内容时,即会显示[标签:标签名]...
详细举例:
比如采集手机参数
网址一:http://product.pconline.com.cn/mobile/htc/280871_detail.html
网址二:http://product.pconline.com.cn/mobile/nokia/397900_detail.html
请打开以上两个太平洋手机报价的手机参数网址,留意中间"基本功能——电子词典"
HTC这台手机拥有"电子词典",我们在火车头里写采集规则时肯定要写一个"电子词典"的标签,然后采目标页"电子词典"后面的内容,得到标签内容,是吧?
所以当你采集HTC这个网页的时候,你采集并发布后的内容会是"电子词典:支持电子词典"("电子词典:"是写在网页代码里的,固定的.而"支持电子词典"则是此标签采集来的内容)
问题来了,HTC这台手机有"电子词典",但NOKIA这台没有"电子词典",所以,当你固定了"电子词典"这个标签后,采集NOKIA这台手机时,采集并发布后的内容则会是"电子词典:[标签:电子词典]"("电子词典:"是固定网页代码,而"[标签:电子词典]"则是火车头因为没采到内容,显示出来的多余文字)
这个缺憾是我觉得最讨厌的!望关注...


倒转生成分页代码再用CSS倒转浏览的顺序,演示:

  1. <!DOCTYPE HTML PUBLIC "-//W3C//DTD HTML 4.0 Transitional//EN">
  2. <HTML>
  3. <HEAD>
  4.   <TITLE>标题</TITLE>
  5.   <META NAME="Generator" CONTENT="EditPlus">
  6.   <META NAME="Author" CONTENT="">
  7.   <META NAME="Keywords" CONTENT="">
  8.   <META NAME="Description" CONTENT="">
  9. </HEAD>
  10. <BODY>
  11. <h1></h1><br />
  12. <div id="artbody">正文</div>
  13. <div id="page" style="float:right;text-algin:right">
  14. <ul  style="float:right;text-algin:right">
  15. <li  style="float:right;text-algin:right"><a href="hello-6.htm">第6页</a></li>
  16. <li  style="float:right;text-algin:right"><a href="hello-5.htm">第5页</a></li>
  17. <li  style="float:right;text-algin:right"><a href="hello-4.htm">第4页</a></li>
  18. <li  style="float:right;text-algin:right"><a href="hello-3.htm">第3页</a></li>
  19. <li  style="float:right;text-algin:right"><a href="hello-2.htm">第2页</a></li>
  20. <li  style="float:right;text-algin:right"><a href="hello-1.htm">第1页</a></li>
  21. </ul>
  22. </div>
  23. </BODY>
  24. </HTML>
复制代码
发表于 2010-3-12 10:38:46 | 显示全部楼层
第一个不会!!!!!

第二个好解决....     模块里面出现的标签, 都要做规则里写出来, 不然就直接发布出来 标签名了
 楼主| 发表于 2010-3-12 11:03:11 | 显示全部楼层
第一个不会!!!!!

第二个好解决....     模块里面出现的标签, 都要做规则里写出来, 不然就直接发布出来 标 ...
都市乞丐 发表于 2010-3-12 10:38



或者第二条是我表达的不够清楚,我修改一下
 楼主| 发表于 2010-3-12 11:20:01 | 显示全部楼层
回复 2# 都市乞丐


现在修改好了!我想你应该明白了!我实在没办法解决这个问题...
发表于 2010-3-12 17:58:11 | 显示全部楼层
2,如果模块中调用了[标签:电子词典]这个标签,在规则中没有建立这个标签的话,发布出来就是'[标签:电子词典]',这可以算作是一个不完美的地方,部份用户看到这里也茫然无措,然而解决办法却很简单,在任务中建立此标签即可。
1,这个问题确实比较BT,不过2010版的内置分页接口也能处理这样的页面。敬请期待!
 楼主| 发表于 2010-4-28 01:56:35 | 显示全部楼层
哟西~~~~~~~~~~~~~~~~~~~
您需要登录后才可以回帖 登录 | 加入会员

本版积分规则

QQ|手机版|Archiver|火车采集器官方站 ( 皖ICP备06000549 )

GMT+8, 2025-7-13 22:07

Powered by Discuz! X3.4

Copyright © 2001-2020, Tencent Cloud.

快速回复 返回顶部 返回列表