火车采集器软件交流官方论坛

 找回密码
 加入会员
搜索
火车采集器V9版免费下载火车浏览器 - 可视采集,万能群发,全自动脚本工具
查看: 2895|回复: 3

这个采集如何实现?来帮帮我,谢谢了

[复制链接]
发表于 2008-2-19 09:21:15 | 显示全部楼层 |阅读模式
我把下面这段代码作为一个 工作经历 这个项采集(包括这些HTML标记)
  1. <TABLE cellSpacing=1 cellPadding=3 width="92%" border=0>
  2.                       <TBODY>
  3.                         <TR>
  4.                           <TD><STRONG class=font14b>▌长沙科瑞特电子有限公司</STRONG>   
  5.                             <SPAN
  6.                   class=navy>2007年10月-2007年11月</SPAN></TD>
  7.                         </TR>
  8.                         <TR>
  9.                           <TD align=middle> <TABLE cellSpacing=1 cellPadding=3 width="92%" border=0>
  10.                               <TBODY>
  11.                                 <TR>
  12.                                   <TD width=250>公司性质:<SPAN class=navy>私营企业</SPAN></TD>
  13.                                   <TD>行业类别:<SPAN class=navy>电子、微电子技术</SPAN></TD>
  14.                                 </TR>
  15.                                 <TR>
  16.                                   <TD colSpan=2>担任职位:<SPAN class=navy>电子通讯/电气(器)类-电路(布线)设计</SPAN></TD>
  17.                                 </TR>
  18.                                 <TR>
  19.                                   <TD colSpan=2>工作描述:<SPAN
  20.                         class=navy>长沙科瑞特电子有限公司实习,主要是利用所学的知识完成单片机最小系统的设计</SPAN></TD>
  21.                                 </TR>
  22.                               </TBODY>
  23.                             </TABLE>
复制代码


采集后得到的代码就是上面那一段了,
而直接发布到web上去后会自动加上
  1. <br>                      <br>                        <br>                     
复制代码
自动排版的时候把版面都撑破了.请问这个要怎么解决呢..发布后查看源代码的内容跟采集的内容一样的就成.
下面是发布后的代码,跟上面原配的代码没找到,就是那个意思了...


  1. <TABLE cellSpacing=1 cellPadding=3 width="92%" border=0><br>                      <br>                        <br>                      <TR> <br>                        <TD> <br>                          2005年9月-2008年6月</TD><br>                          <br>                        <TD>广西大学</TD><br>                          <br>                        <TD>分析化学</TD><br>                          <br>                        <TD> <br>                          硕士</TD><br>                        </TR><br>      <br>                    </TABLE>
复制代码


知道的兄弟,帮帮忙哈..谢谢了..在线等!
发表于 2008-2-19 09:29:23 | 显示全部楼层
过滤一些没用的标签,具体如何反复测试吧.
发表于 2008-2-19 10:03:27 | 显示全部楼层
fireye,说的对.
排除不用的标签,留下需要的.

^_^
 楼主| 发表于 2008-2-19 10:23:09 | 显示全部楼层
可是那个<br>                      <br>                        <br>                     
是发布上去才有的呀,大哥....
采集的时候没有...为什么它会自己加上呢...
这个能过滤掉吗?

采集下来的时候里面并没有这些代码,只是web发布的时候才出现的呀...

[ 本帖最后由 mapleaf 于 2008-2-19 10:29 编辑 ]
您需要登录后才可以回帖 登录 | 加入会员

本版积分规则

QQ|手机版|Archiver|火车采集器官方站 ( 皖ICP备06000549 )

GMT+8, 2025-7-19 01:22

Powered by Discuz! X3.4

Copyright © 2001-2020, Tencent Cloud.

快速回复 返回顶部 返回列表