mapleaf 发表于 2008-2-19 09:21:15

这个采集如何实现?来帮帮我,谢谢了

我把下面这段代码作为一个 工作经历 这个项采集(包括这些HTML标记)

<TABLE cellSpacing=1 cellPadding=3 width="92%" border=0>
                      <TBODY>
                        <TR>
                        <TD><STRONG class=font14b>▌长沙科瑞特电子有限公司</STRONG>   
                            <SPAN
                  class=navy>2007年10月-2007年11月</SPAN></TD>
                        </TR>
                        <TR>
                        <TD align=middle> <TABLE cellSpacing=1 cellPadding=3 width="92%" border=0>
                              <TBODY>
                              <TR>
                                  <TD width=250>公司性质:<SPAN class=navy>私营企业</SPAN></TD>
                                  <TD>行业类别:<SPAN class=navy>电子、微电子技术</SPAN></TD>
                              </TR>
                              <TR>
                                  <TD colSpan=2>担任职位:<SPAN class=navy>电子通讯/电气(器)类-电路(布线)设计</SPAN></TD>
                              </TR>
                              <TR>
                                  <TD colSpan=2>工作描述:<SPAN
                        class=navy>长沙科瑞特电子有限公司实习,主要是利用所学的知识完成单片机最小系统的设计</SPAN></TD>
                              </TR>
                              </TBODY>
                            </TABLE>


采集后得到的代码就是上面那一段了,
而直接发布到web上去后会自动加上<br>                      <br>                        <br>                      自动排版的时候把版面都撑破了.请问这个要怎么解决呢..发布后查看源代码的内容跟采集的内容一样的就成.
下面是发布后的代码,跟上面原配的代码没找到,就是那个意思了...


<TABLE cellSpacing=1 cellPadding=3 width="92%" border=0><br>                      <br>                        <br>                      <TR> <br>                        <TD> <br>                        2005年9月-2008年6月</TD><br>                        <br>                        <TD>广西大学</TD><br>                        <br>                        <TD>分析化学</TD><br>                        <br>                        <TD> <br>                        硕士</TD><br>                        </TR><br>      <br>                  </TABLE>


知道的兄弟,帮帮忙哈..谢谢了..在线等!

fireye 发表于 2008-2-19 09:29:23

过滤一些没用的标签,具体如何反复测试吧.

小齐 发表于 2008-2-19 10:03:27

fireye,说的对.
排除不用的标签,留下需要的.

^_^

mapleaf 发表于 2008-2-19 10:23:09

可是那个<br>                      <br>                        <br>                     
是发布上去才有的呀,大哥....
采集的时候没有...为什么它会自己加上呢...
这个能过滤掉吗?

采集下来的时候里面并没有这些代码,只是web发布的时候才出现的呀...

[ 本帖最后由 mapleaf 于 2008-2-19 10:29 编辑 ]
页: [1]
查看完整版本: 这个采集如何实现?来帮帮我,谢谢了