这个采集如何实现?来帮帮我,谢谢了
我把下面这段代码作为一个 工作经历 这个项采集(包括这些HTML标记)<TABLE cellSpacing=1 cellPadding=3 width="92%" border=0>
<TBODY>
<TR>
<TD><STRONG class=font14b>▌长沙科瑞特电子有限公司</STRONG>
<SPAN
class=navy>2007年10月-2007年11月</SPAN></TD>
</TR>
<TR>
<TD align=middle> <TABLE cellSpacing=1 cellPadding=3 width="92%" border=0>
<TBODY>
<TR>
<TD width=250>公司性质:<SPAN class=navy>私营企业</SPAN></TD>
<TD>行业类别:<SPAN class=navy>电子、微电子技术</SPAN></TD>
</TR>
<TR>
<TD colSpan=2>担任职位:<SPAN class=navy>电子通讯/电气(器)类-电路(布线)设计</SPAN></TD>
</TR>
<TR>
<TD colSpan=2>工作描述:<SPAN
class=navy>长沙科瑞特电子有限公司实习,主要是利用所学的知识完成单片机最小系统的设计</SPAN></TD>
</TR>
</TBODY>
</TABLE>
采集后得到的代码就是上面那一段了,
而直接发布到web上去后会自动加上<br> <br> <br> 自动排版的时候把版面都撑破了.请问这个要怎么解决呢..发布后查看源代码的内容跟采集的内容一样的就成.
下面是发布后的代码,跟上面原配的代码没找到,就是那个意思了...
<TABLE cellSpacing=1 cellPadding=3 width="92%" border=0><br> <br> <br> <TR> <br> <TD> <br> 2005年9月-2008年6月</TD><br> <br> <TD>广西大学</TD><br> <br> <TD>分析化学</TD><br> <br> <TD> <br> 硕士</TD><br> </TR><br> <br> </TABLE>
知道的兄弟,帮帮忙哈..谢谢了..在线等! 过滤一些没用的标签,具体如何反复测试吧. fireye,说的对.
排除不用的标签,留下需要的.
^_^ 可是那个<br> <br> <br>
是发布上去才有的呀,大哥....
采集的时候没有...为什么它会自己加上呢...
这个能过滤掉吗?
采集下来的时候里面并没有这些代码,只是web发布的时候才出现的呀...
[ 本帖最后由 mapleaf 于 2008-2-19 10:29 编辑 ]
页:
[1]