晕死，规则都是一样的怎么采集啊？

yzxh24 发表于 2007-11-12 14:56:45

我想采集这个网址里的内容：http://www.training163.com/locale_show.asp?id=181

但是打开他的原文件后发现他里面内容的规则都是一样的，如下：
                     <tr>
                        <td align="left" bgcolor="#EEEEEE" class="gao20"> 培训场所英文名：</td>
                        <td align="left" bgcolor="#FFFFFF" class="gao20"><span class="gao20">jxvc</span></td>
                     </tr>
                     <tr>
                        <td align="left" bgcolor="#EEEEEE" class="gao20"> 培训场所类型：</td>
                        <td align="left" bgcolor="#FFFFFF" class="gao20">培训中心</td>
                     </tr>
                     <tr>
                        <td align="left" bgcolor="#EEEEEE" class="gao20"> 所在地区：</td>
                        <td align="left" bgcolor="#FFFFFF" class="gao20">江西-九江</td>
                     </tr>
                     <tr>
                        <td align="left" bgcolor="#EEEEEE" class="gao20"> 详细地址：</td>
                        <td align="left" bgcolor="#FFFFFF" class="gao20">九江市</td>
                     </tr>
                     <tr>
                        <td align="left" bgcolor="#EEEEEE" class="gao20"> 培训场所联系人：</td>
                        <td align="left" bgcolor="#FFFFFF" class="gao20">刘丽玲</td>
                     </tr>
                     <tr>
                        <td align="left" bgcolor="#EEEEEE" class="gao20"> 电话1：</td>
                        <td align="left" bgcolor="#FFFFFF" class="gao20">010-51298009-8005</td>
                     </tr>
                     <tr>
                        <td align="left" bgcolor="#EEEEEE" class="gao20"> 电话2：</td>
                        <td align="left" bgcolor="#FFFFFF" class="gao20"></td>
                     </tr>
                     <tr>
                        <td align="left" bgcolor="#EEEEEE" class="gao20"> 电话3：</td>
                        <td align="left" bgcolor="#FFFFFF" class="gao20"></td>
                     </tr>
                     <tr>
                        <td align="left" bgcolor="#EEEEEE" class="gao20"> 传真：</td>
                        <td align="left" bgcolor="#FFFFFF" class="gao20"></td>
                     </tr>
                     <tr>
                        <td align="left" bgcolor="#EEEEEE" class="gao20"> 电子邮件：</td>
                        <td align="left" bgcolor="#FFFFFF" class="gao20">redgg@163.com</td>
                     </tr>

我只想取出其中的几项，请问大家有什么办法吗？

hdmx 发表于 2007-11-12 15:33:08

仍然可以。
前面
心</td>
                     </tr>
                     <tr>
                        <td align="left" bgcolor="#EEEEEE" class="gao20">
=============================
：</td>

后面:lol

hdmx 发表于 2007-11-12 15:36:14

或者在替换中排除内容

页: [1]

火车采集器软件交流官方论坛's Archiver

晕死，规则都是一样的怎么采集啊？