yzxh24 发表于 2007-11-12 14:56:45

晕死,规则都是一样的怎么采集啊?

我想采集这个网址里的内容:http://www.training163.com/locale_show.asp?id=181

但是打开他的原文件后发现他里面内容的规则都是一样的,如下:
                        <tr>
                            <td align="left" bgcolor="#EEEEEE" class="gao20"> 培训场所英文名:</td>
                            <td align="left" bgcolor="#FFFFFF" class="gao20"><span class="gao20">jxvc</span></td>
                        </tr>
                        <tr>
                            <td align="left" bgcolor="#EEEEEE" class="gao20"> 培训场所类型:</td>
                            <td align="left" bgcolor="#FFFFFF" class="gao20">培训中心</td>
                        </tr>
                        <tr>
                            <td align="left" bgcolor="#EEEEEE" class="gao20"> 所在地区:</td>
                            <td align="left" bgcolor="#FFFFFF" class="gao20">江西-九江</td>
                        </tr>
                        <tr>
                            <td align="left" bgcolor="#EEEEEE" class="gao20"> 详细地址:</td>
                            <td align="left" bgcolor="#FFFFFF" class="gao20">九江市</td>
                        </tr>
                        <tr>
                            <td align="left" bgcolor="#EEEEEE" class="gao20"> 培训场所联系人:</td>
                            <td align="left" bgcolor="#FFFFFF" class="gao20">刘丽玲</td>
                        </tr>
                        <tr>
                            <td align="left" bgcolor="#EEEEEE" class="gao20"> 电话1:</td>
                            <td align="left" bgcolor="#FFFFFF" class="gao20">010-51298009-8005</td>
                        </tr>
                        <tr>
                            <td align="left" bgcolor="#EEEEEE" class="gao20"> 电话2:</td>
                            <td align="left" bgcolor="#FFFFFF" class="gao20"></td>
                        </tr>
                        <tr>
                            <td align="left" bgcolor="#EEEEEE" class="gao20"> 电话3:</td>
                            <td align="left" bgcolor="#FFFFFF" class="gao20"></td>
                        </tr>
                        <tr>
                            <td align="left" bgcolor="#EEEEEE" class="gao20"> 传真:</td>
                            <td align="left" bgcolor="#FFFFFF" class="gao20"></td>
                        </tr>
                        <tr>
                            <td align="left" bgcolor="#EEEEEE" class="gao20"> 电子邮件:</td>
                            <td align="left" bgcolor="#FFFFFF" class="gao20">redgg@163.com</td>
                        </tr>

我只想取出其中的几项,请问大家有什么办法吗?

hdmx 发表于 2007-11-12 15:33:08

仍然可以。
前面
心</td>
                        </tr>
                        <tr>
                            <td align="left" bgcolor="#EEEEEE" class="gao20">
=============================
:</td>

后面:lol

hdmx 发表于 2007-11-12 15:36:14

或者在替换中排除内容
页: [1]
查看完整版本: 晕死,规则都是一样的怎么采集啊?