google163 发表于 2010-5-23 14:27:25

请教下汽车网站的采集

本帖最后由 google163 于 2010-5-23 14:29 编辑

刚接触火车头软件 想利用它采集下类似这种网站的数据
http://product.cheshi.com/model_10616/param.html
参数配置,我想把这个车的每一种型号的配置数据保存成SQL中的一条数据..(如上面链接,一大列就是一条数据)
请问下应该做,我是说思路...容易做到吗?
说到整个车型采集,大分类采集吧,比如说大众 迈腾系列 我是不是要先采集总的分类 把这些数据单独写一个任务采集成为大分类表保存在数据库中.http://product.cheshi.com/
然后再写一个任务,采集到每个系列下的具体参数..
哈.搞不清流程..请大家指教 ....谢谢..

google163 发表于 2010-5-23 14:36:04

有做好了现成的网站后台了..意思就是利用采集器,采集一些数据往相应后台的模块录入信息了..呵呵..

google163 发表于 2010-5-23 15:14:24

http://product.cheshi.com/model_10616/param.html
参数配置,我想把这个车的每一种型号的配置数据保存成SQL中的一条数据

如何写这个规则,比如说 厂商指导价:

sx1111 发表于 2010-5-23 15:26:27

没写过数据库直接入库   但是按照你的思路 采集时每一条参数对应一个标签(具体怎么采集到相应参数,那就多看看网页代码吧)再在发布模块中对应相应的标签应该就能完成我也是做汽车站的 有空交流下

yzimhao 发表于 2010-5-23 15:28:29

如果需要发布模块 可以联系一下我QQ 121083181

yzimhao 发表于 2010-5-23 15:29:39

可以把采集的数据构造成SQL语句 保存为文本 你到服务器上去run一下 就入库了

google163 发表于 2010-5-23 15:37:39

http://product.cheshi.com/model_10616/param.html
参数配置,我想把这个车的每一种型号的配置数据保存成SQL中的一条数据

如何写这个规则,比如说 厂商指导价:

刚接触不久,这个好像不太好写.就这一条都提取不正确,郁闷.

google163 发表于 2010-5-23 17:25:45

有高手请看下,意思就是代码中有好多相同的代码,无法去标识他们呀

      <td class="me_01">4</td>
              <td class="fg_content add_td">车门数(包括后车门)(个):</td>
          <td class="me_01">4</td>
            <td class="me_01">4</td>
            <td class="me_01">4</td>
            <td class="me_01">4</td>
            <td class="me_01">4</td>
              <td class="fg_content add_td">车门数(包括后车门)(个):</td>
          <td class="me_01">4</td>
            <td class="me_01">4</td>
            <td class="me_01">4</td>
            <td class="me_01">4</td>
            <td class="me_01">4</td>
              <td class="fg_content add_td">车门数(包括后车门)(个):</td>
          <td class="me_01">4</td>
            <td class="me_01">4</td>
      </tr>
    <tr class="params">
    <td height="18" class="fg_content all_show">前排内部高度(mm):</td>
            <td class="me_01" bgcolor="#F3FAFF">950</td>
            <td class="me_01">/</td>
            <td class="me_01">/</td>
            <td class="me_01">/</td>
            <td class="me_01">/</td>
              <td class="fg_content add_td">前排内部高度(mm):</td>
          <td class="me_01">/</td>
            <td class="me_01">/</td>
            <td class="me_01">/</td>
            <td class="me_01">950</td>
            <td class="me_01">950</td>
              <td class="fg_content add_td">前排内部高度(mm):</td>
          <td class="me_01">950</td>
            <td class="me_01">950</td>
            <td class="me_01">950</td>
            <td class="me_01">950</td>
            <td class="me_01">950</td>
              <td class="fg_content add_td">前排内部高度(mm):</td>
          <td class="me_01">950</td>

yzimhao 发表于 2010-5-23 19:05:04

这个问题还没有解决啊?

彬彬公子 发表于 2010-9-16 17:48:58

我有汽车数据库,若有需要请加QQ:178843750
页: [1]
查看完整版本: 请教下汽车网站的采集