mcyaas 发表于 2011-11-15 17:36:49

火车头如何采集本页的URL啊?

本帖最后由 mcyaas 于 2011-11-16 11:37 编辑

如题。

例如:http://www.baojirc.com/Html/JobDetail/34410.html   在这个页面的源文件里面。没有该页的URL,如何加入采集标签?谢谢。
最终目的就是为了采集到:http://www.baojirc.com/Html/JobDetail/34410.html   这个数据。

谢谢大家!

如下为该网页源文件:<!DOCTYPE HTML PUBLIC "-//W3C//DTD HTML 4.01 Transitional//EN">
<html>
<head>
<meta http-equiv="Content-Type" content="text/html; charset=gb2312">
<title>工业会计 - 宝鸡宇航钛业有限责任公司 - 宝鸡人才招聘网</title>
<meta name="keywords"content="工业会计,工业会计招聘,宝鸡宇航钛业有限责任公司,宝鸡宇航钛业有限责任公司招聘信息" />
<meta name="description" content="工业会计招聘信息,宝鸡人才招聘网baojirc.com为求职者提供宝鸡宇航钛业有限责任公司招聘信息汇总,拥有大量最新工业会计招聘信息供您选择,帮助您顺利获取工业会计的职位,打开职场大门" />
<link href="../../Css/Style.css" rel="stylesheet" type="text/css">
</head>
<script type="text/javascript" src="../../c_Public/ReadClick.aspx?TypeName=Job&Param=34410"></script>
<body>
<!--页面顶部-->
<table width="992" border="0" align="center" cellpadding="0" cellspacing="0" class="BodyBorder"><tr><td align="center" bgcolor="#FFFFFF">
<iframe src="../../c_Controls/Template/Header_Company_Detail.aspx" width="100%" height="128" frameborder="0" align="middle" scrolling="no"></iframe>
</td></tr></table>
<!--页面主体-->
<table width="992" border="0" align="center" cellpadding="0" cellspacing="0" class="BodyBorder">
            <tr><td align="center" bgcolor="#FFFFFF"><table width="980" border="0" align="center" cellpadding="0" cellspacing="0">
<tr>
    <td height="100" valign="bottom" background="../../Images/Blue/Browse/top1_bg.jpg">
      <table width="100%" border="0" cellspacing="0" cellpadding="0">
      <tr>
          <td width="295" height="30">&nbsp;</td>
          <td class="font15"><font color=#ff7400>宝鸡宇航钛业有限责任公司</font></td>
      </tr>
      </table>
      <table width="100%" border="0" cellspacing="0" cellpadding="0">
      <tr>
          <td height="25">&nbsp;</td>
      </tr>
      </table>
      <table width="100%" border="0" cellspacing="0" cellpadding="0">
      <tr>
          <td height="28" background="../../Images/Blue/Browse/top2_bg.gif">&nbsp;</td>
          <td width="10">&nbsp;</td>
          <td width="770" background="../../Images/Blue/Browse/top2_bg.gif"> <table width="100%" border="0" cellspacing="0" cellpadding="0">
            <tr>
                <td>&nbsp;</td>
                <td width="85" height="28" align="center" background="../../Images/Blue/Browse/top2_t2.jpg"><a href="../Company/33196.html">公司简介</a></td>
                <td width="5"></td>
                <td width="85" align="center" background="../../Images/Blue/Browse/top2_t1.jpg"><a href="#" class="white"><b>招聘职位</b></a></td>
                <td width="20">&nbsp;</td>
            </tr>
            </table></td>
      </tr>
      </table></td>
</tr>
</table>
<table width="980" border="0" align="center" cellpadding="0" cellspacing="0">
                        <tr valign="top">
                        <td><!--左侧-->
                        <table width="100%" border="0" cellspacing="0" cellpadding="0">
                        <tr>
                       <td height="5"></td>
                        </tr>
                        </table>
                        <!--招聘职位-->
                        <table width="100%" border="0" cellspacing="0" cellpadding="0">
                        <tr>
          <td> <table width="100%" border="0" cellspacing="0" cellpadding="0">
            <tr>
                <td width="5" height="25"><img src="../../Images/Blue/Browse/left1_left.jpg" width="5" height="25"></td>
                <td background="../../Images/Blue/Browse/left1_bg.jpg" style="padding-top:2px;padding-left:5px;"><font color=#FF6600><b>招聘职位</b></font><font color=#0066cc>&nbsp;</font></td>
                <td width="5"><img src="../../Images/Blue/Browse/left1_right.jpg" width="5" height="25"></td>
            </tr>
            </table></td></tr>
                        <tr><td style="padding-top:2px;">
                        <!--招聘职位-->
                        <iframe src="../../c_Controls/Template/Company_JobNew.aspx?Comid=33196" id="Company_JobNew" width="100%" height="100%" frameborder="0" align="middle" scrolling="no"></iframe>
                        </td></tr>
                        </table>
                        </td>
                <td width="10" background="../../Images/Public/Line1_2.gif">&nbsp;</td>
                <td width="770" style="PADDING-RIGHT:1px;PADDING-LEFT:1px"><!--右侧-->
                <!--职位信息-->
                <table width="100%" border="0" cellspacing="0" cellpadding="0">
      <tr>
          <td height="5"></td>
      </tr>
      <tr>
          <td><table width="100%" border="0" cellspacing="0" cellpadding="0">
            <tr valign="top">
                <td style="padding-left:5px">
                <!--公司信息-->
                <table width="100%" border="0" cellspacing="0" cellpadding="0">
                <tr><td height="20" class="font14"><b><font color="#FF6600">工业会计</font></b></td></tr>
                <tr>
                      <td height="20">公司规模:10~50人<br>
                        公司性质:股份制企业<br>
                        公司行业:机械制造·机电·重工<br></td>
                  </tr>
                  </table></td>
                <td width="248" align="center">&nbsp;</td>
            </tr>
            </table> </td>
      </tr>
      </table>
      <table width="100%" border="0" align="center" cellpadding="0" cellspacing="1">
      <tr><td height="2"></td></tr>
      <tr><td height="2" bgcolor="#dddddd"></td></tr>
      </table>
      <table width="100%" border="0" cellspacing="1" cellpadding="4">
      <tr>
          <td width="12%" bgcolor="#f9f9f9">职位性质:</td>
          <td width="38%">全职</td>
          <td width="12%" bgcolor="#f9f9f9">招聘部门:</td>
          <td width="38%">本部</td>
      </tr>
      <tr><td colspan="4" height="1" bgcolor="#dddddd"></td></tr>
                <tr>
          <td width="12%" bgcolor="#f9f9f9">招聘人数:</td>
          <td width="38%">2人</td>
          <td width="12%" bgcolor="#f9f9f9">职位月薪:</td>
          <td width="38%">面议</td>
      </tr>
      <tr><td colspan="4" height="1" bgcolor="#dddddd"></td></tr>
      <tr>
          <td width="12%" bgcolor="#f9f9f9">发布日期:</td>
          <td width="38%">2011-11-14</td>
          <td width="12%" bgcolor="#f9f9f9">截止日期:</td>
          <td width="38%">2012-2-12</td>
      </tr>
      <tr><td colspan="4" height="1" bgcolor="#dddddd"></td></tr>
      <tr>
          <td width="12%" bgcolor="#f9f9f9">学历要求:</td>
          <td width="38%">本科</td>
          <td width="12%" bgcolor="#f9f9f9">工作经验:</td>
          <td width="38%">2年以上</td>
      </tr>
      <tr><td colspan="4" height="1" bgcolor="#dddddd"></td></tr>
      <tr>
          <td width="12%" bgcolor="#f9f9f9">年龄要求:</td>
          <td width="38%">不限</td>
          <td width="12%" bgcolor="#f9f9f9">性别要求:</td>
          <td width="38%">不限</td>
      </tr>
      <tr><td colspan="4" height="1" bgcolor="#dddddd"></td></tr>
      <tr>
          <td width="12%" bgcolor="#f9f9f9">语言能力:</td>
          <td width="38%">不限</td>
          <td width="12%" bgcolor="#f9f9f9">简历语言:</td>
          <td width="38%">不限</td>
      </tr>
      <tr><td colspan="4" height="1" bgcolor="#dddddd"></td></tr>
      </table>
      <table width="100%" border="0" cellspacing="1" cellpadding="4">
      <tr>
          <td width="12%" bgcolor="#f9f9f9">工作地区:</td>
          <td width="88%">陕西宝鸡</td>
      </tr>
      <tr><td colspan="2" height="1" bgcolor="#dddddd"></td></tr>
      <tr><td width=12% bgcolor=#f9f9f9>其他待遇:</td><td width=88%>分红</td></tr><tr><td colspan=2 height=1 bgcolor=#dddddd></td></tr>
      </table>
      <!--职位描述-->
      <table width="100%" border="0" cellspacing="0" cellpadding="0">
      <tr>
          <td height="25" style="padding-left:5px;"><strong>职位描述</strong>:</td>
      </tr>
      <tr>
          <td style="padding-left:5px;word-break:break-all;overflow:auto;">负责日常财务管理,编制报表,做好核算及财务分析。</td>
      </tr>
      </table>
      <!--联系方式-->
      <iframe src="../../c_Controls/Template/JobDetail_Contact.aspx?Jobid=34410" id="JobDetail_Contact" width="100%" height="100%" frameborder="0" align="middle" scrolling="no"></iframe>
      <table width="100%" border="0" align="center" cellpadding="0" cellspacing="0">
      <tr><td height="10"></td></tr>
      </table>
      <!--操作按扭-->
      <table width="100%" border="0" cellspacing="0" cellpadding="4">
      <tr>
          <td align="center"><!--申请职位--><a href="../../c_Resume/Res_ToApply.aspx?Jobid=34410" target=_blank><img src="../../Images/Company/Button2_1.jpg" width="140" height="36" border="0"></a>&nbsp;&nbsp;
          <!--填写简历--><a href="../../c_Resume/Res_Create_Resume.aspx"><img src="../../Images/Company/Button2_2.jpg" width="140" height="36" border="0"></a>
          </td>
      </tr>
      <tr>
          <td align="center">『<a href="../../c_Resume/Res_ToFavorite.aspx?Jobid=34410">收藏该职位</a>』&nbsp;&nbsp;
                  『<a href="../../c_Person/Per_ToFriend.aspx?Comid=33196&Jobid=34410" target=_blank>推荐给好友</a>』&nbsp;&nbsp;
                  『<a href="../../c_Resume/Res_ToVideo.aspx?Jobid=34410" target=_blank>申请视频面试</a>』&nbsp;&nbsp;
                  『<a href="../Company/33196.html">该公司所有职位</a>』&nbsp;&nbsp;
                  『<a href="javascript:" onClick="javascript:window.print();">打印</a>』</td>
      </tr>
      </table>
      <table width="100%" border="0" align="center" cellpadding="0" cellspacing="0">
      <tr>
          <td height="5"></td>
      </tr>
      </table>
        </td></tr>
        </table></td></tr>
                        </table>
<!--页面底部-->
<table width="992" border="0" align="center" cellpadding="0" cellspacing="0" class="BodyBorder"><tr><td align="center" bgcolor="#FFFFFF">
<iframe src="../../c_Controls/Template/Footer.aspx" width="100%" height="125" frameborder="0" align="middle" scrolling="no"></iframe>
</td></tr></table>
</body>
</html>

kuhabe 发表于 2011-11-16 09:31:47

mcyaas 发表于 2011-11-16 09:18 static/image/common/back.gif
点击这么多,没人回答啊?


如图建立标签设置。




^(?<content>[\s\S]*?)$

mcyaas 发表于 2011-11-16 09:18:42

点击这么多,没人回答啊?:Q

mcyaas 发表于 2011-11-16 09:38:43

kuhabe 发表于 2011-11-16 09:31 static/image/common/back.gif
如图建立标签设置。




非常感谢,我去试试。

孤魂 发表于 2011-11-16 09:52:44

直接使用[采集页地址]的标签就可以了

mcyaas 发表于 2011-11-16 09:56:52

孤魂 发表于 2011-11-16 09:52 static/image/common/back.gif
直接使用[采集页地址]的标签就可以了

昨天试了这个方法了。好像不行啊。。。

mcyaas 发表于 2011-11-16 11:37:46

问题已经解决。谢谢大家!

Kyle7 发表于 2011-11-16 12:04:07

楼主都不分享下如何解决的吗?

afeizt 发表于 2012-2-23 17:21:13

我也有这个问题....

superlk1 发表于 2012-12-10 14:25:07

顶楼主
西力士 www.bhlt99.com
希爱力www.xinliangoil.com
万ai可www.dl-tomorrow.com
基因育根 www.shmideakt.com
基因育根 www.senboom.com
北京an摩 www.tbrenren.com
电视棒 www.zjjhgjg.com
超级P57 www.hxww.net
治疗白发www.wzeas.com
页: [1]
查看完整版本: 火车头如何采集本页的URL啊?