火车头如何采集本页的URL啊?
本帖最后由 mcyaas 于 2011-11-16 11:37 编辑如题。
例如:http://www.baojirc.com/Html/JobDetail/34410.html 在这个页面的源文件里面。没有该页的URL,如何加入采集标签?谢谢。
最终目的就是为了采集到:http://www.baojirc.com/Html/JobDetail/34410.html 这个数据。
谢谢大家!
如下为该网页源文件:<!DOCTYPE HTML PUBLIC "-//W3C//DTD HTML 4.01 Transitional//EN">
<html>
<head>
<meta http-equiv="Content-Type" content="text/html; charset=gb2312">
<title>工业会计 - 宝鸡宇航钛业有限责任公司 - 宝鸡人才招聘网</title>
<meta name="keywords"content="工业会计,工业会计招聘,宝鸡宇航钛业有限责任公司,宝鸡宇航钛业有限责任公司招聘信息" />
<meta name="description" content="工业会计招聘信息,宝鸡人才招聘网baojirc.com为求职者提供宝鸡宇航钛业有限责任公司招聘信息汇总,拥有大量最新工业会计招聘信息供您选择,帮助您顺利获取工业会计的职位,打开职场大门" />
<link href="../../Css/Style.css" rel="stylesheet" type="text/css">
</head>
<script type="text/javascript" src="../../c_Public/ReadClick.aspx?TypeName=Job&Param=34410"></script>
<body>
<!--页面顶部-->
<table width="992" border="0" align="center" cellpadding="0" cellspacing="0" class="BodyBorder"><tr><td align="center" bgcolor="#FFFFFF">
<iframe src="../../c_Controls/Template/Header_Company_Detail.aspx" width="100%" height="128" frameborder="0" align="middle" scrolling="no"></iframe>
</td></tr></table>
<!--页面主体-->
<table width="992" border="0" align="center" cellpadding="0" cellspacing="0" class="BodyBorder">
<tr><td align="center" bgcolor="#FFFFFF"><table width="980" border="0" align="center" cellpadding="0" cellspacing="0">
<tr>
<td height="100" valign="bottom" background="../../Images/Blue/Browse/top1_bg.jpg">
<table width="100%" border="0" cellspacing="0" cellpadding="0">
<tr>
<td width="295" height="30"> </td>
<td class="font15"><font color=#ff7400>宝鸡宇航钛业有限责任公司</font></td>
</tr>
</table>
<table width="100%" border="0" cellspacing="0" cellpadding="0">
<tr>
<td height="25"> </td>
</tr>
</table>
<table width="100%" border="0" cellspacing="0" cellpadding="0">
<tr>
<td height="28" background="../../Images/Blue/Browse/top2_bg.gif"> </td>
<td width="10"> </td>
<td width="770" background="../../Images/Blue/Browse/top2_bg.gif"> <table width="100%" border="0" cellspacing="0" cellpadding="0">
<tr>
<td> </td>
<td width="85" height="28" align="center" background="../../Images/Blue/Browse/top2_t2.jpg"><a href="../Company/33196.html">公司简介</a></td>
<td width="5"></td>
<td width="85" align="center" background="../../Images/Blue/Browse/top2_t1.jpg"><a href="#" class="white"><b>招聘职位</b></a></td>
<td width="20"> </td>
</tr>
</table></td>
</tr>
</table></td>
</tr>
</table>
<table width="980" border="0" align="center" cellpadding="0" cellspacing="0">
<tr valign="top">
<td><!--左侧-->
<table width="100%" border="0" cellspacing="0" cellpadding="0">
<tr>
<td height="5"></td>
</tr>
</table>
<!--招聘职位-->
<table width="100%" border="0" cellspacing="0" cellpadding="0">
<tr>
<td> <table width="100%" border="0" cellspacing="0" cellpadding="0">
<tr>
<td width="5" height="25"><img src="../../Images/Blue/Browse/left1_left.jpg" width="5" height="25"></td>
<td background="../../Images/Blue/Browse/left1_bg.jpg" style="padding-top:2px;padding-left:5px;"><font color=#FF6600><b>招聘职位</b></font><font color=#0066cc> </font></td>
<td width="5"><img src="../../Images/Blue/Browse/left1_right.jpg" width="5" height="25"></td>
</tr>
</table></td></tr>
<tr><td style="padding-top:2px;">
<!--招聘职位-->
<iframe src="../../c_Controls/Template/Company_JobNew.aspx?Comid=33196" id="Company_JobNew" width="100%" height="100%" frameborder="0" align="middle" scrolling="no"></iframe>
</td></tr>
</table>
</td>
<td width="10" background="../../Images/Public/Line1_2.gif"> </td>
<td width="770" style="PADDING-RIGHT:1px;PADDING-LEFT:1px"><!--右侧-->
<!--职位信息-->
<table width="100%" border="0" cellspacing="0" cellpadding="0">
<tr>
<td height="5"></td>
</tr>
<tr>
<td><table width="100%" border="0" cellspacing="0" cellpadding="0">
<tr valign="top">
<td style="padding-left:5px">
<!--公司信息-->
<table width="100%" border="0" cellspacing="0" cellpadding="0">
<tr><td height="20" class="font14"><b><font color="#FF6600">工业会计</font></b></td></tr>
<tr>
<td height="20">公司规模:10~50人<br>
公司性质:股份制企业<br>
公司行业:机械制造·机电·重工<br></td>
</tr>
</table></td>
<td width="248" align="center"> </td>
</tr>
</table> </td>
</tr>
</table>
<table width="100%" border="0" align="center" cellpadding="0" cellspacing="1">
<tr><td height="2"></td></tr>
<tr><td height="2" bgcolor="#dddddd"></td></tr>
</table>
<table width="100%" border="0" cellspacing="1" cellpadding="4">
<tr>
<td width="12%" bgcolor="#f9f9f9">职位性质:</td>
<td width="38%">全职</td>
<td width="12%" bgcolor="#f9f9f9">招聘部门:</td>
<td width="38%">本部</td>
</tr>
<tr><td colspan="4" height="1" bgcolor="#dddddd"></td></tr>
<tr>
<td width="12%" bgcolor="#f9f9f9">招聘人数:</td>
<td width="38%">2人</td>
<td width="12%" bgcolor="#f9f9f9">职位月薪:</td>
<td width="38%">面议</td>
</tr>
<tr><td colspan="4" height="1" bgcolor="#dddddd"></td></tr>
<tr>
<td width="12%" bgcolor="#f9f9f9">发布日期:</td>
<td width="38%">2011-11-14</td>
<td width="12%" bgcolor="#f9f9f9">截止日期:</td>
<td width="38%">2012-2-12</td>
</tr>
<tr><td colspan="4" height="1" bgcolor="#dddddd"></td></tr>
<tr>
<td width="12%" bgcolor="#f9f9f9">学历要求:</td>
<td width="38%">本科</td>
<td width="12%" bgcolor="#f9f9f9">工作经验:</td>
<td width="38%">2年以上</td>
</tr>
<tr><td colspan="4" height="1" bgcolor="#dddddd"></td></tr>
<tr>
<td width="12%" bgcolor="#f9f9f9">年龄要求:</td>
<td width="38%">不限</td>
<td width="12%" bgcolor="#f9f9f9">性别要求:</td>
<td width="38%">不限</td>
</tr>
<tr><td colspan="4" height="1" bgcolor="#dddddd"></td></tr>
<tr>
<td width="12%" bgcolor="#f9f9f9">语言能力:</td>
<td width="38%">不限</td>
<td width="12%" bgcolor="#f9f9f9">简历语言:</td>
<td width="38%">不限</td>
</tr>
<tr><td colspan="4" height="1" bgcolor="#dddddd"></td></tr>
</table>
<table width="100%" border="0" cellspacing="1" cellpadding="4">
<tr>
<td width="12%" bgcolor="#f9f9f9">工作地区:</td>
<td width="88%">陕西宝鸡</td>
</tr>
<tr><td colspan="2" height="1" bgcolor="#dddddd"></td></tr>
<tr><td width=12% bgcolor=#f9f9f9>其他待遇:</td><td width=88%>分红</td></tr><tr><td colspan=2 height=1 bgcolor=#dddddd></td></tr>
</table>
<!--职位描述-->
<table width="100%" border="0" cellspacing="0" cellpadding="0">
<tr>
<td height="25" style="padding-left:5px;"><strong>职位描述</strong>:</td>
</tr>
<tr>
<td style="padding-left:5px;word-break:break-all;overflow:auto;">负责日常财务管理,编制报表,做好核算及财务分析。</td>
</tr>
</table>
<!--联系方式-->
<iframe src="../../c_Controls/Template/JobDetail_Contact.aspx?Jobid=34410" id="JobDetail_Contact" width="100%" height="100%" frameborder="0" align="middle" scrolling="no"></iframe>
<table width="100%" border="0" align="center" cellpadding="0" cellspacing="0">
<tr><td height="10"></td></tr>
</table>
<!--操作按扭-->
<table width="100%" border="0" cellspacing="0" cellpadding="4">
<tr>
<td align="center"><!--申请职位--><a href="../../c_Resume/Res_ToApply.aspx?Jobid=34410" target=_blank><img src="../../Images/Company/Button2_1.jpg" width="140" height="36" border="0"></a>
<!--填写简历--><a href="../../c_Resume/Res_Create_Resume.aspx"><img src="../../Images/Company/Button2_2.jpg" width="140" height="36" border="0"></a>
</td>
</tr>
<tr>
<td align="center">『<a href="../../c_Resume/Res_ToFavorite.aspx?Jobid=34410">收藏该职位</a>』
『<a href="../../c_Person/Per_ToFriend.aspx?Comid=33196&Jobid=34410" target=_blank>推荐给好友</a>』
『<a href="../../c_Resume/Res_ToVideo.aspx?Jobid=34410" target=_blank>申请视频面试</a>』
『<a href="../Company/33196.html">该公司所有职位</a>』
『<a href="javascript:" onClick="javascript:window.print();">打印</a>』</td>
</tr>
</table>
<table width="100%" border="0" align="center" cellpadding="0" cellspacing="0">
<tr>
<td height="5"></td>
</tr>
</table>
</td></tr>
</table></td></tr>
</table>
<!--页面底部-->
<table width="992" border="0" align="center" cellpadding="0" cellspacing="0" class="BodyBorder"><tr><td align="center" bgcolor="#FFFFFF">
<iframe src="../../c_Controls/Template/Footer.aspx" width="100%" height="125" frameborder="0" align="middle" scrolling="no"></iframe>
</td></tr></table>
</body>
</html>
mcyaas 发表于 2011-11-16 09:18 static/image/common/back.gif
点击这么多,没人回答啊?
如图建立标签设置。
^(?<content>[\s\S]*?)$ 点击这么多,没人回答啊?:Q kuhabe 发表于 2011-11-16 09:31 static/image/common/back.gif
如图建立标签设置。
非常感谢,我去试试。 直接使用[采集页地址]的标签就可以了 孤魂 发表于 2011-11-16 09:52 static/image/common/back.gif
直接使用[采集页地址]的标签就可以了
昨天试了这个方法了。好像不行啊。。。 问题已经解决。谢谢大家! 楼主都不分享下如何解决的吗? 我也有这个问题.... 顶楼主
西力士 www.bhlt99.com
希爱力www.xinliangoil.com
万ai可www.dl-tomorrow.com
基因育根 www.shmideakt.com
基因育根 www.senboom.com
北京an摩 www.tbrenren.com
电视棒 www.zjjhgjg.com
超级P57 www.hxww.net
治疗白发www.wzeas.com
页:
[1]