火车头的过滤是否不够完善?或者是我没使用对?请大家指教
我在采集的时候发现这样一个问题先把测试的数据发出来给大家看看<img
src="http://www.woyaoyin.cn/upload/images/medium/20100218/2010021812664
87700116.jpg" alt="点击查看原图" class="showPic" border="0"/>
所 在 地: 河南安阳
数 量:
5000
所属类别:
包装印刷类 >> 塑料袋印刷
报价截止:
2010-02-20 00:00:00.0
交付时间:
2010-02-20 00:00:00.0
档次
要求: 一般
支付方式: 双方协议支付
最新修改:
2010-02-18 18:08:20.0 相关附件:
<input name="submit" type="image" id="quoteBtn" value="
我要报价"onclick="Javascript:addDemandReply('70171','209770')"
src="/images/wyy-btn-quote.gif" align="absmiddle"/>
<img src =
"http://www.woyaoyin.cn/images/wyy-btn-userview.gif" border="0"
align="absmiddle">
<img src="http://www.woyaoyin.cn/images/wyy
-send-medium.gif" border="0" align="absmiddle" title="留个消息"/>
具体描述
成品尺寸 长*宽*高 单位(mm):底是12X12CM
高41CM
材质:其他
颜色:
背袋圓筒狀,底是12X12CM高
41CM,有绳子。详细如图!
-------------------------------------------------------------------
目标页面是这个http://www.woyaoyin.cn/demand/viewDemand-70171.htm
-------------------------------------------
这个是产品缩略图 <img
src="http://www.woyaoyin.cn/upload/images/medium/20100218/2010021812664
87700116.jpg" alt="点击查看原图" class="showPic" border="0"/>
我是要留着的
-------------------------------------
但是下面这些图片我是不需要的
<input name="submit" type="image" id="quoteBtn" value="我
要报价"onclick="Javascript:addDemandReply('70171','209770')"
src="/images/wyy-btn-quote.gif" align="absmiddle"/>
<img src =
"http://www.woyaoyin.cn/images/wyy-btn-userview.gif" border="0"
align="absmiddle">
<img src="http://www.woyaoyin.cn/images/wyy
-send-medium.gif" border="0" align="absmiddle" title="留个消息"/>
这些代码和图片和代码是我不需要的
于是我在火车头里面选择内容排除 问题就出来,火车头似乎只支持内容排除如
:我要报价、留个消息、 而对于里面的代码却无法排除。这样的问题似乎不应该
在火车头这么强大的采集器中出现吧?又或者是我没找到其他方法?
----------------------------------------------------------
恳请各位老鸟赐教 办法是有的!其中做个插件近乎无敌! 插件?
那对于我们这些初级选手来说近乎不可能的,看来这还真是火车头需要完善的地方。我记得dede好像都要自定义过滤的地方。
不知道楼上所有说的除了插件的办法是那一种? 做个PHP或asp.net处理!或在发布后在数据库用SQL语句处理等等……办法多了是! 喔
我还以为能在火车头自带的功能中解决掉呢
页:
[1]