V3.2 sp3采集正文中特定内容[求助]
正文如下:怎样采集文中的电话号码?电脑维修、系统安装、病毒查杀、软件安装、网络策划及故障排除、网吧维护、.回收各种二手电脑硬件(硬盘,显卡,内存,CPU,主板,声卡,网卡,机箱,电源等).提供上门服务.
电话:0752-5861269手机:15816418683QQ:58119750地址:黄塘电脑城五号楼二楼B229
————————————————————————————————————————————————
奔腾42.0/260元 赛扬900/40元 赛扬633/25元
另外还有赛扬4 2.0,赛扬4 1.7,AMD462针脚系列,图拉丁,等等不一一陈述
注:1、我的意思是这一段是正文,正文里面只有文字没有代码啊。
2、我是想定义采集“电话”后面的数字,过虑掉文字做为一个项来发布
3、所有文章差不多是这样的格式,但没有固定的代码或格式。只是想采集正文章“电话”两个字后面的几位数字
不知道大家明白了没。。。。。。
[ 本帖最后由 cn1717 于 2007-12-26 21:54 编辑 ] 这是火车头的最基本功能。不能采集特定内容,要火车头干吗?直接用迅雷下载原始页面好了。建议楼主先学习教程,搜索论坛帖子,多学习,谨慎提问。 晕死了
我是想提取出正文中的电话号码
每篇文章的电话号码没有固定的代码标记
夹杂在正文中
我是想把正文中带“电话”后面的数字采集下来做为一个项
不知道怎样去掉后面多出来的文字 ali17ls 热心的火车呢 ali16ls 晕死了
是不是实现不了? 就你这,既没有链接,又没有代码。
我问你,我想采集下面一段中的aaaaaaaaaaaaaaaa怎么采集????
weifnfsdisdn sdfdfiwedi nsdiffcnijfi dfoasdifn aaaaaaaaaaaaaaaaasdlfiwern ierdnlwenf sdcijvfrfnrl
weifncivnfmleri caaaaaaaaaaaaaaaasidfneiwen
我这里有aaaaaaaaaaaaaaaa ,你告诉我怎么采集??????????????????? 连体温都不会。。 继续顶。。。。。。。。。ali15ls :ali11ls 正则试试
页:
[1]
2