求助:我采集后保存为TXT文件,为什么有一些多余的部分?
缩略图:作者: 网络
PageUrl: http://www.cnbeta.com/articles/105504.htm
标题:专家特别提醒:日听6小时MP3易患耳聋
内容: 随着MP3等便携式音乐播放器的流行,出现耳病的青少年已明显增多。3月3日是全国爱耳日,专家特别提醒:每天累计听6小时或连续听2小时MP3,易出现 耳聋症状。长时间用耳塞式耳机听音乐,会对听力造成伤害。耳科专家表示,耳机塞在耳朵里,离鼓膜很近,鼓膜在特殊的环境中连续受到几小时、甚至十几个小时的震动、反 复刺激,没有伸缩的余地,特别容易出现鼓膜疲劳。尤其对于一些睡前还用耳机听音乐,并不知不觉睡着的人来说,很有可能造成噪声性耳聋和耳鸣。现代城市里噪声比较严重,建筑工地噪声达80分贝,地铁里的声音也有70分贝以上,在这样的环境中戴耳机听音乐会不自觉地提高音量至100分贝以“盖过”噪声,长此以往会造成听力下降,严重的还可能造成耳聋。专家建议说,在周围噪声很大的环境下,尽量不要听MP3,每次听MP3半小时至一小时,要让耳朵休息一下。此外,贪图“舒服”乱掏耳朵、滥用抗生素等不良习惯,都有可能对耳朵造成严重的伤害。0
时间: 1267671502
缩略图:
=================================================================================================
这两项我不想要,如何去除了,如何我怎么试都有...如果替的话那个缩略图可以去掉,但是采集的内容那么多,下面的PageUrl:怎么去除呢? 第一次使用火车头,感觉很棒,但是这一点小问题困扰我几个小时了...请各位帮帮我!
缩略图:
PageUrl: http://www.cnbeta.com/articles/105504.htm 去除不了.............................
改成 HTM 保存可以自定义 输出标签 先存成HTML,采完后批量改后缀就行了
页:
[1]