采集开始第一步是分析要采集的页面。 使用浏览器打开要采集的页面(如:http://sports.sina.com.cn/k/2008-09-15/04593948756.shtml,你可以其他页面),打开后,点击右键,查源文件。第二步,找到要采集的内容所在位置。假如我要采集这个页面上的标题和内容所在的位置:标题在和之间内容在<!-- 正文内容 begin -->和<!-- 正文内容 end -->...