正式使用Metastudio

这是我第一次做数据挖掘类也好,或者爬虫也好,迄今为止,我已经将Amazon上面简单的数据提取工作做完了,目前遇到的难题是,Amazon上面的comments很难提取。

我很喜欢目前做的这个工作,将来教课的时候可以用在business intelligence那里,还可以用在系统分析与设计那里。

Comments

可能需要AJAX网页抓取技巧

现在很多网站内容都用AJAX技术,尤其评论信息一般都用Javascript异步加载的,所以需要AJAX网页抓取技巧,请参照速成手册的AJAX部分。有问题也可以直接给我们发email