【实际操作】
以下为日后调入针对AJAX网页的提取主题的步骤:
1 MetaStudio下,切换到"Schema List"。
2 搜索框中输入:"北京公交*"(本示例)
3 右键目标主题行-选择"加载"。
4 弹出提示框。表示信息结构已经加载下来,但还未用其分析目标页面,需手动激活分析。
这是为了让MetaStudio等待Javascript修改DOM,您需观察下方的浏览器,直到新闻标题(本例)都看到了,点击"确定"。
5 点MetaStudio菜单-文件,选择"后续分析"。系统自动完成DOM刷新和信息结构套用分析。
6 若要再次点击下方浏览器中的页面以分析DOM树,莫忘勾选反选DOM节点。
另,重新调入后,无论是否编辑,若要上载(Schema),务必点击菜单-配置,去除"自动刷新DOM"前的勾选。
AJAX网页抓取的更多帮助。
|