Ozon是俄罗斯的一家B2C电商平台,俄罗斯最大的在线零售商,成立于1998年,常被称为“俄罗斯亚马逊”或“俄罗斯版淘宝”…
精灵球就是指的是Instant Data Scraper Chrome 这款浏览器插件。
关于Instant Data Scraper
Instant Data Scraper插件完全在用户的浏览器中运行,并且不会将数据发送到Web Robots。该插件可以将多页数据检索到一个文件中。
支持平台
在Amazon、eBay、Best Buy、Walmart、Etsy、Home Depot、Craigslist、Yelp 等热门网站中,Instant Data Scraper插件均可使用,并且无需使用者具备编码技能。
插件下载
1、在Chrome网上应用店搜索并安装插件“Instant Data Scraper”。
2、如无法访问 Chrome网上应用店,可以离线安装插件:
通过当前页面下载Instant Data Scraper离线安装包,打开扩展程序内的开发者模式,将解压后的crx文件拖拽至扩展程序管理,选择添加插件即可。
插件使用方法
插件使用起来非常简单,以采集亚马逊Review为例:
1、打开产品Reviews页的第一页,网址格式如:https://www.amazon.com/product-reviews/产品的ASIN;
2、点击Instant Data Scraper插件图标,激活「精灵球」;
3、「精灵球」会自动判断可抓取的页面区域,如果区域不对,点击「Try another table」按钮可以切换区域:
4、点击「Locate "Next" button」按钮来定位页面中的「Next」按钮或链接;
5、点击「Start crawling」按钮开始爬取页面,插件会实时显示爬取到数据,请耐心等待,切勿打开其他页面,不然爬取会中断出错;
6、等数据都爬取完了就可以点击绿色按钮进行下载,可选 CSV 或 Excel 文件:
7、打开下载好的CSV或Excel文件,删掉你不需要的数据列即可。
简单几步搞定亚马逊评价(Reviews)的爬取和采集!另外,Q&A 也是可以爬取的。