kimonolabs网页抓取服务体验

kimonolabs成立于2014年1月16日。这是一个新兴的网络数据提取以及将非结构化数据进行结构化处理的网站。刚出生没多久的她,还不够成熟,但是,相当有潜力。

下面我就把自己体验的过程简单展现给大家,由于是新产品,因此目前看的东西很可能在近期就会发生变化,详情以网页提供的服务为准。。。

logo (1)

核心思路

kimonolabs的网页抓取服务的主要想法很简单,就是把网站变成API。 这个想法本身并不新,不过用起来非常现代和有前途。
你可以从网页上生成原始数据(JSON,CSV或RSS格式),而且可以瞬间创建Web应用程序(当然由kimonolabs.com托管),这样,这些抓取的数据就可以用于网络之上。

操作流程

流程非常简单。 当你需要“kimonify”(他们这么叫这个功能)某些Web页面,您只需要点击一个特殊的书签,然后选择数据的所有你感兴趣的部分:

_20140327115141

你选择的栏目将被保存。

_20140327115121

可以用JSON对象,CSV或者RSS来展现。很酷吧?

_20140327115451

创建个API:

_20140327115702

于是你就可以。。。。

_20140327120237

这样玩。

正如前面所说的,你只要打开任何一个网页,在你的浏览器收藏夹上选择kimonify,就可以进行抓取了。

_20140327121035

这样顶部就会出现工具栏帮助你管理要抓取的数据类型。V和X用来选择什么数据系列需要抓取。

_20140327121243

API完成后,你就可以通过一个专有的URL来访问它。PHP代码示例如下:

_20140327121901

不知道如果结合Node.js用会有多强大。:)

价格方面我就不多谢了。大家可以直接访问网站查看。

总结

这类新兴的内容整合工具的兴起方兴未艾。昨天看到这个服务,早上起来我就兴冲冲地看了一遍。

重要的是,我非常喜欢这个应用。可以想象的场景:我们去抓股票信息,天气信息,新闻等等。。。。

有这么强的工具,你的网站还会怕没内容么?:)

有风

有风

You may also like...

5 Responses

  1. 丽水资讯网说道:

    楼主可以体验下他们平台的采集引擎,比较好用,云端的工具 API也方便。www.finndy.com

  2. 网络爬虫说道:

    KimonoLabs转眼被Palantir收购了,这两个目前都是业界关注热点。KimonoLabs 的软件设计思想也是我们参照的重点,其实我设计的 GooSeeker 也是类似的思路。http://www.gooseeker.com

  3. 招商部--官丽琴说道:

    楼主,这个软件从哪里可以下

发表评论