PR

ビッグデータを並列処理するクラスタコンピューティングフレームワーク「Apache Spark 2.0」リリース

2016年7月31日(日)

Apache Software Foundationは7月26日(現地時間)、ビッグデータを並列処理するクラスタコンピューティングフレームワーク「Apache Spark 2.0」をリリースした。

「Apache Spark」は、カリフォルニア大学バークレー校のAMPLabで開発されたフレームワーク。インタラクティブなアルゴリズムとデータマイニングに適合するよう、MapReduceを拡張することを目標としている。独自のDAGエンジンを搭載しており、ビッグデータを高速で処理することができるという。

「Apache Spark 2.0」はメジャーアップデートリリースとなっており、SparkSessionなどの新しいAPIが加わっているほか、SQL2003のサポートほか、さまざまな新機能が加わっている。なお、「1.x」系列に対しては基本的に後方互換性があるが、一部で失われているので注意が必要。

「Apache Spark 2.0」は、Webサイトから無償で入手できる。

(川原 龍人/びぎねっと)

[関連リンク]
リリースノート

※本ニュース記事はびぎねっとITニュースから提供を受けて配信しています。
転載元はこちらをご覧ください。

Think IT会員サービス無料登録受付中

Think ITでは、より付加価値の高いコンテンツを会員サービスとして提供しています。会員登録を済ませてThink ITのWebサイトにログインすることでさまざまな限定特典を入手できるようになります。

Think IT会員サービスの概要とメリットをチェック