ビッグデータを並列処理するクラスタコンピューティングフレームワーク「Apache Spark 2.2.0」リリース

2017年7月15日(土)

Apache Software Foundationは7月11日(現地時間)、ビッグデータを並列処理するクラスタコンピューティングフレームワーク「Apache Spark 2.2.0」をリリースした。

「Apache Spark」は、カリフォルニア大学バークレー校のAMPLabで開発されたフレームワーク。インタラクティブなアルゴリズムとデータマイニングに適合するよう、MapReduceを拡張することを目標としている。独自のDAGエンジンを搭載しており、ビッグデータを高速で処理することができるという。

「Apache Spark 2.2.0」では、ストリーミングエンジンStructured Streamingが正式サポートされたほか、コアの安定性向上が図られている。その他ライブラリの充実化など、複数の強化が図られている。

「Apache Spark 2.2.0」は、Webサイトから無償で入手できる。

(川原 龍人/びぎねっと)

[関連リンク]
リリースノート

※本ニュース記事はびぎねっとITニュースから提供を受けて配信しています。
転載元はこちらをご覧ください。

Think ITメルマガ会員登録受付中

Think ITでは、技術情報が詰まったメールマガジン「Think IT Weekly」の配信サービスを提供しています。メルマガ会員登録を済ませれば、メルマガだけでなく、さまざまな限定特典を入手できるようになります。

Think ITメルマガ会員のサービス内容を見る