ビッグデータを並列処理するクラスタコンピューティングフレームワーク「Apache Spark 2.0」リリース
2016年7月31日(日)
Apache Software Foundationは7月26日(現地時間)、ビッグデータを並列処理するクラスタコンピューティングフレームワーク「Apache Spark 2.0」をリリースした。
「Apache Spark」は、カリフォルニア大学バークレー校のAMPLabで開発されたフレームワーク。インタラクティブなアルゴリズムとデータマイニングに適合するよう、MapReduceを拡張することを目標としている。独自のDAGエンジンを搭載しており、ビッグデータを高速で処理することができるという。
「Apache Spark 2.0」はメジャーアップデートリリースとなっており、SparkSessionなどの新しいAPIが加わっているほか、SQL2003のサポートほか、さまざまな新機能が加わっている。なお、「1.x」系列に対しては基本的に後方互換性があるが、一部で失われているので注意が必要。
「Apache Spark 2.0」は、Webサイトから無償で入手できる。
(川原 龍人/びぎねっと)
[関連リンク]
リリースノート
その他のニュース
- 2024/11/6 「curl 8.11.0」リリース
- 2024/11/6 Microsoft、システムツールセット「Microsoft PowerToys 0.86.0」リリース
- 2024/11/6 デスクトップ環境「LXQt 2.1.0」リリース
- 2024/11/4 Debianベースのデスクトップ向けLinuxディストリビューション「Nitrux 3.7.1」リリース
- 2024/11/4 「LibreOffice 24.2.7 Community」リリース
Think ITメルマガ会員登録受付中
Think ITでは、技術情報が詰まったメールマガジン「Think IT Weekly」の配信サービスを提供しています。メルマガ会員登録を済ませれば、メルマガだけでなく、さまざまな限定特典を入手できるようになります。
全文検索エンジンによるおすすめ記事
- ビッグデータを並列処理するクラスタコンピューティングフレームワーク「Apache Spark 3.0.0」リリース
- ビッグデータを並列処理するクラスタコンピューティングフレームワーク「Apache Spark 2.2.0」リリース
- ビッグデータを並列処理するクラスタコンピューティングフレームワーク「Apache Spark 2.2.0」リリース
- 「Hadoop Summit 2015」基調講演レポート、米Databricksが「Spark」ベースのクラウド基盤をリリース、ほか
- Spark 2.0を活用した配電設備の負荷集計システムの性能検証
- コネクト、ビッグデータ活用を支援するデータ解析ソリューション「HARUNIRE」提供開始
- Spark Streamingの概要と検証シナリオ
- ポストHadoopの「Apache Spark」にブレークの兆し、好調「PostgreSQL」がOracle DBの牙城に迫る? ほか
- Baiduはテクノロジー企業として、Googleを超えられるか
- 先進ユーザーがリードするHadoop/Spark応用事例~Sparkで5倍の性能アップ~