ビッグデータを並列処理するクラスタコンピューティングフレームワーク「Apache Spark 2.2.0」リリース
2017年7月15日(土)
Apache Software Foundationは7月11日(現地時間)、ビッグデータを並列処理するクラスタコンピューティングフレームワーク「Apache Spark 2.2.0」をリリースした。
「Apache Spark」は、カリフォルニア大学バークレー校のAMPLabで開発されたフレームワーク。インタラクティブなアルゴリズムとデータマイニングに適合するよう、MapReduceを拡張することを目標としている。独自のDAGエンジンを搭載しており、ビッグデータを高速で処理することができるという。
「Apache Spark 2.2.0」では、ストリーミングエンジンStructured Streamingが正式サポートされたほか、コアの安定性向上が図られている。その他ライブラリの充実化など、複数の強化が図られている。
「Apache Spark 2.2.0」は、Webサイトから無償で入手できる。
(川原 龍人/びぎねっと)
[関連リンク]
リリースノート
その他のニュース
- 2024/11/22 「Rocky Linux 9.5」リリース
- 2024/11/21 Arch Linuxのメニューベースのインストーラ「archinstall 3.0」リリース
- 2024/11/21 「LibreOffice 24.8.3 Community」リリース
- 2024/11/21 Fortinet、悪意のあるMicrosoft Excelドキュメントを利用したフィッシングキャンペーンについて注意喚起を発表
- 2024/11/19 「AlmaLinux OS 9.5」リリース
Think ITメルマガ会員登録受付中
Think ITでは、技術情報が詰まったメールマガジン「Think IT Weekly」の配信サービスを提供しています。メルマガ会員登録を済ませれば、メルマガだけでなく、さまざまな限定特典を入手できるようになります。
全文検索エンジンによるおすすめ記事
- ビッグデータを並列処理するクラスタコンピューティングフレームワーク「Apache Spark 2.2.0」リリース
- ビッグデータを並列処理するクラスタコンピューティングフレームワーク「Apache Spark 2.0」リリース
- ビッグデータを並列処理するクラスタコンピューティングフレームワーク「Apache Spark 3.0.0」リリース
- Spark Streamingの概要と検証シナリオ
- 「Hadoop Summit 2015」基調講演レポート、米Databricksが「Spark」ベースのクラウド基盤をリリース、ほか
- コネクト、ビッグデータ活用を支援するデータ解析ソリューション「HARUNIRE」提供開始
- Spark 2.0を活用した配電設備の負荷集計システムの性能検証
- ポストHadoopの「Apache Spark」にブレークの兆し、好調「PostgreSQL」がOracle DBの牙城に迫る? ほか
- Baiduはテクノロジー企業として、Googleを超えられるか
- 先進ユーザーがリードするHadoop/Spark応用事例~Sparkで5倍の性能アップ~