ソフト開発
企業IT
製品導入

Think IT（シンクイット）

Think IT（シンクイット）

人気記事ランキング
Kaggleは「キャリアの再定義」に役立つー文系営業がKaggler会で得た、挑戦の連鎖と新しい自分
7月24日 6:30

「PyTorch 2.13」リリース ─ FlexAttentionのApple Silicon対応など
7月11日 12:42

「deepin 25.2.0」リリース ─ Debianベースのデスクトップ向けディストリビューション
7月9日 0:51
人気記事をもっと見る
人気コーナーランキング
Kaggleは「○○」に役立つ
最新記事： 2026年07月24日

Windowsユーザーのための WSL2で始める Linux環境構築術
最新記事： 2026年05月14日

イベント・セミナー2026
最新記事： 2026年07月27日
人気コーナーをもっと見る
カテゴリ
ITインフラ
サーバー
ネットワーク
ストレージ
クラウド
仮想化／コンテナ
IoT／組み込み
システム開発
OS
ミドルウェア
データベース
設計／手法／テスト
開発言語
開発ツール
Web開発
業務アプリ
クラウド（SaaS）
データ解析
モバイル
CRM／ERP
OSS
VR／AR
AI・人工知能
運用・管理
プロジェクト管理
システム運用
BCP／DR
運用監視
セキュリティ
働き方
資格・試験
キャリア・人材
フリーランス／起業
ライフハック
教育
制度・法律
種別
ニュース
技術解説
書籍・書評
インタビュー
イベント
コラム
TechAcademy
ReadWrite
タイプ
- 記事
- ニュース
連載
脆弱性診断の現場から
最新記事： 2026年07月29日

KubeCon＋CloudNativeCon Europe 2026レポート
最新記事： 2026年07月29日

オープンソースDB運用管理Tips
最新記事： 2026年07月28日

編集部が読み解く! 3行でわかるテックニュース
最新記事： 2026年07月23日

イベント・セミナー2026
最新記事： 2026年07月27日

週刊VRウォッチ
最新記事： 2026年07月27日
連載をもっと見る
特集
【レガシーモダナイゼーション新潮流】AIが変えるモダンアーキテクチャへの移行

テスト自動化ガイド 2024

生成AI完全ガイド 2024

IT運用管理ガイド 2023

DevOps完全ガイド 2023

クラウドデータベース完全ガイド 2023
特集をもっと見る

よく検索されるワード

大規模化するDWHに挑む第3回

大規模化するDWHのチューニング

はじめに前回は、DWHの性能を高める方策として、DWHアプライアンスやカラムストアDBなど、製品面での工夫について解説しました。今回は、SEの視点に立ったチューニング・ポイントを中心に解説します。具体的には、数百T～P（ペタ）バイトの大規模DWHを想定し、インデックスに代表される一般的なOLTP系の

TIS株式会社サービス&コミュニケーション事業部ソリューションチーム

2010年3月18日 20:00

目次

はじめに

前回は、DWHの性能を高める方策として、DWHアプライアンスやカラムストアDBなど、製品面での工夫について解説しました。今回は、SEの視点に立ったチューニング・ポイントを中心に解説します。具体的には、数百T～P（ペタ）バイトの大規模DWHを想定し、インデックスに代表される一般的なOLTP系のチューニング手法とは異なるノウハウを解説します。

昨今、特にDWHアプライアンスなどの製品では「チューニング不要」といったセールス・トークが見受けられます。ですが、これはあくまでもハードウエア性能に頼った対策であり、膨大な投資コストとのトレード・オフに過ぎません。

また、レコード数が数兆件に及ぶ数百T～P（ペタ）バイトのデータを扱う大規模DWHの場合、現実的な投資コストを考えると、ハードウエア性能や製品性能に頼る対策だけでは限界があります。

実際には、カラムストアやパーティショニング、サマリー・テーブルなどによってクエリーにかかるコストを削減する、いわゆる細かいチューニング手法の組み合わせが必要になります。今回はあくまでも筆者の経験の範囲内ですが、日ごろ利用しているチューニング手法の代表例として、いくつかを紹介します。

1.カラムストア

カラムストアについては前回も触れましたが、チューニングの観点では非常に有用なので、今回も引き続いて解説します。

カラムストアは、テーブルを行単位ではなく列単位で格納する機能です。走査（スキャン）するデータの範囲をSQLで指定した列に限定できるため、検索処理が早くなります。

カラムストアの具体的な動作は、図1の通りです。

受発注履歴テーブル（1億レコード）の合計金額を求めたい場合、通常の行ストア方式のケースではレコード・サイズ200バイト×1億レコード＝合計約18Gバイトの走査量が発生してしまいます。

一方、カラムストア方式であれば、購入金額のみの走査となるため、レコード・サイズ8バイト×1億レコード＝合計約0.7Gバイト、つまり通常の行ストア方式と比べて約25分の1の走査量で済みます。

このように、特定カラムのフルスキャンを行う場合、カラムストアは非常に有効なチューニング手段となります。

ただし、カラムストアは万能というわけではありません。走査対象の列サイズが増えるごとに、比例して検索実行時間が増加してしまいます。

あくまでも筆者の検証経験からの推察となりますが、全体の列サイズの5割程度を超えると、カラムストア型の方が遅くなる傾向にあるようです。よって、用途に応じた使い分けが必要です。

アプリケーションのクエリー特性を踏まえて、どちらの方式を選択すべきかを判断し、場合によっては行ストア、カラムストア両方の形式で格納するなど、使い分けることが必要です。

次ページからは、SE視点での、そのほかのチューニング方法を解説します。

この記事のキーワード：

この記事をシェアしてください

人気記事トップ10

人気記事ランキングをもっと見る

新着記事

その「ソーシャルログイン」は大丈夫? OAuth/OIDC実装の3つの落とし穴 6:30 KubeCon Europe 2026、新興のオブザーバビリティ企業Hygroundの製品責任者にインタビュー。生成AIの使用を前提にした新世代オブザーバビリティとは 6:00 障害発生時でも継続運用を実現する「MySQL」と「PostgreSQL」の「高可用性構成」を理解する 7月28日 6:30 KVMベースの国産仮想化基盤「Prossione Virtualization」——ライセンス高騰と属人化運用、2つの課題を同時に解決 7月28日 6:20 「DrupalCamp Tokyo 2026」参加レポートーAI時代に進化するCMS「Drupal」は次のフェーズへ！ 7月27日 6:20

企画広告も役立つ情報バッチリ！ Sponsored

機能安全開発におけるGoogleTestの活用を支援!「Parasoft C/C++test CT」で実現する効率化＆AI連携 4月14日 6:30 【CNDW2025】Grafanaが明かす「オブザーバビリティの哲学」ー最小限の労力で実用的なインサイトを得るには 1月23日 6:30 【CNDW2025】プロダクト急増に備える基盤刷新ーウェルスナビがECSからEKSへの移行で得た知見とは 1月15日 6:30 【CNDW2025】250環境を5人で運用、構築時間は30分にーKINTOテクノロジーズが語るインフラ基盤組織の作り方 2025年12月18日 6:30 新たな自動化で熱視線！ AIエージェントの「推論能力」を支える2つのコンポーネントとは？ 2025年11月28日 6:30 IoTに生成AIを掛け合わせる「AI-driven IoT」で現場のIoTデータ活用を加速 2025年11月26日 6:30 アイレット、KDDIの属人化問題を生成AIアシスタントの精度を高め解消へ 2025年11月21日 6:30 「Grafana Cloud」の先進的ユーザーであるグリーが10年をかけて到達した「オブザーバービリティ」とは 2025年5月15日 6:30 Grafana Labs CTOのTom Wilkie氏インタビュー。スクラップアンドビルドから産まれた「トラブルシューティングの民主化」とは 2025年4月21日 6:30 API管理をより簡単にする「Kong Konnect」が解決する課題とその主要機能 2025年3月5日 5:30

Tweets by thinkitcojp