はじめに
前回まで、MySQLのGIS機能の概要や地理情報データ型の種類、そして距離の計算といった、地理情報を扱うための基礎的な情報を紹介してきました。架空のデータを自前で作成してきましたが、オープンデータを活用すると、GIS機能で試せることの幅が大きく拡がります。
今回からは、そういったオープンデータをMySQLに取り込むために必要な知識について紹介していきます。今回は、手始めにオープンデータを公開しているサイトと、オープンデータのファイルフォーマットについて解説します。
今回はMySQLを操作しない回となりますが、今後さまざまなデータを触っていこうとする際の基礎知識となります。具体的なデータを扱うようになると、学習も楽しくなりますよ。
地理情報のオープンデータはどこにある?
地理情報に関するオープンデータは、国や自治体を中心とした様々な団体によって公開されています。ここでは、その中からよく知られているものをいくつか紹介します。
国土数値情報
国土交通省が整備・公開する地理情報データの総合サイトが「国土数値情報ダウンロードサイト」です。地形、土地利用、公共施設、交通、都市計画などの国土に関する基礎的なGISデータを公開しています。
よく使われるデータとしては以下のようなものが挙げられます。
・行政区域データ
都道府県や市区町村などの境界を示すPOLYGONデータ。自治体ごとにそのエリアに含まれる点(POINT)データを抽出したり、集計したりするのによく使われる、地理情報における「基本中の基本」のデータです。
・鉄道データ
路線(LINESTRING)や駅(POINT)のデータ。実際のサービスにおいては「最寄り駅を探す」「線路から一定距離内の施設を探す」といった用途に使われます。
・道路
高速道路や重要物流道路といった情報がLINESTRINGデータとして公開されています。国道や県道といった一般道の情報もほしいところですが、1995年時点の情報が「旧統一フォーマット」のエリアに公開されているのみで、最新情報が存在しないのが惜しいところです。
・学校/公共施設/医療機関
小中高校の場所や市町村役場、公的集会施設や医療機関などの情報がPOINTデータで公開されています。これも、最寄り検索や距離の算出などに活用できるでしょう。
・災害リスク情報
洪水浸水想定区域がメッシュデータとして、土砂災害警戒区域情報がPOLYGONで提供されています。その他、地滑り防止区域、津波浸水想定、災害危険区域などの災害関連情報がPOLYGONで公開されており、こちら方面の分析や表示などに活用が見込まれます。
・その他
これ以外にも、国有林野などの土地利用分野、地価公示、歴史的風致維持向上計画の重点地区など様々なデータが公開されています。
ぜひ、サイトを訪れて、どのようなデータがあるのかを自分の目で確認してみてください。
e-Stat(政府統計の総合窓口)
総務省統計局が運営する、政府統計ポータルサイトです。国勢調査の結果や各種統計データが公開されています。POINTデータやPOLYGONデータといった地理情報そのものではなく、各行政区域ごとの統計データを中心として公開しています。
統計データの根拠となる境界データも公開されており、小地域(町丁・字等別)レベルのポリゴンデータが提供されているのが特徴です。
基盤地図情報(国土地理院)
国土地理院が提供する、地図の基礎となる情報です。海岸線・道路縁・建物外周など、精度の高いデータが公開されています。使用に当たっては測量法に基づく申請が必要となるため、自由に使えるというわけではなく、他のデータと比べて少々採用しにくい面もあります。
OpenStreetMap
世界規模のオープンな地図として知られる「OpenStreetMap」(OSM)はブラウザ上で地図を閲覧するだけでなく、データをエクスポートしたりGeofabrikでダウンロードしたりして活用できます。データはODbL(Open Database License)というライセンスで公開されており、派生データを公開する際は同じライセンスで公開する必要があります(コピーレフト)。
地理情報データの権利関係
これらのデータを利用する際に知っておく必要があるのが「データの権利関係」です。例えば、基盤地図情報については、前述したように使用に当たって申請が必要となるなど非常に厳しい制約があります。
国土数値情報サイトの場合も、全体として利用しやすいデータ公開への方向性は持っているものの、まだまだ「非商用」(=商用不可)のデータも多くあります。このサイトに関しては、各データに「非商用」「商用可」「CC_BY_4.0」のラベルが付けられており、利用条件が分かりやすくなっています。
その他のサイトでも大抵は利用のための条件が明記されており、それに従う必要があります。多くの場合、少なくとも出典の明記は必要となります。
「公開されているのだから、自由に使って良いのだ」というわけではないので、使用する際には必ず公開元の利用条件を確認し、従うようにしましょう。
ファイルフォーマットの種類
これらのサイトで公開されている地理情報データには、さまざまなファイルフォーマットがあります。いくつかのファイルフォーマットについての詳細は次回以降で解説していく予定なので、ここでは概要を紹介します。
Shapefile(シェープファイル)
地理情報の分野で長年にわたり事実上の標準として使われてきたフォーマットです。ひとまとまりのデータを表すために *.shp, *.dbf, *.shx といった複数のファイルを使用します。
この複数のファイルに分かれている仕様や、属性名の文字数制限が厳しいなどの制約から、近年は「Shapefile以外のフォーマットでデータを公開しよう」という動きが強まっています。
GeoJSON(ジオジェーソン)
JSON形式でジオメトリと属性を1つのファイルに収めたフォーマットです。人間が可読できることが特徴です。JSON形式で表現されるため、プレーンテキストの状態ではファイルサイズが他のフォーマットと比べて大きくなりがちです。
GML(JPGIS)
XMLベースのフォーマットです。国土数値情報ダウンロードサイトでは多くのデータがこのフォーマットで公開されています。
まとめ
今回は、オープンデータとして公開されているさまざまな地理情報とその権利関係、さらにファイル形式について紹介しました。
次回以降は、この中からいくつかのデータをピックアップして、MySQLへの登録方法を解説していきます。お楽しみに!
2026年4月に、MySQL 9.7.0 LTS がリリースされました。LTS (Long Term Support)とは、最大8年間のパッチ更新が約束されているバージョンシリーズで、今後 9.7.1、9.7.2…のようにバージョンが上がっていきます。MySQL 8.0 シリーズの時のような「マイナーバージョンアップなのに機能が追加されたり互換性が失われている」ということがなく、本番環境でマイナーバージョンアップを続けながら使いやすいバージョンとされています。
MySQL 9.7シリーズでは、開発元であるOracle社MySQL開発チームの方針変更により、いままでは MySQL Enterprise(=商用版)でのみ使用可能だった機能のいくつかが Community版にも開放されました。性能の向上やレプリケーション機能の強化、可観測性を高める機能やJSONデータの取り扱いの充実など、「4つの主要技術エリアで8つの注目すべき新機能(Across 4 major technical areas, this release delivers 8 notable new Community Edition capabilities)」*1が搭載されました。
ずっとCommunity版を使ってきたユーザにとっては、たくさんの機能が突然やってきたようでワクワクしますね。
本連載では、執筆環境整備の関係でしばらくMySQL 9.6 (Innovation Release) を使い続けますが、近いうちに MySQL 9.7へと更新したいと思います。連載で取り上げているSpatial機能(空間情報機能/GIS機能)については変更がないので、どちらのバージョンでも同様に動作します。
