データ共有基盤JLDGとは

2009年1月7日(水)
建部 修見

ファイル共有について

 いまや職場における文書ファイルだけではなく、家庭におけるビデオサーバーなどファイルやコンテンツの共有は、日常的に行われるようになりました。まずはファイル共有の成り立ちや発展について簡単にみていきましょう。

 イエローケーブルと呼ばれる極太の同軸ケーブルによるローカルエリアネットワークの普及に伴い、ファイル共有が広く利用されるようになりました。

 当時、ワークステーション間におけるファイルの共有、アカウント情報の共有などを目的として、米サンマイクロシステムズがNFS(Network File System)とNIS(Network Information System)を開発しました。NFSは1985年に標準化され、現在でもよく利用されています(図1)。

 NFSは大変画期的なシステムでした。これにより、初めて複数のワークステーションでホームディレクトリの共有、インストールしたアプリケーションの共有が可能となったのです。今となっては当たり前のことですが、初めてこれができるようになったとき、その便利さにみな驚嘆したものです。

 ネットワークファイルシステムについては、その後、AFS(Andrew File System)、Coda File Systemなど次々と研究開発が行われました。Microsoft WindowsではSMBあるいはCIFSと呼ばれるプロトコルでファイル共有が行われるようになりました。

インターネット規模のファイル共有

 比較的最近では、インターネットとWebの発達に伴い、インターネット規模のファイル共有も行われるようになりました。インターネット規模でのファイル共有では、ファイルアクセスのためのプロトコルの標準化がかかせませんが、HTTPとWebブラウザの出現により、その準備が整いました。

 当初は、情報発信がおもな利用用途でしたが、wikiやblogなどの新しいサービスも出現し、コミュニケーションの場として発達を続けているのはみなさまもご存じの通りです。

 また別の発展としてP2Pファイル共有があります。P2Pファイル共有では、これまでのサーバー/クライアント型の通信だけではなく、クライアント側もサーバーとして利用されるところに特徴があります。

 P2Pファイル共有はNapsterとGnutellaによりはじまりました。いずれも、共有するデータ自身はクライアント(ピア)側で分散して保持します。NFSの様に中央サーバーでデータを保持しないため、そこがボトルネックとなることはありません。

 両者は、どのピアがどのようなデータを保持しているかの管理方式が異なります。Napsterは集中管理方式と呼ばれ、中央サーバーがすべての情報を管理します。一方、Gnutellaは中央サーバーを持たない完全分散型です。それぞれのピアに対し、リクエストをマルチキャストすることによりデータを収集します。その後、より組織的に管理可能なDHT(Distributed Hash Table、分散ハッシュ表)によるさまざまなシステムも登場しました。

 P2Pファイル共有により広範囲の人々の間でのファイル共有が可能となりましたが、一方で、現在多くの組織や機関で利用が禁止されています。アクセス制御などを行うことできず、不法なデータ交換、ウイルスやワームなどの配布への対策が行われなかったのが大きな原因です。

 このように、ファイル共有は、利用用途、利用規模、利用データサイズなどによりさまざまな研究開発、システム開発が行われてきました。

筑波大学
東京大学理学部情報科学科を卒業後、同大学大学院で博士(理学)を取得。電子技術総合研究所を経て、現在は筑波大学准教授。超高速計算システム、グリッドコンピューティング、並列分散システムソフトウエアの研究に従事。Gfarm広域ファイルシステムの開発を主導している。http://sourceforge.net/projects/gfarm/

Think ITメルマガ会員登録受付中

Think ITでは、技術情報が詰まったメールマガジン「Think IT Weekly」の配信サービスを提供しています。メルマガ会員登録を済ませれば、メルマガだけでなく、さまざまな限定特典を入手できるようになります。

Think ITメルマガ会員のサービス内容を見る

他にもこの記事が読まれています