連載 :
  

統計解析向けのプログラミング言語「R言語」の魅力と汎用言語との違い

2014年3月13日(木)
山崎 明子

横垣:統計解析の対象となるデータには様々な様式があります。R言語では、オブジェクトという単位でデータを扱います。オブジェクトには、ベクトル、行列、配列、データフレーム、リストなどの豊富な種類があり、解析データの様式としてのニーズに応えることができます。ただし、このようなデータ形式は、一般のプログラミング言語では、あまり見られない特殊なものなので、最初はその扱いに戸惑われるかもしれません。しかしながら、R言語は統計解析言語ですので、このデータの持ち方と扱い方が肝ですので、ぜひ習得してほしいところでもあります。

私がR言語を習得した時の印象としてはアソシエーション分析が簡単にできることが衝撃的でした。アソシエーション分析とは、コンビニエンスストアや百貨店や店舗などで集めている顧客ごとの購買商品データを活用して、購買された商品の関連性について分析する手法です。例えば、雨の日に購買された商品Aを購入した顧客は商品Bを同時に購入される割合が何%であるといったような感じで、分析することを指しています。コンビニエンスストアや百貨店では、如何に店舗を有効に活用するかがとても重要であり、どの商品をどういうときに、どこに陳列するかなどを分析していく必要があります。R言語の独自性(クセ)を理解し、関数を知ることができると、このアソシエーション分析も簡単な関数で行うことができるようになるのです。

R言語を習得すると、このような分析も試行錯誤しながら進めていくことができるようになるのです。統計学をかじったことがある人でしたらどなたでも分かりますが、数値をどのように分析するか、どのように導き出すかは、分析者のセンスにもよりますし、ベストプラクティスに至るまでかなりの試行錯誤を繰り返すはずです。まさにR言語はそのような試行錯誤に適した専用言語なのです。

山崎:ありがとうございました。NECラーニングはR言語のトレーニングコース(詳細は文末の関連リンクをご覧ください)を4月から始めるのですが、そのコースで学んでほしいことと拘りについて両名物講師の方にお聞きします。これからR言語を学ぼうとされている方はご参考ください。

米倉:R言語の独自性(クセ)のところで述べたように、R言語がサポートするデータを、如何に扱い使いこなせるかが、この言語を学ぶ上での肝になります。コースでは各データ様式の特徴、定義の方法、処理の仕方を取り上げていきます。本コースでは、統計解析を扱う部分は、さわり程度です。R言語の特徴のところで述べたように、関数を呼び出すだけで、ことが足りるためです。そのため、関数が求めるデータを整備する方法について、中心的に扱いたいと考えています。R言語は、すぐに始めることができる手軽さでありながら、学びがいのある奥深さを備えたプログラミング言語です。本コースを通じて、R言語の良さを少しでも伝えることができたらと思います。

横垣:R言語では、高度な分析を簡単に実行できるのが魅力ですが、高度な分析を行う前には、基礎的なデータ処理が不可欠です。今後、R言語で様々な分析を実行するために、ぜひ本コースで、R言語の基礎を学んでいただきたいと思います。本コースでは、R言語の基礎を習得すると同時に、R言語の楽しさや魅力を感じていただき、R言語のファンになっていただきたいと思います。R言語を使用すれば、今まで専門家しか行えなかった分析が誰でも実行できるようになります!ビッグデータの時代になり、分析するデータはいくらでもあります。ぜひR言語で様々なデータを分析し、新しい知見をどんどん導き出していただきたいと思います。

山崎:ありがとうございました。R言語は独自性(クセ)があるため、独学で進めるよりもトレーニングを受けられた方が効率的だと思います。ご興味がある方は以下の関連リンクの弊社コース情報をご覧ください。

【参考リンク】

(リンク先最終アクセス:2014.03)

OSS / R / 解析
NECラーニング株式会社 テクノロジー研修事業部

Think ITメルマガ会員登録受付中

Think ITでは、技術情報が詰まったメールマガジン「Think IT Weekly」の配信サービスを提供しています。メルマガ会員登録を済ませれば、メルマガだけでなく、さまざまな限定特典を入手できるようになります。

Think ITメルマガ会員のサービス内容を見る

他にもこの記事が読まれています