ハイプ・サイクルに登場する技術⑤ー新たに「ハイプ・サイクル2021」で発表されたAI技術

2021年10月26日(火)
梅田 弘之(うめだ ひろゆき)

はじめに

今回はハイプ・サイクル2021の技術を解説します。ハイプ・サイクルには、この先に花開くかもしれないトレンド技術が次々登場します。前年に掲載された技術の多くは消えていますが、それらを丁寧に追跡するものではありません。そのあたりを踏まえて技術動向を読み取っていきましょう。

ガートナーのハイプ・サイクル2021

2021年8月24日に、ガートナーより先進テクノロジのハイプ・サイクル2021が発表されました(図1)。この中からAIに関連するものは次の6つです。
  • 生成的AI(Generative AI)
  • AI拡張型設計(AI-Augmented Design)
  • AI拡張型ソフトウェアエンジニアリング(AI-Augmented SE)
  • 量子機械学習(Quantum ML)
  • AI主導のイノベーション(AI-Driven Innovation)
  • 物理学に基づくAI(Physics-Informed AI)

図1:先進テクノロジのハイプ・サイクル2021 (出典:ガートナージャパン)

これまでの技術との繋がりで見てみましょう。図2は過去5年のハイプ・サイクルからAI関連技術をピックアップしたものです。昨年に引き続いて掲載されているのは、生成的AIとAI拡張型設計、そして名称が変わったAI拡張型ソフトウェアエンジニアリングの3つ。新しく黎明期に登場したものが量子機械学習、AI主導のイノベーション、物理学に基づくAIの3つです。今回はこれらの技術を中心に解説しましょう。

図2:5年間のハイプ・サイクル(AI関連)

AI拡張型設計(AI-Augmented Design)

Augmentedは「増やす」「拡大する」という英語です。まずは、この聞き慣れない言葉の意味を説明しましょう。「AIは何の略ですか?」はい、これは誰でもわかる質問で、答えは「Artificial Intelligence」、日本語で人工知能ですね。ただ、AIの実態を知るにつけ、ちょっと違和感を覚える言葉でもあるのです。

Artificial Intelligenceは“人工で作った知能”ですから、人間と切り離されて単独で機能する知能というニュアンスが感じられます。しかし、実際は人間に寄り添い、人間の能力を拡大するお手伝いをする役割なので「同じAIでもAugmented Intelligenceと呼ぼう」。そんな考えで拡張知能という言葉が提唱されたのです(図3)。

図3:人工知能と拡張知能

その背景を知ると、AI拡張型設計(AI-Augmented Design)は「設計者の能力をAIにより拡張する」「設計作業をお手伝いするAI」という意味だとわかります。

ここで言う設計とは、ソフトウェアの設計だけではありません。自動車、スマホ、建築、エンジニアリングなど、さまざまな分野が対象となります。図4は一般的な設計作業のモデルです。エンジニアは、豊富な経験やノウハウ、知識を駆使して、法規や規格などに則りながら、CAD、CAE、CAMなどのツールを使いこなして設計作業を進めて行きます。円滑に進めるために膨大な資料、図面、Knowledgeなどがデータベース化されており、これらの情報を活用して効率よく設計作業を行います。

図4:エンジニアの設計作業

この設計作業をお手伝いするAIがAI拡張型設計です。お手伝いの方法はいろいろあります。膨大な知識の検索を支援するナレッジ&リサーチAIや設計レビューのコラボレーションを行うAI、論理および物理シミュレーションを支援するAI、熟練エンジニアの経験やノウハウを習得して一般エンジニアを支援するAIなど、さまざまな分野で研究・開発が行われています。

AI拡張型ソフトウェアエンジニアリング
(AI-Augmented SE)

AI-Augmented Software Engneeringは、2020年のハイプ・サイクルのAI拡張型開発(AI-Augmented Software Development)が名称変更したものです。こちらは対象を“ソフトウェア”に限定した開発、つまりプログラミングやテストを支援するAIということになります。代表的なものが自動プログラミング、すなわちAIを使ったコード生成です。ここではツールを3つ紹介しましょう。

OpenAI Codex

この分野で注目する技術に、人工知能を研究する非営利団体OpenAIが開発したGPT-3という文章生成言語モデルがあります。GPT-3は、簡単な指示を与えると、それをもとに自然な文章を作成してくれます。これがもっと進化して完成度が高くなれば、骨子やあらすじを示すだけでブログや記事、小説などをAIが書いてくれる時代が来る、そんなふうに期待されているのです。

これを応用して文章の代わりにソースコードを生成するようにしたものがOpenAI Codexです。2021年8月10日にβ版のAPIが提供開始され、OpenAIのホームページで簡単なデモ動画も見ることができます。宇宙船のデモはまだまだ稚拙ですが、何事も最初の一歩はこんなもの、どこまで進化できるか期待したいです。

GitHub copilot

GitHubがCodexを搭載して開発し、2021年6月に発表されたのがCopilot(副操縦士の意味)です。このサービスはGitHub上の数百万のオープンソースでトレーニングされていて、人間が書いたコメントやコードをもとに新しいコードを自動生成して提案するAIペアプロです。現在、MicrosoftのコードエディタVSCode(Visual Studio Code)のテクニカルプレビュー(β版)として公開されています。こちらもGitHub copilotのホームページで簡単なデモ動画を見ることができます。CodexはAIを使ったテスト支援もターゲットにしており、テストコード自動生成の機能も開発されています。

Microsoft Power Apps

実は、2020年9月にMicrosoftはGPT-3の独占ライセンスを取得しました。そして2021年5月にMicrosoftはGPT-3をPower Appsに統合し、ローコードプログラミング言語Power Fxを生成するサービスをプレビュー提供しています。

<<Note>>Power AppsとPower Fx

Microsoft Power Appsは、Microsoft 365(旧Office365)やDynamics365で利用できるアプリケーション作成ツール基盤です。プログラミングをしなくても簡単にビジネスアプリケーションを作成できるという最近のノーコード/ローコード開発の流れを汲んで2016年にリリースされています。

そしてPower Fxは、Microsoftが2021年3月に発表したローコード開発向けのプログラミング言語です。Excelベースで作られた言語なのでExcelと同じような操作で使えますし、Excelでコードを書いていた経験も活かせる上に、SQLでデータを操作したり行コメントを書いたりもできます。ここにGPT-3自然言語モデルを組み込んで、話し言葉でPower Fxのコードが生成されるようになるわけです。

なお、このPower AppsとPower BI(BIサービス)、Power Automate(RPAとワークフロー)の3つのサービスを合わせたものがMicrosoft Power Platformです。

量子機械学習(Quantum Machine Learning)

2019年にGoogleが“量子超越性の実証実験”で「スパコンでは1万年かかる計算をゲート式の量子コンピュータで200秒で実行できることを実証した」と発表して話題になりました。

この量子コンピュータの超高速計算能力を機械学習に取り入れたら、どんなことができるだろうと期待が高まりますね。例えばAIが期待されている分野の1つに創薬があります。創薬AIは基本的に“手当り次第に試して効き目のある組み合わせを発見する”ような処理なのですが、膨大な組み合わせを量子コンピュータで処理したら新型コロナの薬もできるかもしれません。

量子コンピュータは量子ビット(Qubit)を使っています。古典的なコンピュータのビットと違い、0と1だけでなくその重ね合わせやもつれ(entanglement)の状態も取れる特徴があります。また、量子コンピュータで指数関数的な高速計算を得るには、その特徴を活かした量子アルゴリズムが必要になります。しかしながら、現在発見されている実用的な量子アルゴリズムはまだ少なく、量子データもエラー耐性が無く重ね合わせ状態が崩れるなどの課題を抱えています。

そのため、現在は図5の組み合わせのうち③のハイブリッド型の研究が多く、量子畳み込みニューラルネットワーク(QCNN)、量子敵対的生成ネットワーク(QGAN)、量子サポートベクターマシーン(QSVM)、量子強化学習(QRL)などのモデルが次々と発表されています。

図5:量子コンピュータの組み合わせ

物理学に基づくAI(Physics-Informed AI)

ディープラーニングは基本的にブラックボックスです。子どもが犬を見て“わんわん”と指差したときに、親はこの子がどうして犬と判断したかわからないのと一緒です。そして子どもがとんでもないもの(例えばカラス)を見て“わんわん”と言ったとき、親は首を傾げて驚くしかありません。

ディープラーニングは統計をベースに判断する手法なので、学習されていないデータに対して非現実な結果を生成する可能性があります。また、膨大なデータで学習する必要があり、なぜそう推論したか説明できないという課題があります。

この課題を解消するのが「物理学に基づくAI」です。全くイチからトレーニングするのではなく、物理学でわかっている範囲を当てはめ、追加データのみで学習します。この方法なら物理学で制約するため非現実な間違いを回避でき、学習データも少なく済むのです。先程の例で言えば「耳が2つ立ったり寝たりしていて」「口が尖っていて」「足が前と後ろに2本ずつある」とキャップを当てはめれば、カラスをワンワンと呼ぶことはないのです。

IBMが煙が拡散するモデルの実験を行ったレポートでも、物理的な制約なしでニューラルネットワークをトレーニングした結果より、移流拡散法則という物理法則を課してトレーニングした方が精度が高くなったと報告されています。

生成的AI(Generative AI)

この数年、生成モデルが脚光を浴びていて、2019年と2020年に敵対的生成ネットワーク(GAN)、2020年と2021年に生成的AI(Generative AI)が黎明期にランクインしています。GANは画像や映像などを作る才能が豊かなAIの手法で、これを使ったDeepfakeが話題になっていますが、文章作成や作曲などさまざまな生成技術が進化する中で汎用的な生成的AIというキーワードに切り替わりました。

「生成」は「認識」の逆動作です。例えば図6の朝顔の写真を見て、ここから色が青、大きさが10cm、花びらの数が6枚などの特徴量を取り出し、n次元の潜在変数で表すのが認識モデルです。これを使えば、例えば1000枚の花の写真の中から「青い花」や「花びらが6枚」という条件で検索できるようになります。

一方、このような潜在変数をもとに朝顔の画像を作り出すのが生成モデルです。n次元の潜在変数とは、Zipファイルのようなものです。画像を圧縮してZipファイルにした場合、ZIpファイルさえあれば画像を復元できますね。それと同じです。

次元を少なくして考えてみましょう。例えば朝顔の代わりに赤い丸だとします。この場合の潜在変数は「色が赤(#F15B5B)」「形状が丸」「半径5cm」「線の太さは2ピクセル」という4次元でしょうか。そして、この4次元の変数さえ与えれば誰でも全く同じ赤丸を書くことができるわけです。

図6:生成モデル(Generative AI)

敵対的生成ネットワーク(GAN)

GANについても説明しておきましょう。GANは生成モデルのジェネレーター(生成器)と識別モデルのディスクリミネーター(識別器)が敵対しながら学習するモデルです。敵対という言葉になっていますが、私には生成器(ジェネ君)と識別器(ディス君)という兄弟が切磋琢磨しながら共に成長してゆくドラマに見えます。

図7がGANの基本構造です。ここで実物サンプルが先程の朝顔の画像だとしましょう。ジェネ君はせっせと朝顔に似せた画像を生成し、本物とランダムに切り替えてディス君に見せ、ディス君はそれが本物かどうかを判定します。偽物とバレた場合は誤差逆伝播によりジェネ君が調教され、間違えた場合はディス君が調教されます。最初のうちはふたりとも下手っぴいなのですが、どちらも上達するにつれジェネ君はかなり本物に近い画像を生成できるようになります。こうして贋作づくりの名人となったジェネ君を取り出して生成AIとして利用するのです。主役はジェネ君でディス君はそのトレーニングパートナーなのですが、面白いことにジェネ君は一度も本物の画像を見たことがなく、ただディス君を騙そうと必死にやっているうちに本物そっくりを作れるようになったのです。

図7:敵対的生成ネットワーク(GAN)

コンポジットAI(Composite AI)

最後に2020年の黎明期に登場したComposite AIを説明します。Compositeとは複合の意味で、最良の結果を達成するために複数のAI技術を組み合わせることです。一般にAI技術は、自然言語処理(NLP)、音声認識・合成、コンテキスト分析、ナレッジグラフ、感情分析、機械翻訳、画像認識、画像生成など数えきれないほどあって、それぞれが実用的になっています。そんな状況になったので、ある目的を果たすために複数のAI技術を組み合わせることが当たり前になりつつあり、それをコンポジットAIと名付けたわけです。

自動運転車で考えてみても、ざっと「車両位置特定技術」「検知・認識技術」「AI運転操作」「予測技術」「走行ルート計画」「運転手監視」「通信技術」など数多くの技術が必要です。これらがすべてAI技術というわけではありませんが、複数のAI技術が組み合わさるのが普通の時代となっているのです。

おわりに

ここまで、ハイプ・サイクルに登場したAI技術を中心に最近の動向を解説しました。第1部の技術解説編は今回で終了です。次回からは、第2部としてこれらの技術が現在どのように社会で実用化されているのかというビジネス編をお届けします。

著者
梅田 弘之(うめだ ひろゆき)
株式会社システムインテグレータ

東芝、SCSKを経て1995年に株式会社システムインテグレータを設立し、現在、代表取締役社長。2006年東証マザーズ、2014年東証第一部、2019年東証スタンダード上場。

前職で日本最初のERP「ProActive」を作った後に独立し、日本初のECパッケージ「SI Web Shopping」や開発支援ツール「SI Object Browser」を開発。日本初のWebベースのERP「GRANDIT」をコンソーシアム方式で開発し、統合型プロジェクト管理システム「SI Object Browser PM」など、独創的なアイデアの製品を次々とリリース。

主な著書に「Oracle8入門」シリーズや「SQL Server7.0徹底入門」、「実践SQL」などのRDBMS系、「グラス片手にデータベース設計入門」シリーズや「パッケージから学ぶ4大分野の業務知識」などの業務知識系、「実践!プロジェクト管理入門」シリーズ、「統合型プロジェクト管理のススメ」などのプロジェクト管理系、最近ではThink ITの連載をまとめた「これからのSIerの話をしよう」「エンジニアなら知っておきたいAIのキホン」「エンジニアなら知っておきたい システム設計とドキュメント」を刊行。

「日本のITの近代化」と「日本のITを世界に」の2つのテーマをライフワークに掲げている。

連載バックナンバー

Think ITメルマガ会員登録受付中

Think ITでは、技術情報が詰まったメールマガジン「Think IT Weekly」の配信サービスを提供しています。メルマガ会員登録を済ませれば、メルマガだけでなく、さまざまな限定特典を入手できるようになります。

Think ITメルマガ会員のサービス内容を見る

他にもこの記事が読まれています