AI駆動開発とエンタープライズChatGPTが企業にもたらす可能性 〜クリエーションラインの生成AIへの挑戦
2023年10月27日、クリエーションライン株式会社は「Actionable Insights Day 2023」を開催した。株式会社ヨドバシカメラによる特別講演に続き、2番目のセッションでは、クリエーションライン株式会社 取締役兼CTO 荒井 康宏氏による、生成AIの現状とAI駆動開発のデモ、実際の開発における活用事例についての紹介が行われた。本記事では、セッションの模様をレポートする。
⚫︎株式会社ヨドバシカメラの特別講演についてはコチラ
https://thinkit.co.jp/article/22594
生成AIへの高まる期待と市場の加熱
荒井氏はまず、AIを巡り加熱する市場動向について紹介した。米調査会社のMarket.USのレポートによれば、AI市場は2032年には2兆7450億ドルまで拡大、年平均成長率は36%に達すると試算されている。AI市場における最も大きな転換点となったのが、OpenAIによる2022年末のChatGPT-3.5のリリースだ。さらに、MicrosoftのOpenAIへの10億ドルにも上る投資を皮切りに、Amazonをはじめとする大手企業が、次々にAIへの大規模投資を行っている。その結果、生成AIへの投資額は2023年6月末の時点で前年の5.6倍にまで膨れ上がっている。米ベンチャーキャピタルのFirstmarkが発表した「MAD Landscape 2023」によればAI関連企業は1416社にも上り、巨大なエコシステムへと発展しつつあるという。
続いて、荒井氏は生成AIの基礎技術について改めて振り返った。ChatGPTを始めとする大規模言語モデル(LLM)は、2017年にGoogleが発表した「Transformer」という技術をベースにしている。これは並列処理を行うことで、従来のニューラルネットワークとは桁違いの大量のデータを学習し、回答精度の飛躍的な向上を実現した。理論上は、計算性能、データセットの大きさ、パラメータ数を向上させ続ければ、Transformerの性能も無限に向上する。一方で、LLMの課題として荒井氏が指摘したのは、生成AIが誤った情報や空想の情報を提示してしまう、幻覚症状(Hallucination)の抑制だ。そのためには、生成AIへの正確なデータの供給や、生成AIの用途を適切な範囲に限定することが必要だという。
AI駆動開発が可能にする爆速ソフトウェア開発
次に、荒井氏はクリエーションラインの生成AIへの取り組みについて紹介した。LLMは自然言語だけでなく、プログラミング言語をも理解し、コードを生成できる。LLMをソフトウェア開発の支援に応用するのが「AI駆動開発」で、AI駆動開発の代表的なツールとして最も有名なのがGitHub Copilotだ。その他にも、GPT Engineer、Cursor、AWS CodeWhispererなど、様々なツールが登場しつつある。
荒井氏は、コンソールで動くTODOアプリのPythonコードをAIで生成するデモを行った。ユーザーがプロンプトに仕様を入力すると、実際に実行可能なアプリケーションコードが自動生成され、問題なく動作した様子が紹介された。このような小規模なアプリケーションであれば、大抵はコード修正なしで動作する。また、エラーが発生した場合は、自然言語で修正指示をAIに与えれば、AIが適切にコードを修正してくれる。
続けて、荒井氏はAI駆動開発の事例として、クリエーションラインと顧客との共同開発における実証実験の結果を紹介した。GitHub Copilotを使用してPythonのバックエンドモジュールを開発したケースでは、3ヶ月間のプロジェクトで開発効率が1.5〜3倍に向上したと荒井氏は言う。特に効果的だったのは調査時間の短縮だ。実際の開発では、コーディングそのものよりも、事前の調査や検証に時間が掛かることが多い。そこでAIを活用したところ、従来4〜5時間掛かっていた調査が、数分で終わったケースもあるという。さらにバグ修正やリファクタリングといった工程でも、生成AIは有効性を発揮したという。
AI駆動開発は自然言語によるコード生成に留まらない。例えば、クラス図や手書きの設計図からのコード生成、ソースコードへのコメント生成なども可能だ。このように、AI駆動開発はコーディングだけでなく、アプリの企画や設計、実装、テストなど、アプリケーション開発の全サイクルを高速化させる可能性がある。荒井氏は「クリエーションラインは、AI駆動開発にいち早く取り組み、蓄積したノウハウを顧客との共同開発で実践することで、顧客の開発チームへとシェアしていきたい」と話す。
エンタープライズChatGPTの可能性
続いて、クリエーションラインの取り組みとして荒井氏が紹介したのが、企業内情報活用におけるLLMの応用だ。つまりChatGPTの便利さを企業内の情報共有や意思決定に生かす、いわばエンタープライズChatGPTを実現する技術に向けた取り組みだ。しかし独自のデータをLLMに追加学習させるためには品質の高い学習データを大量に用意せねばならず、莫大な計算量を費やす必要がある。そこで注目されているのが「RAG(Retrieval-Augmented Generation)」と呼ばれる技術だ。これは、外部の知識ベースから必要な情報を検索し、その情報をもとに回答を生成することで、追加学習なしに新しい知識に基づく回答を可能にする。
荒井氏はRAGのデモとして、本来ChatGPTが知るはずがない情報への問い合わせに回答させるデモを行った。質問は「クリエーションラインとGitLabの関係は?」だ。期待される答えは「クリエーションラインがGitLabのパートナー企業でありリセラーである」というものだ。まず通常のChatGPTに回答させたところ、ChatGPTはクリエーションラインについて学習していないため、正しく回答できなかった。次に、RAGにクリエーションライン技術ブログのデータを読み込ませ、API経由でChatGPTに回答させたところ正しく回答ができた。質問の意味を汲み取って回答するLLMの強みと、RAGにより正しいデータに基づいて回答することを両立することで、いわば「エンタープライズChatGPT」を実現できる。
エンタープライズChatGPTは、下図のアーキテクチャで実現されている。社内の情報をLlama Indexに読み込み、Embeddings APIでベクターデータ化することで類似性を取得する。この類似性に基づき、問い合わせがあった際には関連するナレッジをFaissで検索し、それをLLMに供給することで対話を生成する。このシステムはChatGPTだけでなく、ローカルで動作するLLMにも対応しており、企業内の情報をインターネットに出すことなく内部で完結させることも可能だ。エンタープライズChatGPTのユースケースとしては、ECサイトでの顧客体験向上、ベテランメンバーの知識・経験の共有、社内データを元にした意思決定支援などが想定される。「社内のメンバーに会話で相談するように、自然言語で社内ナレッジに基づく情報提供や提案を受けることができるようになる」と荒井氏は言う。
エンタープライズChatGPTを実現するには、LLMやRAGへの継続的なデータ供給のためのインフラ整備が重要となる。また、生成AIの課題である幻覚症状を抑えることも重要となる。多様なソリューションが登場する中で、企業のユースケースに最適なものを選択することが必要だと、荒井氏は言う。
AI・LLMの進化に対して我々は何をすべきか
荒井氏は、AIやLLMを一過性のブームとする考えに警鐘を鳴らす。AIには莫大な資金が投入され、市場は指数関数的な成長が見込まれる。またAIの精度は日々向上し、それに伴いユースケースも増えている。インターネットやクラウドがそうであったように、AIもやがて社会インフラの一部となると荒井氏は言う。
その前提に立つと、企業が競争力を高めるためにはトークン数の限界などの「今のAIにできること」に囚われず、将来AIが可能にするであろうことや、それに伴う社会の変化を考慮した全体戦略を策定することが必要になる。荒井氏は「クリエーションラインは、お客様の「Whyを追求」し、「実現したいこと」をどこよりも早く実現することを目指し、AI支援を通してお客様の事業価値最大化に貢献したい」と抱負を述べて講演を終えた。
連載バックナンバー
Think ITメルマガ会員登録受付中
全文検索エンジンによるおすすめ記事
- AI駆動型開発ツールに関する勉強会を取材。「まず使ってみることが大事」
- GPTで始まる大規模言語モデル時代
- 「ChatGPT Enterprise」と「Microsoft 365 Copilot」
- ヨドバシAPIのアーキテクチャが目指すものとは?〜APIエコノミー、ゼロトラスト、開発生産性向上への取り組み
- GitHub Universe 2023、MSのCEOもサプライズで登壇した初日のキーノートを紹介
- AIリスク管理プラットフォーム「Robust Intelligence platform」を提供する米Robust Intelligence Inc.共同創業者 大柴 行人氏インタビュー【後編】
- ファインチューニングの課題を解決する「RAG」と「エンべディング」
- CloudNativeSecurityCon開催。シアトルで2日間行われたセキュリティ特化のカンファレンスを紹介
- 現場の声から生まれた国産テスト自動化ツール「ATgo」が切り開く、生成AIを駆使した次世代テスト自動化の最前線
- 大規模言語モデルの概要