【OpenAI vs Google】年末AI戦争から見た未来
はじめに
本連載は、生成AIコミュニティ「IKIGAI lab.」で活動している8名で運営しています。この記事を通して、ぜひ皆さまも各々の半歩先の未来を想像しながら、色々な価値観を楽しんでいただけると嬉しいです。
AI技術の急速な進化
2024年のAI業界では、マルチモーダルAIの台頭が顕著となっています。ガートナーの予測によると、2027年までに生成AIソリューションの40%がマルチモーダル化し、テキスト、画像、音声、動画など複数のタイプのデータを同時に処理できるようになるとされています。
そして2024年の年末に、生成AIのマルチモーダル化を象徴する発表がOpenAIとGoogleからありました。今回は、そんな両社の発表について紹介していきます!
OpenAIの「12 Days of OpenAI」
2024年12月5日から20日にかけて、OpenAIは「12 Days of OpenAI」と題した特別なイベントを開催し、革新的な機能を発表しました。
主要な発表内容
Day 1: o1 & ChatGPT Pro
新AIモデル「o1」のリリースと、月額200ドルの「ChatGPT Pro」プランの導入
Day 2: OpenAIの強化学習ファインチューニング研究プログラム
強化学習ファインチューニングの研究プログラムを拡大し、研究者や企業に参加を呼びかけ
Day 3: Sora
テキストから動画を生成するAIモデル「Sora」の提供開始
Day 4: Canvas
「Canvas」の機能強化により、執筆やコーディングをより効率化
Day 5: ChatGPT in Apple Intelligence
ChatGPTがAppleのインテリジェンス機能と統合され、ユーザー体験を向上
Day 6: Advanced voice with video & Santa mode
高度な音声機能とビデオ通話モード、さらに「サンタモード」を追加
Day 7: Projects in ChatGPT
ChatGPT内でプロジェクト管理が可能になる新機能「Projects」の導入
Day 8: Search
検索機能が強化され、無料ユーザーにも公開
Day 9: Holiday treats for developers
開発者向けに新たなツールやAPIの改善を発表
Day 10: 1-800-CHATGPT
新しいユーザーサポートホットライン「1-800-CHATGPT」の開始
Day 11: Work with apps
ChatGPTが他のアプリケーションと連携し、作業効率を向上
Day 12: o3 preview & call for safety researchers
新モデル「o3」のプレビューと、研究者向けの早期アクセス提供
12日間にわたる「12 Days of OpenAI」では、新モデルや機能強化、連携強化が次々と発表され、ChatGPTの機能が大きく前進しました。
Google「Gemini2.0」を発表
この記事では、Googleが新しいAIモデル「Gemini 2.0」を発表したことが主な内容です。Gemini 2.0は、昨年12月に発表されたGemini 1.0の次世代モデルであり、「エージェント時代」に向けて構築された、より強力なAIモデルです。
Gemini 2.0の特徴は、以下の点が挙げられます。
- ネイティブな画像および音声の出力、ツールの使用など、マルチモーダルな機能を備えている
- 周囲の状況をより深く理解し、ユーザーの指示のもとで行動を起こすことができる
- 開発者と一部のテスター向けにリリースされ、Google検索などの製品にも実装される
- 周囲の状況を理解し、先を見据えて行動し、ユーザーの指示に従ってタスクを実行できる、よりエージェント的なモデルを目指して開発された
- テキスト、画像、音声、コードなどの多様な情報を理解し、処理する能力が向上。また、画像や音声のネイティブ出力も可能に
- 複雑なトピックを調査し、ユーザーに代わってレポートを作成する「Deep Research」などの新機能が追加された
また、基本性能も大きく向上しました。
- コード生成能力が特に優れており、Natural2Codeベンチマークで92.9%を達成。前バージョンより大幅に向上
- 数学の問題解決能力も向上し、一般的な数学で89.7%、より難しいHiddenMathで63.0%を記録
- 画像理解(MMMU)でも70.7%に向上
さらに、Gemini 2.0は従来のモデルを超えて「エージェント的AI」として動作します。ユーザーの指示に基づき、複数ステップのタスクを理解・計画・実行できる能力を備えています。
そんなGemini 2.0を活用してエージェント的AIを実現するために、以下のプロジェクトが進行中です。
- Project Astra:
現実世界でマルチモーダル理解を実現する - Project Mariner:
複雑なタスクを支援するエージェント。Gemini 2.0で構築された初期の研究プロトタイプで、ブラウザを起点に人間とエージェントのインタラクションの可能性を探求する - Jules:
AIエージェントによる開発支援の可能性を探る取り組みとして、GitHubのワークフローに直接統合された実験的なAIコードエージェント
実際に「Deep Research」を使ってみました!
今回は、下記のプロンプトを使用しました。
このコンテンツは、調査を通して生成AIの動向のトレドを理解し、来年の社内DX戦略を決めることがゴールです。
あなたはプロのマーケターとして調査をしてください。
調査はステップバイステップで進めて、MECEで段階的な推論を繰り返し、情報を整理してまとめてください。
また、情報源は1次情報にこだわってください。
以上を踏まえて、調査を行ってください。
このプロンプトを入力した後、まずDeep Researchはリサーチ計画を考えてくれました。実際のリサーチ計画は下記の通りです。
リサーチ計画をまとめました。変更が必要な箇所があればお知らせください。
生成AI動向調査とDX戦略
ウェブサイトをリサーチ
了解しました。プロのマーケターとして、生成AIの動向を調査し、来年の社内DX戦略策定に役立つ情報をMECEかつ段階的な推論で整理してまとめます。一次情報にこだわり、ステップバイステップで調査を進めます。
**ステップ1:生成AI市場の全体像把握**
* **市場規模と成長率:**
* 信頼性の高い市場調査機関(例:IDC、ガートナー)のレポートから、生成AI市場の規模と今後の成長予測に関するデータを入手します。
* 生成AIに関連するキーワード(例:Generative AI、AI Content Generation)での市場規模調査レポートを探します。
* **主要プレーヤーと競争状況:**
* 生成AI分野の主要企業(例:OpenAI、Google、Microsoft)の動向を、企業ウェブサイトや公式発表資料から追跡します。
* 各社の製品・サービス、強み・弱み、市場シェアなどを分析します。
* 新規参入企業や注目すべきスタートアップに関する情報も収集します。
* **技術動向:**
* 最新の生成AI技術(例:大規模言語モデル、画像生成AI)に関する論文や技術ブログ記事を読みます。
* 主要な技術トレンドと今後の発展方向を予測します。
* 技術的な課題や倫理的な問題点についても考察します。
**ステップ2:生成AIのユースケース分析**
* **業界別ユースケース:**
* さまざまな業界(例:製造、金融、医療、小売)における生成AIの活用事例を、業界誌や専門サイトの記事、ケーススタディから収集します。
* 各業界における生成AIの導入状況、効果、課題などを分析します。
* **業務別ユースケース:**
* マーケティング、営業、カスタマーサポート、人事、研究開発など、さまざまな業務における生成AIの活用事例を収集します。
* 各業務における生成AIの導入効果、課題、具体的な活用方法などを分析します。
* **自社におけるユースケース:**
* 自社の業務プロセスや課題を分析し、生成AIを活用できる可能性のある領域を特定します。
* 具体的なユースケースを想定し、実現可能性と効果を評価します。
**ステップ3:生成AI導入における課題とリスク**
* **技術的な課題:**
* 生成AI技術の精度、信頼性、安全性に関する課題を、技術論文や専門家意見から分析します。
* 導入に必要な技術要件やインフラ整備についても検討します。
* **組織的な課題:**
* 生成AI導入に伴う組織体制、業務プロセスの変更、人材育成に関する課題を分析します。
* 従業員の意識改革やスキルアップのための施策を検討します。
* **倫理的な課題:**
* 生成AIの利用に伴う倫理的な問題点(例:プライバシー、バイアス、著作権)を、関連する論文や議論から考察します。
* 倫理的なリスクを最小限に抑えるためのガイドラインや対策を検討します。
**ステップ4:社内DX戦略への落とし込み**
* **現状分析:**
* 自社のDX推進状況、課題、目標を明確化します。
* 生成AI導入による効果を最大化するための前提条件を整理します。
* **戦略策定:**
* 生成AIを活用した具体的なDX戦略を策定します。
* 目標達成のためのKPIを設定し、進捗状況を測定できるようにします。
* **実行計画:**
* 生成AI導入のための具体的な計画を策定します。
* 必要なリソース(人材、予算、時間)を確保し、スケジュールを明確化します。
* **効果測定と改善:**
* 生成AI導入による効果を測定し、継続的な改善活動を行います。
* 必要に応じて戦略や実行計画を見直し、柔軟に対応します。
**情報源:** * 市場調査機関のレポート(例:IDC、ガートナー)
* 生成AI関連企業のウェブサイト、公式発表資料 * 学術論文、技術ブログ記事
* 業界誌、専門サイトの記事、ケーススタディ
* 政府機関、業界団体などの公開情報
**その他:**
* 調査の過程で得られた情報は、社内関係者と共有し、議論を深めます。
* 必要に応じて、専門家へのヒアリングや外部コンサルタントの活用も検討します。
上記のステップを踏まえ、MECEで段階的な推論を繰り返しながら、生成AIの動向を深く理解し、
来年の社内DX戦略を策定するための情報を整理してまとめます。
結果を分析
レポートを作成
数分で完了予定
生成AIがリサーチを開始すると、156件のWebサイトをリサーチしてくれました。
調査結果は、こちらのリンクからドキュメントを確認してください。
Deep Researchを使ってみた所感としては、プロンプトから調査計画を立ててくれるので、雑なプロンプトでも詳しい調査をしてくれる印象です。また、調査するサイト数も多く、Geminiのロングコンテキストを生かした検索になっていました!
AI技術の未来
2024年のAI業界は、OpenAIとGoogleの2大巨頭による技術革新と市場競争が激化し、AI技術のマルチモーダル化が加速した年となりました。こうしたAIのマルチモーダル化により、人間と同じように五感を取得していようとしています。近い将来には単なるツールから、人間のパートナーとしての役割をする「Agent」として、仕事や生活により溶け込んでいくと考えます。
そうなると「対人」だけでなく「対AI」とも上手にコミュニケーションをとる必要があります。そうした社会変化についていくためにも、今からAIに触れてみてはいかがでしょうか。
今後も、生成AIに関する最新情報とその深掘りを発信していくので、楽しみにしていただけると嬉しいです。次回の投稿をお楽しみに!
※本ニュースは「IKIGAI lab.」が配信しているコンテンツです。
IKIGAI lab.はこちらをご覧ください。