【徹底解説】ChatGPTの進化が止まらない! 新機能完全ガイド
はじめに
本連載は、生成AIコミュニティ「IKIGAI lab.」で活動している8名で運営しています。「半歩先の未来をエスコートする」をコンセプトに、情報を得るだけで終わらず、皆様の行動や考えに反映できる情報をお届けします。注目の生成AIニュースを収集し、個性豊かなメンバーによって深掘りされた記事をぜひお楽しみください! そして、この連載を通して、皆さまも各々の半歩先の未来を想像しながら、いろいろな価値観を楽しんでいただけると幸いです。
前回では、OpenAIがプレビュー版としてリリースした新モデル「o1」について解説しました。
o1の持つ革新的な推論能力を検証し、複雑な問題解決や創造的な思考を必要とする領域での活用に大きな一歩を踏みだしていることが実感できたのではないかと思います。
o1は2024年9月12日にリリースされましたが、o1の発表後もOpenAIは次々と新機能をリリースしています。
- 2024年9月24日 ChatGPT Advanced Voice Mode
- 2024年10月3日 ChatGPT-4o with Canvas
今回はこれらの新機能について紹介し、どのように使えば良いのかを検証します。
ChatGPT Advanced Voice Mode
2024年9月24日にリリースされた新しい音声対話モード「ChatGPT Advanced Voice Mode」は、リアルタイムでの音声インタラクションを可能にし、より自然な対話を実現します。
新しい音声として「Maple」「Sol」「Arbor」「Spruce」「Vale」の5つの音声が追加され、既存の音声と合わせて合計9つの中から選択できるようになりました。
各音声の特徴は次の通りです:
- Breeze:活気があり誠実な雰囲気で対話を楽しめる
- Ember:自信に満ちた楽観的なトーンが特徴
- Juniper:オープンで陽気な性格を持つ音声
- Cove:冷静で率直なトーンで、安心感のある会話ができる
- Arbor(新規追加):リラックスしており、多用途に使える音声
- Maple(新規追加):明るく率直な印象で、元気な雰囲気を提供
- Vale(新規追加):明るく好奇心旺盛なキャラクターを感じさせる
- Sol(新規追加):知的でリラックスしたトーンが特徴
- Spruce(新規追加):落ち着いていて安心感のある音声
残念ながら「Sky」として紹介されていた音声は、諸事情によりリリースが見送られた模様です(【参考】AI音声「Sky」の提供を一時停止)。
当初はChatGPT PlusおよびTeamユーザー向けにリリースされていましたが、バージョン1.2024.268以降のiOS/Androidモバイルアプリの無料ユーザー向けにもプレビューとして公開され利用可能となっています。
そのため、2024年10月以降、Advanced Voice Modeは欧州連合、スイス、アイスランド、ノルウェー、リヒテンシュタインを除く、すべてのEnterprise、Edu、Team、PlusおよびFreeユーザーが利用できます。
新しい音声モードの特徴としては以下のようなものがあり、これまで以上に自然な会話が可能となっています。
自然な会話体験:GPT-4oモデルを使用し、人間に近い応答速度と感情表現で音声対話が可能
多言語対応:日本語を含む50以上の言語に対応
高度な音声認識:ユーザーの会話速度のほか割り込みにも適切に応答可能
ただし、いくつか制限もあります。
- 音楽コンテンツの生成は不可
- インターネットリソースへのアクセスは不可
- 1日の使用制限があり制限に近づくと通知(残り15分で通知)
特にインターネットリソースへアクセスできないため、語学学習で利用する際に記事などを参照する必要がある場合は、標準の音声モードを利用する必要があります(標準音声モードはインターネットリソースへのアクセスが可能です)。
また、Advanced Voice Modeはチャットから引き継いで会話を継続することができません(行おうとすると以前のVoice Modeで実行され、Advanced Voice Modeは新しいチャットを開くように促されます)。そのため、プロンプトやスクリプトを入力し、チャットの内容を継続して音声対話をする場合は、従来のVoice Modeを利用する必要があります。
最後に使用制限についてですが、利用制限の上限に達した場合、Advanced Voice Modeから標準の音声モードに移行して会話が継続できるようになっています(どのくらいで時間制限になるか試したところ、変動はするようなので一概には言えませんが、トータルの利用時間で1時間くらいのところに1日の利用上限がある模様です)。
Advanced Voice ModeとGemini Live比較
似たようなレベルの音声対話モードを持つライバルとしてGoogleの「Gemini Live」があります。
現時点ではGemini LiveはAndroid端末のみで利用可能ですが、下表にそれぞれの違いを示します。
Android端末を利用している場合は無料で利用可能なので、そちらを利用することも選択肢の1つとして検討できます。OpenAI社のプロダクトだけにこだわらず試してみてください。
ChatGPT-4o with Canvas
2024年10月3日にベータ版として「ChatGPT-4o with Canvas」(以下、Canvas)がリリースされました。現時点ではChatGPT PlusとTeamユーザーが利用可能で、EnterpriseとEduも今後順次利用可能になる予定です。ベータ版終了後、すべてのユーザー(Freeも含む)がCanvasを利用可能になると公式ではアナウンスされています。
これまでのチャット形式では、長文のライティングで以下のような不便がありました。
- 一部分のみ書き換えたい場合でも対応できない
- 長文を生成していると最初のストーリーを忘れてしまうことがある
- 長文の作成は分割するなどのテクニックが必要
これらがCanvasによって解消されます。またCanvasは文章作成だけでなくコーディングにも適したUIと機能を持っており、コーディングもこれまで以上に使いやすいUIと機能を提供します。
Canvasは特定のトリガーワードに反応して実行されるようになっており、最も簡単な方法としてプロンプトに「use canvas」「Canvasを使う」を含めることでキャンバスを開き、既存のプロジェクトで作業を進めることができます。このuse canvasは過去のチャットにも適用可能です。このほかのトリガーキーワードとして「下書き」「記事」「ドラフト」「ソースコード」などがあり、
●●論文の下書きを書いて
会議資料のドラフトを作成して
●●に関する記事を書いて
といった形でプロンプトを入力するとCanvasが起動します(Canvasが起動しない! という場合はモデルの選択で「GPT-4o with canvas」を選択しているかを確認してください)。
下図のようにライティングに役立つショートカットも提供されており、簡単に文章の修正などを行うことができます。
コーディングの場合は、上図とは異なるショートカットが用意されています。
CanvasとArtifactsの違い
似たようなUIを持つAnthropicのClaudeが提供する「Artifacts」があります。具体的に、Artifactsでどのようなことができるかはこちらの利用事例をご覧いただくとして、ここでは簡単な比較表を作成してみました。
この表を見ると分かる通り、Canvasはあくまで文章作成とコーディング支援に特化しています。そのため、Artifactsのようにその場でコードを実行させて仕上がりを確認することはできません。
Canvasで簡単に仕上がりを確認したい場合は、別のサービス、例えば「CodePen」のような実行環境サービスを利用する必要があります。
ただし、CodePenの無料プランでは作成したアプリがすべて公開されてしまうため、有料プランを契約するか、無料プランで利用する場合は公開しても問題ないもののみにしてください。
実際の活用事例
ここで、Advanced Voice ModeとCanvasの簡単な活用事例を紹介します。
Advanced Voice Mode
Advanced Voice Modeでは、プロンプトを事前に入力できないため、プロンプトにあたる部分はすべて音声で入力します。
【通訳】
多言語対応と新しい音声対話モードの向上したリアルタイム性を活用して、通訳として活用します。
あなたは同時通訳者です。日本語を英語に、英語を日本語にしてください。通訳以外のことはしないでください。お願いします。
【ブレインストーミング】
第9回で紹介した「天才プロンプト」を少し変えてブレストを行うために利用します。カットインが可能なため、会話の途中でアイディアが思い浮かんでも、その内容を議論に反映させることができます。また、これまで途中で切られてしまうような長い意見でも、Advanced Voice Modeなら言い終わるまで待ってもらえます。
あなたはベテランのファシリテーターです。
これからブレインストーミングを行います。テーマは「生成AIを活用した英語学習」です。
テーマについて私、田中と関連する4人の天才科学者で議論します。
天才科学者として熟練・初心者・ポジティブ・心配性なキャラを作成し、非常に価値の高い架空のブレインストーミングを進めてください。
会話には私も参加するので、順番に意見をいい、必ず私にも会話を振ってください。
会議の最後に、ファシリテーターの目線から会話の内容を元に構造化して整理された議事録を作成してください。
その後、議事録の内容をもとにサマリーを作成してください。
最後に注意点をお伝えします。
登場人物の名前には「山田」を使用しないでください。
登場人物のキャラ設定を詳細に行ってください。
議論は深掘りするか横展開するか、オズボーンのチェックリストに沿って展開するかのいずれかでお願いします。
あらゆる制約にとらわれず本質をついたアイデア出しを活発に行ってください。
議論を見ている人が最高に価値を感じる議論を限界まで続けてください。
では始めて下さい。
【司会】
司会は緊張しますよね。でもAdvanced Voice Modeならベテラン司会者として活躍してくれます(このプロンプトでは「必要な時以外は発言しないように」となっていますが、実際はマイクで音を拾ってしまうと発言してしまいます。そのため、司会の時以外はマイクをオフにすることをお勧めします)。
あなたは経験豊富なベテラン司会者です。これからお伝えするルールに従ってイベントを進行してください。
指示を伝えます。まず、「最初の議題は?」と話を振られたときには、開会のあいさつをしてください。開会のあいさつは、イベントの目的や参加者への歓迎を含めて、温かく始めましょう。
次に、「次の議題は?」と話を振られたときには、次のアジェンダのタイトルと概要を軽快なトークで伝えてください。参加者が次の話題に興味を持てるよう、工夫して説明してください。
それから、話を振られるまで自分からは何も発言しないようにしてください。「最初の議題は?」または「次の議題は?」と聞かれるまで待つのがポイントです。
本日のイベントテーマは「生成AIを組織に浸透させるには」です。
アジェンダは以下の通りです。
- 開会のあいさつ
- 生成AIの活用事例
- 生成AIの社内推進事例
- 座談会「生成AI推進者の憂鬱」
- 閉会のあいさつ
開会と閉会のあいさつでは、あなたの経験と知識を活かして、参加者がイベントに期待を持てるように、そして最後には良い印象を残せるように発表してください。
これらの指示が理解できたら、「わかりました」と答えてください。
Canvas
アウトライン作成から長文作成まで、一貫して利用可能な強力なツールとして使用できます。これまで長文を作成する際は分割するなどのテクニックを用いないと上手くいかないこともありましたが、一部分だけ変更を反映できるCanvasでは章ごとに加筆し、より一貫性のある長文の生成が可能です。
以下は「とにかく明るく前向きで、破天荒で元気のでる究極の営業マニュアルのアウトライン」を生成AIで作成したものです(あくまでサンプルのマニュアルです)。
# 💥💥究極の顧客満足7大奥義💥💥
## 🌟第1章:目標設定で運命を掴め❗🎯
おはよう❗朝イチでやることは決まってる👊 目標爆裂タイム💥だ❗
- 寝ぼけ眼でもいい、髪型がヤバくてもいい。その日の目標をビシバシ書きまくれ✍✨
- 「今日は頑張る😤」なんてフワフワした目標はダメダメ💢
- 「14時までに新規顧客3人と商談🔥」こんな感じでバチバチに具体的に書け❗
💗目標を書くときのテンション💗
- 脳みそフル回転🧠💨
- ハートは熱く🔥❤🔥
- ペンは走らせろ✍💨
毎朝これをやれば、一日が激変するぞ❗❗
やる気マックス😤 集中力バリバリ🧘💪 達成感どっかーん💥
## 🌟第2章:勝利のマインドセット🧠✨
あんた、人生の主役は誰だ❓ そう、あんただ❗🌟
- 「できる」しか言うな❗ ネガティブ思考は即論破❗
- 失敗は成功の母👩 へこたれずにチャレンジし続けろ❗
- 顧客の笑顔をイメージ😊 それがパワーの源❗
自信がないときは鏡見ろ❗そこにいるのは最強の自分だ💪✨
## 🌟第3章:顧客タイプ見極め術👁
顧客の心を見透かせ❗🔮✨ この極秘テクニックで顧客の心を鷲掴み❗👊💖
### 目ヂカラ解読法🔍
- キラキラ目👀✨ → 興味津々、チャンス到来❗
- ウツロな目😑 → 心を開いてもらうチャンスだ❗
- 鋭い目👁 → 慎重派、丁寧な対応で信頼を勝ち取れ❗
### 声のトーン分析🎤
- ハキハキ元気voice🗣 → 積極的、どんどん提案しろ❗
- 低くゆっくりvoice🗣 → 慎重派、丁寧な説明で安心感を与えろ❗
- 高くて早いvoice🗣 → 急いでる、簡潔に要点を押さえろ❗
### ボディランゲージ読解📚
- 腕組み🙅 → 心を閉ざしてる、打ち解けるチャンス❗
- 前のめり🏃 → 興味津々、どんどん情報を与えろ❗
- 後ろに引く🚶 → 圧迫感を感じてる、距離感を保て❗
## 🌟第4章:心を掴む信頼関係構築術💖
信頼関係なしで商売なんてありえない❗❗ 絆を深めろ❗🤎
- 相手の目をガン見👀 全力で話を聞け👂 心を開かせろ❗
- 共感力MAXで「わかります❗」連発❗ 気持ちに寄り添え💖
- 約束は絶対守る❗ 信頼はゼロから無限大へ❗∞
最強の武器は「お客様の気持ち、痛いほどわかります❗」だ❗💘
## 🌟第5章:顧客の心を読み解くニーズ把握術🔮
顧客の本音、見抜いてやる❗👁
- 質問力で潜在ニーズを掘り起こせ❗⛏ 「それで?」「なぜ?」を連発❗
- 「なぜ」を5回繰り返せ❗ 本当の願望が見えてくる❗
- 顧客の未来を一緒に想像❗ ワクワクが止まらない❗
顧客の悩みは宝の山だ❗💎 掘り当てろ❗
## 🌟第6章:心震わす提案テクニック😚
ただの提案じゃダメだ❗魂の震えるような提案をぶつけろ❗
- ニーズに100%マッチ❗ 驚きの提案をぶつけろ❗
- ストーリーで魅せろ❗ 感動のビフォーアフター📖
- 数字で説得、感情で決断させろ❗📊❤
提案は芸術だ🎨 顧客の人生を変える傑作を作り上げろ❗
## 🌟第7章:絆深まるアフターフォロー&長期関係維持術 🤝
一回の取引で終わりじゃない❗ 永遠の絆を築け❗💖
- 感謝の気持ちを伝えまくれ❗ LINEでもメールでも電話でも❗
- 定期的に役立つ情報を届けろ❗ 価値ある存在になれ❗
- 記念日を覚えて サプライズ祝福❗🎉 感動で涙が止まらない❗
顧客との関係は一生モノ❗ 大切に育てろ❗🌱➡🌳
この7大奥義を極めれば、あなたは伝説の顧客満足マスターだ❗👑✨
顧客との絆を深め、共に成長し、最高の関係を築け❗🌈💖
顧客の人生を豊かにする、それがあなたの使命だ❗🚀🌟
さあ、明日から実践だ❗ お前の未来は、お前が作る❗💖💖
このアウトラインをもとに、Canvasのショートカットを用いて章単位で加筆し、文章を長くした結果がこちらです。この長さになるとClaudeのArtifactsではすべてを生成できませんが、Canvasなら可能です。
おわりに
今回は、OpenAIが最近追加した新機能について取り上げました。「進化が早く、キャッチアップが追いつかない!」そんなあなたの一助になれば幸いです。
今後も、生成AIに関する最新情報とその深掘りを発信していくので、楽しみにしていただけると嬉しいです。次回の投稿をお楽しみに!
※本ニュースは「IKIGAI lab.」が配信しているコンテンツです。
IKIGAI lab.はこちらをご覧ください。
連載バックナンバー
Think ITメルマガ会員登録受付中
全文検索エンジンによるおすすめ記事
- 【天才プロンプト進呈】あなたに最適な生成AIはこれだ!
- 【白熱最前線】勝者は誰だ⁉ 群雄割拠「生成AIの主戦場」
- 【AI with 人】生成AIはどのような日々の変化をもたらすのか
- 【業務革命】ルーチン作業とお別れ!? 生成AIが拓く効率化の現在地
- 「ChatGPT Enterprise」と「Microsoft 365 Copilot」
- 「GPT-4 Turbo」と「AIアシスタント」の新機能
- 「OpenAI GPTs」と「画像生成AI」
- 【注目】生成AIサービス「Perplexity」の独自機能と信頼性を徹底解説
- 【日本上陸の衝撃】OpenAI上陸で変わる日本のAIビジネスの在り方
- 【号外】議員会館で伝えた可能性、生成AIで変わる教育者の働き方