「GPT-4とGPT-3.5の違いが気になる…」「どちらを利用すべきか悩んでいる…」
そう思う方もいるのではないでしょうか。
今回PROMPTYでは、GPT-4とGPT-3.5の違い、それぞれの強みと活用方法について解説していきたいと思います。
GPTとは
GPTは、”Generative Pre-trained Transformer”の略で、コンピュータが自然言語(人間が使う言語)を理解し、生成するための技術です。GPTは、インターネット上の大量のテキストデータから学習し、人間のように文章を書いたり、質問に答えたりすることができます。
簡単に言うと、GPTは人間が使う言葉を学び、それを使って人間とコミュニケーションをするコンピュータプログラムです。
「ChatGPTは何の略?」「ChatGPTは何が凄い?」 このような疑問をお持ちの方は多いのではないでしょうか。 今回PROMTYでは、ChatGPTは何の略なのか、ChatGPTの凄さなどについて解説します。 Cha[…]
GPT-4とGPT-3.5の違い
①GPT-4は画像入力にも対応
マルチモーダル機能とは
GPT-4は、テキストに加えてビジュアル入力を行うことができるマルチモーダル機能を持っています。つまりGPT-4は言語モデルだけでなく、画像モデルとしても機能します。
GPT-4のマルチモーダル機能は、さまざまな分野で活用が期待されており、デザイナーや開発者は手描きのウェブサイトやアプリのスケッチからコード生成が試みられるかもしれません。医療分野では、症例の写真や画像をもとに診断のアシストが検討されることで、専門家の意思決定をサポートする可能性があります。
教育分野では、学習者が図解やイラストを入力して、理解しやすい解説や説明が提供されることが期待されます。また、広告業界やマーケティング分野では、実際の広告画像を入力して消費者の反応を予測し、効果的な戦略立案が試みられるかもしれません。これらの例は、GPT-4のマルチモーダル機能が、多様な分野で革新的な活用が検討されていることを示唆しています。
この機能は2024年4月29日現在ではまだ使うことができません。新機能がリリース次第すぐにPROMPTYで速報記事を公開するので要チェックです!
ラフスケッチからWebサイトの生成ができる
GPT-4のリリースイベントでは、OpenAIのエンジニアが「Discord」というコミュニケーションアプリ上の「サーバー」(グループチャットのようなもの)のスクリーンショットをGPT-4へ入力しました。その結果、GPT-4はオンライン状態のユーザー名など、画像内の細かな要素まで正確に解釈しました。
引用:Youtube – GPT-4 Developer Livestream
さらに、手書きのラフスケッチを撮影した写真を元に、ジョークを扱うウェブサイトの制作を指示すると、驚くべきことにGPT-4は、その画像に合致するウェブサイトを構築するためのコードを生成することができました。
画像を入力して質問することができる
上記画像はThe New York Timesで報じられたGPT-4のマルチモーダル機能を使用した質問とその回答です。「これで何種類の料理が作れるのか」という質問に対してGPT-4は複数の食事のアイデアを提示しています。
②出力の精度の向上
不正確な情報を答える「ハルシネーション」が軽減
GPT-3.5には欠点がいくつかあり、その一つとして不正確な情報を生み出して回答してしまう傾向があります。これは「ハルシネーション」と呼ばれる現象です。
完全なハルシネーションの克服はできていないものの、GPT-4ではハルシネーションが軽減されています。
米国統一司法試験でも上位10%を記録
引用:OpenAI
GPT-4は、出力信頼性の面でもGPT-3.5よりも進歩が見られます。米国統一司法試験の練習問題において、GPT-3.5は400点満点中213点しか獲得できなかったのに対して、GPT-4は上位10%に匹敵する298点を獲得しています。
さらに、不適切なコンテンツへのリクエストへの対応率は82%低下し、事実を元にした回答を提供する能力が40%向上しています。SEO記事としての価値も高まっていることがわかります。
苦手だった「漢字の読み」や「方言」などの日本語の精度も向上することが期待されています。
③安全性の向上
GPT-3.5と比べて、GPT-4安全性が向上していると言えます。GPT-4は危険な情報や禁止されている内容を提供しないように学習されています。
引用:OpenAI
GPT-3.5と比べて、GPT-4は禁止されている内容への対応が82%減少し、安全性が大幅に向上しました。さらに、GPT-4は、医療や自傷行為に関する問い合わせに対して、適切な対応をすることが29%増えています。
④言語能力の向上
引用:OpenAI
GPT-4はGPT-3.5と比較し、多言語対応能力が向上しています。
OpenAIによる検証によると、26の言語のうち日本語を含む24言語で、GPT-4はGPT-3.5の英語能力を上回ってると言えます。この検証では、多言語能力を評価するために、MMLUベンチマークがAzure Translateを利用して翻訳されています。
⑤「コンテキスト・ウィンドウ」の改善
「コンテキスト・ウィンドウ」とは、チャットセッション中にどれだけの情報をどの程度の期間、記憶として保持できるかを示す概念です。
GPT-4のコンテキスト・ウィンドウは、以前のモデルと比較して大幅に向上しています。その結果、会話の背景や指示を、より鮮明で長期的な記憶として保持できるようになりました。GPT-3.5と比べると、会話が展開される過程で主題が外れたり、指示に従わなくなる傾向が緩和されています。
⑥「コンテキスト・サイズ」の改善
「コンテキスト・サイズ」は、一度に処理できるテキストの量を表す指標です。GPT-4では、このコンテキスト・サイズが進化しています。
以前のGPT-3.5では、長い文章を要約する際には、テキストをいくつかの部分に分割して、それぞれを順次要約する必要がありました。
しかし、GPT-4のコンテキスト・サイズの拡大により、長い文章を一度に入力して、分割することなく要約することができるようになりました。
まとめ
今回はChatGPTのモデル「GPT-4」と「GPT-3.5」の違いについて説明してきました。GPT-4はGPT-3.5と比べて大きく性能が向上しています。
是非性能が格段に向上したGPT-4を仕事などに役立ててみてください。