米OpenAIは9月20日(現地時間)に新たな文章から画像を生成するAI技術「DALL・E 3」を公開しました。
「ChatGPT Plus」や「ChatGPT Enterprise」のユーザーは、10月より「DALL・E 3」のサービスを利用することが可能となります。さらに、OpenAIは今秋中にAPIとラボ経由での提供も開始する計画です。
参考:OpenAI
OpenAI公式で公開されているDALL・E 3のプロンプトと生成した画像
引用:OpenAI
サムアルトマン氏の反応
DALL・E 3の概要
OpenAIの公式では、
最近のテキストから画像への変換システムは、単語や説明を無視する傾向があり、ユーザーに迅速なエンジニアリングの学習を強いています。DALL-E 3は、ユーザーが入力したテキストに忠実な画像を生成する能力を飛躍的に向上させました。
と説明されています。
下記のようにプロンプトから忠実に画像を生成をしてくれるようです。
引用:OpenAI
前バージョンである「DALL・E 2」(2022年4月発表)と比較すると、「DALL・E 3」は長文のプロンプトに対する理解が飛躍的に進化しています。
また、ユーザーはChatGPT上で「DALL・E 3」をネイティブに利用し、生成された画像を対話形式で編集することが可能です。
引用:OpenAI
画像の著作権やプライバシー保護に対する配慮
生成された画像の権利は全てユーザーに帰属し、OpenAIの許可を求めることなく、転載や販売、商品化が許可されています。ただし、著作権を考慮し、存命のアーティストのスタイルに基づく画像のリクエストは受け付けない方針を取っています。
OpenAIは、ユーザーや著名人のプライバシー保護のため、著名人の名前を用いたリクエストを拒否する安全策を導入しています。また、先日発表されたレッドチームとの連携を通じて、その安全性を更に高めていく予定です。
また、クリエイターは、自らの画像をOpenAIの画像生成モデルのトレーニングから除外するためのリクエストページを利用できます。
ChatGPT上で使える「画像生成AI」の登場
ChatGPT上で対話しながら画像を生成・修正できる「DALL・E 3」は、他の画像生成AIと比べて明確な利点があると言えます。
多くのユーザーがすでにChatGPTを活用していることを考えると、「DALL・E 3」は他の画像生成AIサービスよりも優れた選択肢として多くの人々に利用されることが予想されます。