Microsoft の CoDi AI は文字通りすべてを行ってくれます。

CoDi は Microsoft の最新の AI モデルです。

フラビウス・フォーラー

フラビウス・フォーラー

Flavius は、テクノロジー、ゲーム、メディア、映画、ストーリーテリングに特別な関心を持つライター兼メディア コンテンツ プロデューサーです。 彼は自然の中で時間を過ごすことを楽しんでいます。 続きを読む

いつ更新されましたか

  • CoDi は、テキスト、オーディオ、ビデオ、および画像の入力を受け取り、それらをコンテンツに変換します。
  • この AI モデルは、障害のある人々にとって特に役立ちます。
  • CoDi は、AI を使用して人間とコンピューターのインタラクションを改善するプロジェクトです。

マイクロソフトコード

Microsoft はまさに AI の最前線にいます。レドモンドに拠点を置くテクノロジー巨人は、現在 Insider Program で入手可能な Windows 11 Copilot を含む、あらゆるソフトウェアに AI を統合しています。言うまでもなく、Microsoft Teams は AI を提供するために AI を使用しています。これは Microsoft Store にも導入されました。

ただこれが全てではありません。 ご存知のとおり、Microsoft は AI 研究に多額の資金を投資しており、LongMem、phi-1、Kosmos-2、Orca 13B は、AI の存続に影響を与える AI モデルのほんの一部です。

そして現在、マイクロソフトは別の AI モデルに取り組んでいます。 コーディ明らかに、CoDi ではクリエイティブなことなら何でもできます。 本当に何でも このモデルにはすでにデモビデオがあります。Microsoft 研究チームによって作成され、CoDi がどのように機能するかを示しています。

CoDi は、AI を使用して人間とコンピューターのインタラクションを改善する Microsoft の Project i-Code の一部でもあります。

Microsoft によれば、これが CoDi があなたのためにやってくれることです。

CoDi は Composable Diffusion の略で、このモデルは Microsoft Azure Cognitive Services Research のチームがノースカロライナ大学チャペルヒル校と協力して開発しました。

あらゆるものからあらゆるものを構築できます。 あらゆる種類の入力からここで話しているのは、言語、画像、ビデオまたはオーディオ、およびこれらの入力の組み合わせです。

CoDi はこれらの入力を受信して​​処理し、同時に複数の入力タイプを生成します。 以下のデモビデオで見ることができます。

言い換えれば、CoDi は、プロンプト、画像、オーディオ クリップを使用して、状況に応じたリアルなビデオを作成します。

CoDi を開発したチームは、障害のある人がコンテンツを作成するのがはるかに簡単になるなど、このモデルの多くの使用例を考案しました。 学生はこれを使用して、興味深く有益なプレゼンテーションやプロジェクトを作成することもできます。

このモデルをコンピュータで使用すると、ユーザー エクスペリエンス全体が向上します。 そして一般に公開された場合管理できるいくつかの項目だけで、高度にインタラクティブなコンテンツを作成できるようになります。

あなたはそれについてどう思いますか? CoDi に興奮していますか? 以下のコメントセクションでお知らせください。

Sharing is caring!

Facebook Comments

Leave a Reply