
2026/03/27
【AIクイズ】知ったかぶりしてない?AI用語の基本中の基本!
⏱ 1分
答え合わせ
なぜそうなるかを知ると、次の挑戦がもっと楽しくなります。

マルチモーダルAIとは、テキスト・画像・音声・動画など複数の種類(モダリティ)のデータを同時に理解・生成できるAIのことです。従来のAIはテキストならテキストだけ、画像なら画像だけと単一のデータ形式しか扱えませんでした。しかしGPT-4oやGoogleのGeminiなどは、写真を見せて「これは何?」と聞いたり、音声で指示を出して画像を生成させたりできます。たとえばレシートの写真を撮って「これを家計簿にまとめて」と頼む、といった使い方が可能です。人間が日常的に「見て・聞いて・読んで」情報を総合判断しているのと同じことを、AIにもさせようという技術の方向性です。今後のAI活用では、このマルチモーダル対応かどうかがツール選びの重要なポイントになります。
「マルチモーダル」が分かれば、最新AIのニュースがグッと読みやすくなりますよ!次回もAIの必須ワードを出題するのでお楽しみに!