apice-technologymemorandum
投稿日時:2023/10/18
shutter 6p
「AIはデータからどのように学習するのか?
生成AIモデルが何を生成する必要があるかを理解するために、すべての生成AIモデルは膨大な量のデータで訓練されなければなりません。
このデータセットには何百万もの画像が含まれており、それぞれの画像に含まれるものの説明と対になっています。
訓練中、モデルは特定の視覚的な要素や画像の内容がどのように見えるか、そしてそれらを自然言語の説明に関連付ける方法を学習します。
例えば、AIモデルはソーダの姿を認識するように訓練できます。これらの飲み物の数百万枚の画像に触れることで、モデルはソーダが:
• 炭酸が入っていること
• 様々な容器に入っていること—プラスチックボトル、ガラスボトル、缶、カクテルグラスなど
• 様々な色があること—オレンジ、ブラウン、クリア、赤、紫など
深層学習アルゴリズムはこれらの変数を数十億次元にわたって追跡し、ソーダの特徴を認識し整理します。モデルは最終的に、ルートビアやコーラが茶色のソーダの種類であることを知る...しかし、すべてのソーダが茶色であるわけではないことも理解します。他のソーダのフレーバー、例えばグレープやオレンジソーダが存在することも学びます。これらのカラフルな特性はまとめられ、AIはソーダがこれらの特性のいずれかを持つことを理解します。
誰かがAI画像生成ツールに「ハイボールグラスに入ったぶどうソーダの写真を作成して」と依頼すると、簡単に応じることができます。訓練データセットのおかげで、生成AIはその特定の飲み物がどのように見えるかを理解するように訓練されています。
人工知能は異なるグラスのスタイルや芸術的なメディアがどのように見えるかも知っています。
すべてのこの知識は、新たなソーダに焦点を当てた画像を生成するために蓄積されます。実際、AIモデルはほぼ無限の新しいソーダの画像を生成する能力があり、前回のものとは異なり、まさに同じテキストプロンプトからでも異なります。」