基盤モデル

Foundation Model

ひとことで言うと

基盤モデルとは、大量のデータで事前学習された大規模AIモデルの総称。テキスト・画像・音声など多様なタスクに転用可能で、GPT、Claude、Gemini、LLaMAなどが代表例である。

適応的学習力AI協働設計力構造転写・応用力

基盤モデルの定義と特性

基盤モデル（Foundation Model）とは、大量かつ多様なデータで事前学習（Pre-training）され、幅広い下流タスクに適応可能な大規模AIモデルの総称である。2021年にスタンフォード大学HAI（Human-Centered Artificial Intelligence）が提唱した概念で、従来の「特定タスク専用モデル」とは対照的に、一つのモデルが翻訳・要約・分類・生成・推論など多様なタスクをこなせる汎用性を持つ。GPT-4、Claude、Gemini、LLaMAなどの大規模言語モデル（LLM）に加え、画像生成のStable DiffusionやDALL-E、マルチモーダルのGPT-4Vなども基盤モデルに含まれる。その影響力の大きさから、AIの「基盤（Foundation）」としてあらゆるアプリケーションの土台となっている。

あなたの適応的学習力は偏差値いくつ？

AI偏差値テストで6つの能力を10分で無料診断できます。

主要な基盤モデルの種類と比較

基盤モデルは入出力のモダリティと規模で分類できる。テキスト中心のLLMとしてはGPT-4（OpenAI）、Claude（Anthropic）、Gemini（Google）、LLaMA（Meta）が4大モデルとして知られる。画像生成モデルにはStable Diffusion（Stability AI）、DALL-E（OpenAI）、Midjourney がある。マルチモーダルモデルはテキスト・画像・音声を統合的に処理でき、GPT-4V、Gemini Ultra が代表例である。オープンソースモデル（LLaMA、Mistral）とクローズドソースモデル（GPT-4、Claude）の選択は、カスタマイズ性・セキュリティ・コストのバランスで判断する。企業が利用する際は、精度・速度・コスト・データプライバシー・ライセンス条件を総合的に比較検討すべきである。

ビジネスにおける基盤モデルの活用法

企業が基盤モデルを活用する方法は3つの段階に分けられる。第一段階は「API利用」。OpenAIやAnthropicのAPIを自社アプリケーションに組み込み、テキスト生成・分類・要約などの機能を追加する。最も低コストで素早く導入できる。第二段階は「RAG（検索拡張生成）との組み合わせ」。社内文書やFAQを外部データソースとしてモデルに参照させ、自社固有の知識に基づいた回答を生成させる。第三段階は「ファインチューニング」。自社の業界・業務に特化したデータでモデルを追加学習し、特定タスクの精度を最大化する。段階を進むほどカスタマイズ度と精度は上がるが、必要なコスト・スキル・時間も増加する。多くの企業はまず第一段階から始め、段階的に深化させていくのが現実的なアプローチである。

この用語を知っているあなたは、AI活用力が高いかもしれません

10分の無料テストで、あなたのAI偏差値を測定しませんか？

基盤モデルの選定基準と今後の動向

基盤モデルの選定では、精度（ベンチマークスコア）、レイテンシ（応答速度）、コスト（APIの従量課金単価）、コンテキストウィンドウ（一度に処理できるトークン数）、多言語対応、セキュリティ（データの取り扱い方針）の6軸で比較することが推奨される。今後の動向として、モデルの小型化・効率化（SLM: Small Language Model）のトレンドが顕著であり、スマートフォンやエッジデバイスでも動作する軽量モデルの実用化が進んでいる。また、マルチモーダル化の加速により、テキスト・画像・音声・動画を統合的に処理できるモデルが標準になりつつある。AIエージェントの基盤としての役割も拡大しており、基盤モデルの選定は今後のAI戦略の根幹を左右する意思決定となる。

AI偏差値テストとの関連

この概念は、AI偏差値テストの以下の測定次元と関連しています。

適応的学習力新しいAIツールを素早く習得し依存度を認識する力

AI協働設計力プロンプト設計やツール選定、タスク分担を最適化する力

構造転写・応用力パターンを抽出・転用し新しい価値を生む力

この知識が特に重要な職種

エンジニア→経営企画→コンサルタント→

よくある質問

Q.基盤モデルとLLMの違いは？

LLM（大規模言語モデル）は基盤モデルの一種であり、テキストを中心に扱うモデルです。基盤モデルはより広い概念で、画像生成モデル（Stable Diffusion）、音声モデル（Whisper）、マルチモーダルモデル（GPT-4V）なども含みます。LLMは基盤モデルの部分集合と理解してください。

Q.オープンソースモデルとクローズドソースモデルのどちらを選ぶべき？

データを外部に送信できない厳格なセキュリティ要件がある場合は、自社環境で運用できるオープンソースモデル（LLaMA、Mistralなど）が適しています。一方、最高精度を求める場合や運用コストを抑えたい場合は、クローズドソースモデル（GPT-4、Claudeなど）のAPI利用が現実的です。ハイブリッド構成も増えています。

Q.基盤モデルのコストはどのくらい？

API利用の場合、GPT-4クラスで1000トークンあたり数円程度です。月間利用量にもよりますが、中小規模の利用であれば月数万円〜十数万円が目安です。オープンソースモデルの自社運用は初期のGPUインフラ費用が高いものの、大量利用時のランニングコストは低くなる傾向があります。

SalesNow で働く

AI時代に本気で伸びたい人へ

第二新卒・インターン・外国籍エンジニア向けに、SalesNowで挑戦する理由と応募前の判断材料を整理しています。

採用メディアを見る

あなたのAI偏差値を測ってみませんか？

OECD/WEF準拠の6次元フレームワークで、あなたのAI活用力を10分で診断。

10分で完了完全無料即時結果