今更聞けない「AI」とは?仕組みからRAG・LLMまで分かりやすく解説
AIに関する話題が日常的になった一方で、いざ仕組みを問われると説明に詰まる場面は多いものです。
言葉として知っていることと、仕組みを理解していることの間には、意外と大きな差があります。
本記事では、AIの基本的な仕組みから、ベクトルやRAGといった実装レベルの技術、主要なAIサービスの比較まで、体系的に解説します。
基礎から丁寧に整理したい方にとって、実務での判断軸になる内容を目指しました。
こんな方におすすめ
- AIという言葉は耳にするが、仕組みまでは把握していない方
- AIを業務で使いながら、技術的な背景を整理したい方
- 社内でのAI活用を検討しており、基礎知識を押さえたいビジネスパーソンの方
- AIの技術的な土台を体系的に理解したいエンジニアの方
そもそもAIとは何か
AI(Artificial Intelligence:人工知能) とは、コンピューターに人間のような知的な振る舞いをさせる技術の総称です。
ただし、知的な振る舞いの範囲は非常に広く、AIという言葉は文脈によって指す範囲が変わります。以下のように階層的に整理すると理解しやすいです。
| 用語 | 意味 |
|---|---|
| AI(人工知能) | 人間の知的活動を模倣するコンピューター技術の総称 |
| 機械学習(Machine Learning) | データから自動的にルールやパターンを学習するAIの手法 |
| 深層学習(Deep Learning) | 多層のニューラルネットワークを使った機械学習の一手法 |
| 生成AI(Generative AI) | 深層学習をベースに、テキスト・画像・音声などのコンテンツを新たに生成するAI |
| LLM(大規模言語モデル) | 生成AIの中でも特にテキストを扱う大規模モデル。生成AIの代表的な実装形態 |
つまり、ChatGPTやGeminiは広義のAIに含まれますが、より正確にはLLMを活用した生成AIサービスと表現するのが適切です。本記事では、現在最も注目されているこの生成AI・LLMを中心に解説を進めます。
AIはどうやって賢くなるのか――機械学習の基本
ルールベースAI vs 機械学習
かつてのAIはルールベースと呼ばれる方式でした。たとえば猫の種類を判定するシステムを作るとき、
「耳が尖っていて、縞模様があり、体重が4kg以下であればアメリカンショートヘアと判定する」
というルールをエンジニアがすべて手作業で書き込んでいました。単純な条件には対応できますが、猫の種類が増え、パターンが複雑になるほど、人間がルールを書ききれなくなります。
これに対し機械学習は、
「アメリカンショートヘアの画像1万枚、スコティッシュフォールドの画像1万枚を見せて、AIにパターンを自分で見つけさせる」
という発想です。ルールを人が書くのではなく、データから自動的に学習します。
学習のイメージ
機械学習の学習プロセスは、大まかに次のようなステップで進みます。
- データを用意する(例:猫の品種ラベル付き画像を大量に収集する)
- モデルに予測させる(この画像はどの品種か?)
- 正解と照らし合わせて誤差を計算する
- 誤差が小さくなるようにモデルのパラメーターを調整する
- 1〜4を繰り返す
この繰り返し調整するプロセスをトレーニング(学習)と呼びます。学習済みのモデルを使って新しいデータに対して予測を行うことは推論(Inference)と呼ばれます。
ニューラルネットワークと深層学習(ディープラーニング)
ニューラルネットワークとは
ニューラルネットワーク(Neural Network)は、人間の脳の神経回路(ニューロン)を模した数学的なモデルです。
入力を受け取り、重みづけして足し合わせ、変換して出力するというユニット(ノード)が大量につながった構造をしています。

各ノード間の重み(Weight)が学習によって調整されることで、モデルが正しい答えを出せるようになります。
深層学習(ディープラーニング)
深層学習とは、中間層(隠れ層)を何十層・何百層にも重ねたニューラルネットワークのことです。深い(Deep)ことがそのままネーミングの由来です。
層を重ねることで、単純なパターンから複雑なパターンまで段階的に学習できるようになります。たとえば猫の品種画像認識であれば、
- 浅い層:毛並みのエッジや輪郭を検出
- 中間の層:耳の形・目の位置・鼻のパーツを認識
- 深い層:アメリカンショートヘアらしさ・スコティッシュフォールドらしさを総合判断
という階層的な認識が実現します。
現代のAI(特にLLM)は、Transformer と呼ばれる特殊なニューラルネットワーク構造を採用しています。Transformerは、入力の中でどの要素がどの要素と関連しているかを計算する Attention(アテンション)機構 を持っており、長い文脈を理解するのが得意です。
言語AIの核心:ベクトルという概念
AIが自然言語を扱う上で欠かせない概念がベクトル(Embedding)です。
コンピューターは文字を直接理解できない
コンピューターが扱えるのは数値だけです。ネコ・猫・Catという文字列そのものをAIに処理させることはできません。そこで必要になるのが、言葉を数値の列(ベクトル)に変換するという技術です。
ベクトルとは何か
ベクトルとは複数の数値を並べたものです。たとえば、
「アメリカンショートヘア」 → [0.2, 0.8, 0.1, 0.5, ...](数百〜数千次元)
「スコティッシュフォールド」 → [0.3, 0.7, 0.2, 0.4, ...]
「トラック」 → [0.9, 0.1, 0.8, 0.0, ...]
のように、各単語や文章を高次元の数値の列に変換します。重要なのは、意味が近い言葉ほど、ベクトルの値も近くなるよう学習されることです。
アメリカンショートヘアとスコティッシュフォールドのベクトルは近く、猫とトラックのベクトルは遠い——これが埋め込み(Embedding)の本質です。
ベクトルの活用
ベクトルへの変換が実現すると、様々な応用が可能になります。
- 類似検索:この文章に意味が近い文書を探す
- 分類:このレビューはポジティブかネガティブか
- 推薦:この猫用品を購入したユーザーに類似商品を提案する
- 質問応答:この質問に答えられる情報はどこにあるか
特に後述するRAGでは、このベクトル類似検索が核心的な役割を担います。
現代AIの主役:大規模言語モデル(LLM)とは
LLM(Large Language Model:大規模言語モデル) は、現在のAIブームを牽引している技術であり、生成AIの代表的な実装形態です。
LLMの仕組み
LLMは基本的に次に来る単語を予測するモデルです。
入力:「この猫の品種は」
予測:「アメリカンショートヘア」(確率0.6)、「スコティッシュフォールド」(確率0.2)、「ロシアンブルー」(確率0.1)、...
この次の単語予測を繰り返すことで、文章全体が生成されます。これが生成AI(Generative AI)と呼ばれる所以です。
一見シンプルな仕組みですが、数百億〜数兆のパラメーターを持つ巨大なモデルがインターネット上の膨大なテキストで学習することで、文脈を理解し、推論し、コードを書き、翻訳するといった高度な振る舞いが生まれます。
トークンという単位
LLMはテキストをトークンという単位に分割して処理します。日本語の場合、1トークンはおおよそ1〜数文字に相当します。
LLMのサービスはコンテキストウィンドウ(一度に処理できるトークン数の上限)という制限を持っており、これがモデルの記憶の範囲に相当します。最近のモデルは100万トークンを超えるものも登場しています。
プロンプトエンジニアリング
LLMへの入力であるプロンプトの書き方によって、出力の品質は大きく変わります。
- 役割を与える:あなたは猫の専門家です
- 具体的な指示を出す:品種の特徴を箇条書きで3点にまとめてください
- 例を示す:以下の例を参考に同じ形式で出力してください
こうした工夫を体系化したものがプロンプトエンジニアリングと呼ばれる分野です。
RAG(検索拡張生成)――AIをもっと賢くする仕組み
LLMだけでは足りないこと
LLMは非常に高性能ですが、いくつかの本質的な限界があります。
- 知識のカットオフ:学習データには期限があり、最新情報を知らない
- ハルシネーション:もっともらしい誤情報を出力することがある
- 社内情報を知らない:自社のマニュアルや顧客データは保持していない
これらを補う技術が RAG(Retrieval-Augmented Generation:検索拡張生成) です。
RAGの仕組み
RAGは以下のような流れで動作します。

たとえば、猫専門の動物病院が社内向けAIを構築する場合を想像してください。症例記録・診療プロトコル・薬品データベースをRAGのDBに格納しておけば、スタッフが質問すると最新の社内情報を参照した回答が得られます。LLMの再学習は不要です。
RAGが解決すること
| 課題 | RAGによる解決 |
|---|---|
| 最新情報を知らない | DBを更新するだけでAIが最新情報に対応 |
| ハルシネーション | 根拠となる文書を提示できるので信頼性が向上 |
| 社内情報を扱えない | 社内文書をDBに格納するだけで対応可能 |
| モデルの再学習コスト | ファインチューニング不要でコストを抑えられる |
RAGは現在、企業向けAI活用の中でも特に注目度が高いアーキテクチャです。社内問い合わせボット、ドキュメント検索、カスタマーサポートなど、幅広い場面で実績が出ています。
ベクトルDBとは
RAGの実装にはベクトルデータベース(Vector DB)が用いられることが多いです。Pinecone、Weaviate、Qdrant、pgvector(PostgreSQL拡張)などが代表的なソリューションです。
通常のデータベースが値の完全一致や範囲検索を得意とするのに対し、ベクトルDBは意味的な近さ(コサイン類似度など)による検索に特化しています。
AIを使う上で知っておきたいこと
ファインチューニングとRAGの使い分け
社内向けAIを構築する際、よく検討されるのがファインチューニングとRAGの選択です。
ファインチューニング(Fine-tuning) は、既存のLLMに対して自社データで追加学習を行い、モデル自体を専門化させる手法です。
| 比較項目 | RAG | ファインチューニング |
|---|---|---|
| 導入コスト | 低〜中(DB構築のみ) | 高(学習データ整備+計算コスト) |
| 知識の更新 | DB更新だけで即時反映 | 再学習が必要 |
| 根拠の提示 | 参照元を明示できる | 困難 |
| 文体・口調の統一 | 困難 | 得意 |
| 専門ドメインへの適応 | 一定の限界あり | 深い専門化が可能 |
多くの企業ユースケースでは、まずRAGから始めることが推奨されます。ファインチューニングが本領を発揮するのは、RAGでは対応しきれない高度な専門性や、応答スタイルの厳密な統一が求められる場合です。
ハルシネーションへの対処
LLMはもっともらしいが事実ではない情報を出力することがあります。これをハルシネーション(幻覚)と呼びます。
原因は、LLMが正しいことを言うのではなく、確率的に自然な次のトークンを選ぶシステムであることにあります。知識が不足している場面でも、それらしい文章を生成してしまいます。
対策として有効なアプローチは以下の通りです。
- RAGで根拠となる文書を必ず参照させる
- 重要な情報は必ずファクトチェックする
- わからない場合はわからないと答えるよう、プロンプトで明示する
セキュリティとプライバシー
AIサービスを業務で活用する際には、情報漏洩リスクへの注意が必要です。
多くのクラウドAIサービスは、入力したデータが学習に使われる可能性があります(サービスによって設定が異なります)。機密情報や個人情報を安易に入力しないよう、社内でのガイドライン整備が重要です。
自社環境での安全なAI活用を実現するには、プライベートクラウドへのデプロイや、企業向けプランの活用(多くはデータ学習をオプトアウトできる)を検討することをお勧めします。
まとめ
本記事では、AIの基礎から実装レベルの技術まで、以下のポイントを整理しました。
- AI・機械学習・深層学習・生成AI・LLM は入れ子の関係にある概念
- AIは大量のデータからパターンを自動的に学習する仕組みで動いている
- ベクトル(Embedding) は言葉を数値に変換し、意味の近さを計算可能にする技術
- LLM は次の単語を予測し続けることでテキストを生成する生成AIの代表的な実装
- RAG は検索とLLMを組み合わせ、社内情報や最新情報への対応を低コストで実現する
- 主要なAIサービスはそれぞれ強みが異なり、用途に応じた使い分けが重要
AIの仕組みを理解すると、どのサービスを選ぶか・どう設計するかという判断が格段にしやすくなります。特にRAGを活用した業務改善は、多くの企業で具体的な成果が出始めている領域です。
自社でのAI活用について、何から始めるべきか迷われている場合は、ぜひ一度ご相談ください。
貴社の課題に合わせた最適なアプローチを、STSのメンバーがご提案します。





