RAGとは
RAG(Retrieval-Augmented Generation:検索拡張生成)は、AIが回答を生成する前に、自社のデータベースやドキュメントから関連情報を検索し、その情報を元に回答を生成する技術です。ChatGPTのような汎用AIが持っていない自社固有の知識を活用できるのが最大のメリットです。
RAGの仕組み
- データ準備:社内文書、マニュアル、FAQをチャンク(小さな単位)に分割
- ベクトル化:各チャンクをEmbeddingモデルで数値ベクトルに変換し、ベクトルDBに格納
- 検索:ユーザーの質問をベクトル化し、類似度の高いチャンクを検索
- 生成:検索結果をコンテキストとしてLLMに渡し、回答を生成
ファインチューニングとの違い
| 項目 | RAG | ファインチューニング |
|---|---|---|
| コスト | 低(月額5〜20万円) | 高(100万円〜) |
| データ更新 | 即時反映可能 | 再学習が必要 |
| ハルシネーション | 少ない(根拠あり) | 起きうる |
| 専門知識 | 不要(ツールで構築可) | ML知識が必要 |
活用事例
- 社内FAQ:就業規則、福利厚生、ITヘルプデスクの自動応答
- マニュアル検索:業務手順書から手順を自然言語で検索
- 契約書検索:過去の契約書から類似条項を検索
- 議事録要約:過去の会議議事録から決定事項を検索
構築ツールの選択肢
| ツール | 特徴 | 月額目安 |
|---|---|---|
| Azure AI Search + OpenAI | Microsoft公式。M365連携◎ | 10〜20万円 |
| Dify | OSS。ノーコードでRAG構築 | サーバー費のみ |
| LangChain + Pinecone | 開発者向け。柔軟性◎ | 5〜15万円 |
導入の5ステップ
- 対象データの選定(まずはFAQ 50件から)
- ツール選定(M365環境→Azure AI Search推奨)
- データ準備・チャンク分割
- PoC実施(精度検証)
- 本番展開・運用開始
精度向上テクニック
- チャンク分割の最適化:意味のまとまりで分割(500〜1000トークン)
- メタデータ付与:文書のカテゴリ、日付、作成者を付与してフィルタリング
- リランキング:検索結果をLLMで再スコアリングし、精度を向上
BTNのRAG構築支援
BTNコンサルティングのAI365では、RAGの構築を一貫して支援。データ準備からツール選定、構築、精度チューニングまで対応します。
まとめ
RAGは中小企業が自社データでAIを活用する最も現実的な方法です。月額5万円から始められ、ファインチューニングよりはるかに低コスト。まずはFAQ 50件でPoCを始めましょう。