Amazon Bedrock Knowledge Bases (RAG) ハンズオン手順書

📋 概要

RAG（Retrieval-Augmented Generation / 検索拡張生成）は、生成 AI に外部のドキュメントを検索させ、その内容を根拠として回答を生成させる手法です。これにより、モデルが学習していない社内文書や最新情報に基づいた、ハルシネーション（もっともらしい誤答）の少ない回答が得られます。

Amazon Bedrock の Knowledge Bases を使うと、S3 に置いたドキュメントの取り込み・チャンク分割・ベクトル化・ベクトル DB への格納・検索までをフルマネージドで自動化できます。このハンズオンでは公式の amazon-bedrock-workshop の RAG ラボを参考に、マネジメントコンソールだけで RAG チャットボットの基盤を構築します。

項目	内容
対象サービス	Amazon Bedrock（Knowledge Bases / モデルアクセス）、Amazon S3、Amazon OpenSearch Serverless、Titan Text Embeddings
主な学習内容	モデルアクセス有効化・ドキュメント取り込み・埋め込み生成・ベクトル検索・Retrieve and Generate
所要時間	75〜90 分（同期・インデックス作成の待機時間含む）
難易度	★★★☆☆（中級者向け）
前提知識	S3・IAM の基礎知識、生成 AI / LLM の基本概念
費用目安	約 1〜3 USD（OpenSearch Serverless の最低キャパシティ課金あり・放置厳禁）

💰 コストに関する最重要注意

ベクトルストアに使う Amazon OpenSearch Serverless は、コレクションが存在する間ずっと最低キャパシティ分の課金（目安で 1 時間あたり数十円〜数百円）が発生します。ハンズオン終了後は必ず「クリーンアップ」を実施し、コレクションを削除してください。数日放置すると数千円規模になり得ます。

ℹ️ RAG の主なユースケース

社内規定・マニュアル・FAQ に答える社内ヘルプデスクボット
製品ドキュメントに基づくカスタマーサポート自動応答
大量の契約書・論文からの根拠付き情報抽出
最新情報を反映した（再学習不要の）Q&A システム

🏗️ アーキテクチャ

① データ取り込みフロー（インデックス作成時）

📄 ドキュメント（PDF / TXT / Markdown / CSV など）
Amazon S3 バケットに格納

↓ データソース同期（Sync）

✂️ Knowledge Bases によるチャンク分割
文書を意味のある単位に分割

↓ 埋め込みモデルで数値ベクトル化

🔢 Titan Text Embeddings V2
各チャンクを 1024 次元ベクトルに変換

↓ ベクトルを格納

🗄️ Amazon OpenSearch Serverless（ベクトルストア）
ベクトル + 元テキスト + メタデータを保存

② 検索・回答生成フロー（質問時）

💬 ユーザーの質問
「経費精算の締め日は？」など

↓ 質問をベクトル化して類似検索

🔍 OpenSearch Serverless で意味的に近いチャンクを取得
Retrieve：関連文書 Top-K を抽出

↓ 取得チャンク + 質問をプロンプトに合成

🤖 基盤モデル（Claude など）が回答生成
Generate：根拠に基づき日本語で回答 + 引用元を提示

ℹ️ 登場する 2 種類のモデル

モデル種別	役割	本ハンズオンでの選択
埋め込みモデル（Embeddings）	テキストを数値ベクトルに変換し、意味的な類似検索を可能にする	Titan Text Embeddings V2
基盤モデル（Foundation Model）	取得した文書を読み、人間向けの回答文を生成する	Claude 3.5 Sonnet（または Claude 3 Haiku）

✅ 前提条件

AWS アカウントにログイン済みであること
Bedrock・S3・IAM・OpenSearch Serverless を操作できる IAM 権限を持つこと（管理者権限が簡単）
Amazon Bedrock が利用可能なリージョンで作業すること

⚠️ リージョンについて

このハンズオンでは us-east-1（バージニア北部） を使用します。Knowledge Bases・Titan Embeddings・Claude 各モデルが揃っており、公式ワークショップも同リージョンを前提としています。コンソール右上のリージョンを us-east-1 に固定してから開始してください。東京リージョン（ap-northeast-1）でも構成可能ですが、利用可能モデルが異なる場合があります。

ℹ️ 一連の作業はすべて同一リージョンで

S3 バケット・Knowledge Base・OpenSearch コレクションは同じリージョンに作成してください。リージョンがずれると同期に失敗します。

🔑 ステップ 1 ― Bedrock モデルアクセスの有効化

Bedrock では、利用したい基盤モデルごとに事前のアクセス申請（有効化）が必要です。RAG に必要な「埋め込みモデル」と「回答生成モデル」の 2 つを有効化します。

1-1. Bedrock コンソールを開く

AWS マネジメントコンソールで 「Bedrock」 を検索して開きます。リージョンが us-east-1 になっていることを確認します。

1-2. モデルアクセスを管理する

左メニュー最下部の 「Bedrock configurations」→「モデルアクセス（Model access）」 を開きます。「モデルアクセスを変更（Modify model access）」 または「特定のモデルを有効にする」をクリックします。

1-3. 必要なモデルを選択

以下のモデルにチェックを入れます。

用途	モデル	提供元
埋め込み（必須）	Titan Text Embeddings V2	Amazon
回答生成（必須）	Claude 3.5 Sonnet	Anthropic
回答生成（任意・低コスト）	Claude 3 Haiku	Anthropic

「次へ」→「送信（Submit）」をクリックします。

1-4. アクセス状態を確認

モデルアクセス画面で、対象モデルのアクセスステータスが 「アクセスが付与されました（Access granted）」 になるまで待ちます。Amazon・Anthropic のモデルは通常すぐに有効化されます。

ℹ️ Anthropic モデルで利用目的の入力を求められたら

初回は簡単なユースケース（社内ドキュメント検索の検証など）の入力を求められる場合があります。フォームに沿って入力すれば即時付与されます。

✅ 確認ポイント

Titan Text Embeddings V2 と Claude の両方が「アクセスが付与されました」と表示されていれば成功です。

🪣 ステップ 2 ― S3 バケットとドキュメントの準備

RAG の検索対象となるドキュメントを S3 バケットにアップロードします。今回は架空の社内規定をサンプルデータとして用意します。

2-1. S3 バケットを作成

S3 コンソールで 「バケットを作成」 をクリックし、以下を設定します（バケット名は世界で一意である必要があります）。

バケット名bedrock-kb-docs-<あなたのアカウントID>

リージョン米国東部（バージニア北部）us-east-1

他はデフォルトのまま「バケットを作成」をクリックします。

2-2. サンプルドキュメントを用意

テキストエディタで以下の内容を company-policy.md という名前で保存します。日本語の社内規定を題材にします。

# 株式会社サンプル 社内規定（抜粋）

## 経費精算について
経費精算の締め日は毎月25日です。25日を過ぎた申請は翌月扱いとなります。
精算金額は申請月の翌月15日に給与口座へ振り込まれます。
領収書は電子データ（PDF または画像）での提出が必須です。

## 勤務時間とリモートワーク
標準勤務時間は9時00分から18時00分（休憩1時間）です。
コアタイムは11時00分から15時00分です。
リモートワークは週3日まで認められています。事前に上長へSlackで申請してください。

## 有給休暇
入社初年度は10日付与されます。
有給は1時間単位で取得可能です。
取得する場合は原則3営業日前までに勤怠システムで申請してください。

## 経費として認められるもの
- 業務に必要な書籍・技術書
- 業務用ソフトウェアのライセンス費用
- 顧客との会食費（1人あたり5000円まで）
出張時の宿泊費は1泊あたり12000円を上限とします。

ℹ️ 対応フォーマット

Knowledge Bases は .txt / .md / .pdf / .html / .csv / .doc(x) / .xls(x) などに対応しています。複数ファイルをまとめて取り込めます。今回は Markdown を使用します。

2-3. ドキュメントをアップロード

作成したバケットを開き、「アップロード」→「ファイルを追加」 で company-policy.md を選択し、「アップロード」をクリックします。

複数の文書で試したい場合は、ここで追加のテキスト/PDF も一緒にアップロードしてください。

✅ 確認ポイント

バケット内に company-policy.md が表示されていれば準備完了です。

🧠 ステップ 3 ― Knowledge Base の作成

S3 をデータソース、Titan を埋め込みモデル、OpenSearch Serverless をベクトルストアとして Knowledge Base を構築します。ベクトルストアはクイック作成を使い、面倒なインデックス設計を Bedrock に任せます。

3-1. ナレッジベースの作成を開始

Bedrock コンソール左メニューの 「ビルダーツール（Builder tools）」→「ナレッジベース（Knowledge Bases）」 を開き、「ナレッジベースを作成」→「ベクトルストアを使用するナレッジベース（Knowledge Base with vector store）」 を選択します。

3-2. 基本情報とIAMロール

ナレッジベース名company-policy-kb

IAM 権限新しいサービスロールを作成して使用

データソースタイプAmazon S3

IAM ロールは Bedrock が自動生成します（S3 読み取り・OpenSearch アクセス権限が付与されます）。「次へ」をクリックします。

3-3. データソース（S3）を設定

データソース名company-policy-source

S3 URIs3://bedrock-kb-docs-<アカウントID>/

「S3 を参照」からステップ 2 で作成したバケットを選択できます。チャンク戦略は 「デフォルトのチャンク化（Default chunking）」 のままで「次へ」をクリックします。

ℹ️ チャンク戦略の選択肢

デフォルト：約 300 トークンごとに自動分割（まずはこれで OK）
固定サイズ：トークン数とオーバーラップを自分で指定
階層・セマンティック：文書構造や意味の切れ目で分割（高精度・上級）
チャンク化なし：1 ファイル = 1 チャンク

3-4. 埋め込みモデルを選択

埋め込みモデルTitan Text Embeddings V2

ステップ 1 で有効化したモデルが選択肢に表示されます。次元数はデフォルト（1024）のままにします。

3-5. ベクトルストアを設定

ベクトルストアの作成方法で 「新しいベクトルストアをクイック作成（Quick create a new vector store）」→「Amazon OpenSearch Serverless」 を選択します。Bedrock がコレクションとベクトルインデックスを自動作成します。

⚠️ ここで課金が始まります

OpenSearch Serverless コレクションが作成された時点から、最低キャパシティ分の課金が継続的に発生します。作業を中断する場合でもクリーンアップ（ステップのコレクション削除）を忘れないでください。

3-6. 確認して作成

設定内容を確認し 「ナレッジベースを作成」 をクリックします。OpenSearch Serverless コレクションとインデックスの作成に 数分（3〜10 分程度） かかります。完了するまで待ちます。

✅ 確認ポイント

ナレッジベースのステータスが「準備完了（Available）」になり、データソース一覧に company-policy-source が表示されれば成功です。

🔄 ステップ 4 ― データソースの同期（インジェスト）

Knowledge Base を作成しただけではドキュメントはまだ取り込まれていません。「同期」を実行して、S3 のドキュメントをチャンク分割・ベクトル化し、OpenSearch に格納します。

4-1. 同期を実行

作成したナレッジベース company-policy-kb の詳細画面を開きます。「データソース」 セクションで company-policy-source を選択し、「同期（Sync）」 ボタンをクリックします。

4-2. 同期の完了を待つ

同期ジョブが開始されます。ドキュメント量にもよりますが、今回のサンプルなら 1〜3 分 で完了します。ステータスが 「完了（Completed / Ready）」 になるまで待ちます。

同期ジョブをクリックすると、取り込まれたソース数・処理したファイル数などの統計が確認できます。

⚠️ ドキュメントを追加・更新したら再同期

S3 のファイルを追加・変更・削除した場合は、その都度「同期」を再実行しないとベクトルストアに反映されません。

✅ 確認ポイント

同期ジョブのステータスが「完了」で、取り込みエラーが 0 件であれば成功です。これで RAG の検索準備が整いました。

💬 ステップ 5 ― ナレッジベースでRAGをテストする

マネジメントコンソールのテスト画面で、実際に質問して根拠付きの回答が返るかを確認します。

5-1. テストパネルを開く

ナレッジベース詳細画面の右側にある 「ナレッジベースをテスト（Test Knowledge Base）」 パネルを開きます。「モデルを選択」 をクリックし、回答生成用に Claude 3.5 Sonnet（または Claude 3 Haiku）を選択します。

5-2. 生成モードを確認

テストパネル上部で 2 つのモードを切り替えられます。今回は 「ソースを使用して応答を生成（Retrieve and generate）」 をオンにします。

モード	動作
Retrieve and generate（生成あり）	関連チャンクを検索 → モデルが自然文で回答 + 引用を提示
Retrieve only（検索のみ）	関連チャンクの生テキストをそのまま返す（生成しない）

5-3. 質問してみる

テスト用の質問を入力して送信します。ステップ 2 のサンプル文書に基づく質問例：

経費精算の締め日はいつですか？
リモートワークは週何日までできますか？
出張の宿泊費の上限は？
有給は1時間単位で取れますか？取得の申請期限は？

例えば「経費精算の締め日はいつですか？」と聞くと、「毎月25日です」 という回答とともに、根拠となった社内規定のチャンクが 引用元（Source / Citations） として表示されます。

5-4. 引用元（出典）を確認する

回答の下に表示される 「ソースを表示（Show source details）」 をクリックすると、回答の根拠となった元テキストのチャンクと、それが属する S3 のファイルが確認できます。これが RAG の「根拠提示」機能です。

5-5. ドキュメントに無い質問を試す

あえて文書に書かれていないこと（例：「社員食堂のメニューは？」）を質問してみます。RAG が正しく機能していれば、「提供された情報の中にはその記載が見つかりませんでした」 といった趣旨の回答になり、デタラメをでっち上げない（ハルシネーション抑制）ことを確認できます。

✅ 確認ポイント

文書内の質問に正しい回答 + 引用元が返り、文書外の質問には「分からない」と答えれば、RAG が正しく動作しています。

🎯 ステップ 6 ― 精度向上と API 呼び出し（応用）

基本動作を確認できたら、回答品質を高める設定や、アプリから利用するための API 呼び出しを試します。

6-1. 検索パラメータの調整

テストパネルの 「設定（Configurations）」 から検索動作を調整できます。

パラメータ	説明	調整の目安
取得するソース数（Number of source chunks）	検索で取得するチャンク数（Top-K）	回答が不足するなら 5 → 10 に増やす
検索タイプ	セマンティック / ハイブリッド検索	固有名詞や型番が多いならハイブリッド
プロンプトテンプレート	モデルへの指示文をカスタマイズ	「必ず日本語で」「箇条書きで」等を追記

6-2. プロンプトテンプレートのカスタマイズ

「ナレッジベースのプロンプトテンプレート」を編集すると、回答スタイルを制御できます。例として、以下のような指示を追記すると回答の一貫性が上がります。

あなたは社内規定に詳しいアシスタントです。
以下の検索結果のみを根拠として、日本語で簡潔に回答してください。
検索結果に答えが無い場合は「規定に記載がありません」と答えてください。

$search_results$

6-3. API から呼び出す（CloudShell / boto3）

アプリに組み込む際は RetrieveAndGenerate API を使います。コンソール右上の CloudShell を開き、ナレッジベース ID（詳細画面に表示）を指定して実行します。

aws bedrock-agent-runtime retrieve-and-generate \ --region us-east-1 \ --input '{"text": "経費精算の締め日はいつですか？"}' \ --retrieve-and-generate-configuration '{ "type": "KNOWLEDGE_BASE", "knowledgeBaseConfiguration": { "knowledgeBaseId": "<あなたのKnowledgeBaseID>", "modelArn": "anthropic.claude-3-5-sonnet-20240620-v1:0" } }'

Python（boto3）で書くと以下のようになります。

import boto3

client = boto3.client("bedrock-agent-runtime", region_name="us-east-1")

resp = client.retrieve_and_generate(
    input={"text": "リモートワークは週何日まで？"},
    retrieveAndGenerateConfiguration={
        "type": "KNOWLEDGE_BASE",
        "knowledgeBaseConfiguration": {
            "knowledgeBaseId": "<あなたのKnowledgeBaseID>",
            "modelArn": "anthropic.claude-3-5-sonnet-20240620-v1:0",
        },
    },
)

print(resp["output"]["text"])
for c in resp.get("citations", []):
    for ref in c.get("retrievedReferences", []):
        print("出典:", ref["location"])

ℹ️ 2 つの API の使い分け

RetrieveAndGenerate：検索 + 回答生成までワンストップ。チャットボット向け。
Retrieve：関連チャンクの取得のみ。自前のプロンプト処理や別モデルと組み合わせたいとき。

✅ 確認ポイント

CloudShell / boto3 から回答テキストと出典（retrievedReferences）が取得できれば、アプリ組み込みの準備が整っています。

🧹 クリーンアップ

⚠️ 課金停止のため OpenSearch Serverless を必ず削除してください

このハンズオンで最も課金が継続するのは OpenSearch Serverless コレクションです。コレクションが残っている限り課金され続けるため、以下のクリーンアップを最後まで必ず実施してください。

削除手順（逆順で実施）

ナレッジベースを削除
Bedrock → ナレッジベース → company-policy-kb を選択 → 「削除」。
削除時に「関連付けられたベクトルストアも削除するか」の確認が出る場合は、削除対象に含めます。
OpenSearch Serverless コレクションを削除（最重要）
OpenSearch Service コンソール → 「サーバーレス」→「コレクション」→ Bedrock が作成したコレクション（bedrock-knowledge-base-...）を選択 → 「削除」。
併せて、自動生成された「セキュリティポリシー（暗号化 / ネットワーク）」「データアクセスポリシー」も残っていれば削除します。
S3 バケットを空にして削除
S3 → bedrock-kb-docs-<アカウントID> → 「空にする」→ その後「削除」。
IAM サービスロールを削除
IAM → ロール → Bedrock が作成したナレッジベース用ロール（AmazonBedrockExecutionRoleForKnowledgeBase_...）を削除。
（任意）モデルアクセスはそのままで可
モデルアクセスを有効化しているだけでは課金は発生しません。次回も使うなら無効化は不要です。

⚠️ 削除後の確認を忘れずに

OpenSearch Service → サーバーレス → コレクション一覧が空になっていることを必ず確認してください。コレクションが残っていると課金が続きます。

✅ クリーンアップ完了の確認

Bedrock → ナレッジベース一覧に company-policy-kb が無い
OpenSearch Service → サーバーレス → コレクション一覧が空
S3 → 対象バケットが削除済み
IAM → ナレッジベース用ロールが削除済み

学習のまとめ

習得したスキル	実践内容
Bedrock モデルアクセス	埋め込みモデル・生成モデルの有効化
RAG の構成理解	取り込み（埋め込み・格納）と検索（Retrieve and Generate）の 2 フロー
Knowledge Bases 構築	S3 データソース + Titan Embeddings + OpenSearch Serverless
データ同期	ドキュメントのチャンク化・ベクトル化・インデックス作成
根拠付き回答	引用元提示・ハルシネーション抑制の確認
API 連携	RetrieveAndGenerate / Retrieve API によるアプリ組み込み