创建AWS Bedrock知识库及填坑指南

前言

作者之前的关于Dify实践RAG系统的文章:用它搭建AI Agent原来这么简单!-CSDN博客,文末留了TODO:

“后面会对此RAG系统进行扩展和增强:

1)知识库同步自Web站点

2)链接外部知识库

3)将构建的RAG应用嵌入网页”

之前的博文完成了1),在研究2)的过程中,发现涉及内容较多,如创建AWS Bedrock知识库、构建后端API服务,今天先拆开单独讲解一下创建AWS Bedrock知识库。

AWS Bedrock是亚马逊云科技(AWS)在2023年推出的一项服务,它旨在帮助开发者更轻松地构建和管理现代化的应用程序。Bedrock提供了一种简化的方式来使用AWS的基础设施和服务,包括计算、存储、数据库和网络等核心功能,同时支持容器化应用和微服务架构。通过Bedrock,开发者可以更快地进行开发、部署和扩展应用程序,而无需深入了解底层的云基础设施细节。这使得开发者能够专注于业务逻辑和应用程序的创新,提高了开发效率和灵活性。

 一、注册AWS并添加IAM用户

进入

进入使用基础模型构建生成式人工智能应用程序 – Amazon Bedrock – AWS

若没有注册过亚马逊云(AWS),会要求注册。

注意:注册后的用户默认是root用户,但除了root 用户,还需要添加IAM user/role,不然在创建Bedrock Knowledge Base配置完成后会遇到如下错误:

添加IAM用户:

以root用户登录后,左上角搜索框中输入 IAM,点击出现的services里的“IAM” services进入:

右侧“users”->“create user”,进入后按下图配置:

这里要选中“access to the AWS Management Console”,并设置密码,因为之后切换为IAM user登录时需要。如果读者已创建了IAM账户,增加密码方法见后面【附录】1。

“next”进入权限配置:

权限按用户组管理,新建用户组时,赋予的policies选红框的名称即可。

按指示点击“next”,最后创建成功IAM用户。

二、配置并创建知识库

点击右上角用户名称,复制“account id”,然后登出root用户,以IAM用户登录,登录时要求的账户id填刚才复制的,用户名和密码填上面设置的。

访问https://us-east-1.console.aws.amazon.com/bedrock/home?region=us-east-1#/knowledge-bases,点击“create”,如下图选择

点击“Knowledge base with vector store”,进入如下步骤的配置:

Step1配置页:

按页面说明填每一项,有默认值用默认值就行,“数据源”选择web crawler(如下图):准备抓取一个在线网站的文档建立知识库。

“next”进入step2。

Step2配置页:

抓取网站的url我这里还是用了之前的dify文档中文网站:

其他按默认值就可,也可以根据页面说明适当修改。

Step3 配置页:

embedding模型选择:

其他按默认。

然后按提示点“next”,最后“save and create”就开化进行向量化存储、创建data source、创建service role了,最后完成知识库的创建。

service role完成最慢,过程中如果你离开了,之后查看完成情况的方法参考【附录】2。

【附录】

1、

root用户登录,按如下步骤进行:

  • 根账户有IAM权限的管理员账户登录AWS管理控制台。

  • 导航到 IAM 服务

  • 在左侧菜单中点击 用户 (Users)

  • 在用户列表中找到你的 asw 用户名,点击进入该用户详情页。

  • 切换到 安全凭证 (Security credentials) 标签页。

  • 向下滚动到 控制台密码 (Console password) 部分。

  • 点击 管理 (Manage) 或 分配密码 (Assign password)

  • 选择:

    • 自动生成密码:AWS会生成一个新密码。管理员必须将此密码安全地发送给你(比如通过安全的消息通道,切勿明文发邮件或聊天软件)。你首次登录时必须修改它

    • 自定义密码:管理员可以直接设置一个新密码并告知你。同样需要安全传递。

  • 点击 保存更改 (Save changes)

2、

查看方法

  • root用户登录

  • 导航到IAM服务: 在顶部搜索栏输入 IAM 并选择进入。

  • 查看角色列表

    • 在左侧导航菜单中,点击 Roles

    • 在角色列表上方的搜索框中,输入你的角色名称的一部分,例如 AmazonBedrockExecutionRoleForKnowledgeBase 或更精确的完整名称 AmazonBedrockExecutionRoleForKnowledgeBase_1vq65

  • 检查角色状态

    • 如果创建成功: 你会在列表中看到这个角色。点击角色名称可以查看其详细信息,包括信任关系(Trust relationships)和权限策略(Permissions policies)。

    • 如果创建失败: 这个角色不会出现在列表中(或者可能在状态栏显示为Failed)。创建失败是导致知识库创建过程卡在“Creating role...”提示的最常见原因。

    • 如果仍在创建中: 在IAM控制台的角色列表中可能还看不到它,或者状态可能显示为Creating(但通常这个过程应该比较快)。长时间卡住通常意味着最终会失败。

角色作用

这个自动创建的IAM角色 service role(AmazonBedrockExecutionRoleForKnowledgeBase_xxx) 是知识库的执行角色。它的核心作用是授予AWS Bedrock服务必要的权限,使其能够代表你执行与知识库相关的特定操作,主要是:

  • 访问你的数据源: 读取你配置在知识库中的源数据(通常是S3存储桶中的文件)。

  • 与向量存储交互:

    • 写入向量数据: 将知识库从源数据生成的向量嵌入(embeddings)写入你指定的向量数据库(如OpenSearch Serverless, Pinecone, Redis等)。

    • 读取向量数据: 在执行查询时,从向量数据库中检索相关信息。

  • 可能的基础模型调用权限: 在查询知识库时,Bedrock可能需要调用基础模型(如Titan Embeddings模型生成向量,或Claude模型处理查询结果),该角色可能包含执行这些bedrock:InvokeModel调用的权限(如果知识库配置需要的话)。

  • 日志记录权限: 将知识库的操作日志写入CloudWatch Logs。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。
如若转载,请注明出处:http://www.pswp.cn/diannao/88676.shtml
繁体地址,请注明出处:http://hk.pswp.cn/diannao/88676.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

Swift 变量

Swift 变量 在 Swift 编程语言中,变量是存储数据的基本方式。它们用于在程序的运行过程中保存和修改数据。理解 Swift 中的变量类型和用法对于编写高效、可维护的代码至关重要。 变量的定义 变量在 Swift 中是通过关键字 var 来定义的。定义变量时,需要指定变量存储的数据…

板凳-------Mysql cookbook学习 (十--9)

8.15 基于日期的摘要 Monday, June 23, 2025 mysql> use cookbook Database changed mysql> select trav_date,-> count(*) as number of drivers, sum(miles) as miles logged-> from driver_log group by trav_date; -----------------------------------------…

redis的scan使用详解,结合spring使用详解

Redis的SCAN命令是一种非阻塞的迭代器,用于逐步遍历数据库中的键,特别适合处理大数据库。下面详细介绍其使用方法及在Spring框架中的集成方式。 SCAN命令基础 SCAN命令的基本语法: SCAN cursor [MATCH pattern] [COUNT count]cursor&#…

Go 语言并发模式实践

在 Go 语言并发编程中,合理的并发模式能显著提升程序的可维护性和性能。本文将深入解析三种典型的并发模式实现,通过具体案例展示如何优雅地管理任务生命周期、资源池和工作 goroutine 池。 一、runner 模式:任务生命周期管理 在定时任务、…

【Java 开发日记】你会不会使用 SpringBoot 整合 Flowable 快速实现工作流呢?

目录 1、流程引擎介绍 2、创建项目 3、画流程图 4、开发接口 4.1 Java 类梳理 ProcessDefinition ProcessInstance Activity Execution Task 4.2 查看流程图 4.3 开启一个流程 4.4 将请求提交给组长 4.5 组长审批 4.6 经理审批 4.7 拒绝流程 1、流程引擎介绍 …

面试150 分发糖果

思路 联想贪心算法,遍历两次数组,一次是从左到右遍历,只比较右边孩子评分比左边打的情况。第二次从右到左遍历,只比较左边孩子评分比右边大的情况。最后求和即可 class Solution:def candy(self, ratings: List[int]) -> int…

csp基础之进制转换器

一、进制转换要明白的基础知识。。。 1、什么是进制? 进制也就是进位计数制,是人为定义的带进位的计数方法。对于任何一种进制 X 进制,就表示每一位置上的数运算时都是逢 X 进一位。十进制是逢十进一,十六进制是逢十六进一&#…

Zephyr OS蓝牙广播(Advertising)功能实现

目录 概述 1 Advertising功能介绍 1.1 实现原理 1.2 广播类型 1.3 广播数据格式 1.4 优化建议 1.5 常见问题和解决方法 2 Nordic 蓝牙广播(Advertising)功能实现 2.1 环境准备与SDK基础 2.2 广播功能实现 2.3 广播优化与最佳实践 3 实际应用案例…

服务器不支持PUT,DELETE 的解决方案

nginx 的更改: set $method $request_method; if ($http_X_HTTP_Method_Override ~* PUT|DELETE) { set $method $http_X_HTTP_Method_Override; } proxy_method $method; axios 的更改: const method config.me…

从0开始学习计算机视觉--Day04--线性分类

从宏观来看,卷积网络可以看做是由一个个不同的神经网络组件组合而成,就像积木一样通过不同类型的组件搭建形成,其中线性分类器是一个很重要的组件,在很多卷积网络中都有用到,所以了解清楚它的工作原理对我们后续的学习…

基于ComfyUI与Wan2.1模型的本地化视频生成环境搭建指南

文章目录 前言1.软件准备1.1 ComfyUI1.2 文本编码器1.3 VAE1.4 视频生成模型2.整合配置3. 本地运行测试4. 公网使用Wan2.1模型生成视频4.1 创建远程连接公网地址5. 固定远程访问公网地址总结前言 各位小伙伴们,今天我们将为您展示一套创新的人工智能应用方案!本次教程将指导…

Vue 2 项目中内嵌 md 文件

推荐方案:raw-loader marked 解析 Markdown 第一步:安装依赖 npm install marked --save npm install raw-loader --save-dev第二步:配置 webpack 支持 .md 文件 打开 vue.config.js 或 webpack.config.js,添加以下配置&#…

Spring AI初识及简单使用,快速上手。

Spring AI简介 在当今这样一个快速发展的技术时代,人工智能(AI)已经成为各行各业的一种标配。而作为一款主流的Java应用开发框架Spring,肯定会紧跟时代的潮流,所以,推出了Spring AI框架。 官网描述&#…

Flask中的render_template与make_response:生动解析与深度对比

文章目录 Flask中的render_template与make_response:生动解析与深度对比一、🌟 核心概念速览二、� render_template - 网页内容的主厨特点与内部机制适用场景高级用法示例 三、🎁 make_response - 响应的包装专家核心功能解析适用…

WordPress目录说明

在WordPress建站过程中,理解服务器目录结构是非常重要的。以下是一个基础的WordPress服务器目录指南: /wp-admin/ :这个目录包含了WordPress网站的所有管理功能,包括用于处理网站后台的所有PHP文件。 /wp-includes/ :…

HTTP面试题——缓存技术

目录 HTTP缓存技术有哪些? 什么是强制缓存? 什么是协商缓存? HTTP缓存技术有哪些? 对于一些具有重复性的HTTP请求,比如每次请求得到的数据都是一样的,我们可以把这对 请求-响应的数据都缓存在本地&#x…

virtual box 不能分配 USB设备 IFX DAS JDS TriBoard TC2X5 V2.0 [0700] 到虚拟电脑 win10

VirtualBox: Failed to attach the USB device to the virtual machine – Bytefreaks.net ISSUE: virtual box 不能分配 USB设备 IFX DAS JDS TriBoard TC2X5 V2.0 [0700] 到虚拟电脑 win10. USB device IFX DAS JDS TriBoard TC2X5 V2.0 with UUID {91680aeb-e1…

Deepoc大模型重构核工业智能基座:混合增强架构与安全增强决策技术​

面向复杂系统的高可靠AI赋能体系构建 Deepoc大模型通过多维度技术突破&#xff0c;显著提升核工业知识处理与决策可靠性。经核能行业验证&#xff0c;其生成内容可验证性提升68%&#xff0c;关键参数失真率<0.3%&#xff0c;形成覆盖核能全链条的定制化方案&#xff0c;使企…

第12章:冰箱里的CT扫描仪——计算机视觉如何洞穿食材的“生命密码“

第11章:冰箱里的CT扫描仪——计算机视觉如何成为食材健康的"超级诊断官" “糟了!冰箱里草莓长出了白色绒毛,鸡胸肉渗出了可疑的粉红色液体!” 这揭示了厨房生存的更基本挑战:如何像经验丰富的主厨一样,一眼洞穿食材的健康密码? 本章将揭示计算机视觉技术如何赋…

虚幻基础:窗口——重定向

能帮到你的话&#xff0c;就给个赞吧 &#x1f618; 文章目录 重定向&#xff1a;给骨架添加兼容骨架。使得不同模型间复用动画资源 重定向&#xff1a;给骨架添加兼容骨架。使得不同模型间复用动画资源