吴恩达MCP课程(1):chat_bot

原课程代码是用Anthropic写的,下面代码是用OpenAI改写的,模型则用阿里巴巴的模型做测试
.env 文件为:

OPENAI_API_KEY=sk-xxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxx
OPENAI_API_BASE=https://dashscope.aliyuncs.com/compatible-mode/v1

完整代码

import arxiv
import json
import os
from typing import List
from dotenv import load_dotenv
import openaiPAPER_DIR = "papers"def search_papers(topic: str, max_results: int = 5) -> List[str]:"""Search for papers on arXiv based on a topic and store their information.Args:topic: The topic to search formax_results: Maximum number of results to retrieve (default: 5)Returns:List of paper IDs found in the search"""# Use arxiv to find the papersclient = arxiv.Client()# Search for the most relevant articles matching the queried topicsearch = arxiv.Search(query = topic,max_results = max_results,sort_by = arxiv.SortCriterion.Relevance)papers = client.results(search)# Create directory for this topicpath = os.path.join(PAPER_DIR, topic.lower().replace(" ", "_"))os.makedirs(path, exist_ok=True)file_path = os.path.join(path, "papers_info.json")# Try to load existing papers infotry:with open(file_path, "r") as json_file:papers_info = json.load(json_file)except (FileNotFoundError, json.JSONDecodeError):papers_info = {}# Process each paper and add to papers_infopaper_ids = []for paper in papers:paper_ids.append(paper.get_short_id())paper_info = {'title': paper.title,'authors': [author.name for author in paper.authors],'summary': paper.summary,'pdf_url': paper.pdf_url,'published': str(paper.published.date())}papers_info[paper.get_short_id()] = paper_info# Save updated papers_info to json filewith open(file_path, "w") as json_file:json.dump(papers_info, json_file, indent=2)print(f"Results are saved in: {file_path}")return paper_idsdef extract_info(paper_id: str) -> str:"""Search for information about a specific paper across all topic directories.Args:paper_id: The ID of the paper to look forReturns:JSON string with paper information if found, error message if not found"""for item in os.listdir(PAPER_DIR):item_path = os.path.join(PAPER_DIR, item)if os.path.isdir(item_path):file_path = os.path.join(item_path, "papers_info.json")if os.path.isfile(file_path):try:with open(file_path, "r") as json_file:papers_info = json.load(json_file)if paper_id in papers_info:return json.dumps(papers_info[paper_id], indent=2)except (FileNotFoundError, json.JSONDecodeError) as e:print(f"Error reading {file_path}: {str(e)}")continuereturn f"There's no saved information related to paper {paper_id}."tools = [{"type": "function","function": {"name": "search_papers","description": "Search for papers on arXiv based on a topic and store their information","parameters": {"type": "object","properties": {"topic": {"type": "string","description": "The topic to search for"},"max_results": {"type": "integer","description": "Maximum number of results to retrieve","default": 5}},"required": ["topic"]}}},{"type": "function","function": {"name": "extract_info","description": "Search for information about a specific paper across all topic directories","parameters": {"type": "object","properties": {"paper_id": {"type": "string","description": "The ID of the paper to look for"}},"required": ["paper_id"]}}}
]mapping_tool_function = {"search_papers": search_papers,"extract_info": extract_info
}def execute_tool(tool_name, tool_args):result = mapping_tool_function[tool_name](**tool_args)if result is None:result = "The operation completed but didn't return any results."elif isinstance(result, list):result = ', '.join(result)elif isinstance(result, dict):# Convert dictionaries to formatted JSON stringsresult = json.dumps(result, indent=2)else:# For any other type, convert using str()result = str(result)return resultload_dotenv()
client = openai.OpenAI(api_key = os.getenv("OPENAI_API_KEY"),base_url= os.getenv("OPENAI_API_BASE")
) def process_query(query):messages = [{"role": "user", "content": query}]response = client.chat.completions.create(model="qwen-turbo",  # 或其他OpenAI模型max_tokens=2024,tools=tools,messages=messages)process_query = Truewhile process_query:# 获取助手的回复message = response.choices[0].message# 检查是否有普通文本内容if message.content:print(message.content)process_query = False# 检查是否有工具调用elif message.tool_calls:# 添加助手消息到历史messages.append({"role": "assistant", "content": None,"tool_calls": message.tool_calls})# 处理每个工具调用for tool_call in message.tool_calls:tool_id = tool_call.idtool_name = tool_call.function.nametool_args = json.loads(tool_call.function.arguments)print(f"Calling tool {tool_name} with args {tool_args}")# 执行工具调用result = execute_tool(tool_name, tool_args)# 添加工具结果到消息历史messages.append({"role": "tool","tool_call_id": tool_id,"content": result})# 获取下一个回复response = client.chat.completions.create(model="qwen-turbo",  # 或其他OpenAI模型max_tokens=2024,tools=tools,messages=messages)# 如果只有文本回复,则结束处理if response.choices[0].message.content and not response.choices[0].message.tool_calls:print(response.choices[0].message.content)process_query = Falsedef chat_loop():print("Type your queries or 'quit' to exit.")while True:try:query = input("\nQuery: ").strip()if query.lower() == 'quit':breakprocess_query(query)print("\n")except Exception as e:print(f"\nError: {str(e)}")if __name__ == "__main__":chat_loop()

代码解释

导入模块

import arxiv        # 用于访问arXiv API搜索论文
import json         # 处理JSON数据
import os           # 操作系统功能,如文件路径处理
from typing import List  # 类型提示
from dotenv import load_dotenv  # 加载环境变量
import openai       # OpenAI API客户端

核心功能函数

1. search_papers 函数

这个函数用于在arXiv上搜索特定主题的论文并保存信息:

def search_papers(topic: str, max_results: int = 5) -> List[str]:
  • 参数
    • topic: 要搜索的主题
    • max_results: 最大结果数量(默认5个)
  • 返回值:找到的论文ID列表

功能流程

  1. 创建arXiv客户端
  2. 按相关性搜索主题相关论文
  3. 为该主题创建目录(如papers/machine_learning
  4. 尝试加载已有的论文信息(如果存在)
  5. 处理每篇论文,提取标题、作者、摘要等信息
  6. 将论文信息保存到JSON文件中
  7. 返回论文ID列表
2. extract_info 函数

这个函数用于在所有主题目录中搜索特定论文的信息:

def extract_info(paper_id: str) -> str:
  • 参数paper_id - 要查找的论文ID
  • 返回值:包含论文信息的JSON字符串(如果找到),否则返回错误信息

功能流程

  1. 遍历papers目录下的所有子目录
  2. 在每个子目录中查找papers_info.json文件
  3. 如果找到文件,检查是否包含指定的论文ID
  4. 如果找到论文信息,返回格式化的JSON字符串
  5. 如果未找到,返回未找到的提示信息

工具定义

tools = [...]

定义了两个函数工具,用于OpenAI API的工具调用:

  1. search_papers - 搜索论文
  2. extract_info - 提取论文信息

每个工具都定义了名称、描述和参数规范。

工具执行函数

def execute_tool(tool_name, tool_args):

这个函数负责执行指定的工具函数,并处理返回结果:

  • 将None结果转换为提示信息
  • 将列表结果转换为逗号分隔的字符串
  • 将字典结果转换为格式化的JSON字符串
  • 其他类型转换为字符串

OpenAI客户端初始化

load_dotenv()
client = openai.OpenAI(api_key = os.getenv("OPENAI_API_KEY"),base_url= os.getenv("OPENAI_API_BASE")
)

从环境变量加载API密钥和基础URL,初始化OpenAI客户端。

查询处理函数

def process_query(query):

这个函数处理用户的查询:

  1. 创建包含用户查询的消息列表
  2. 调用OpenAI API创建聊天完成
  3. 处理助手的回复:
    • 如果有普通文本内容,直接打印
    • 如果有工具调用,执行工具并将结果添加到消息历史
  4. 如果执行了工具调用,获取下一个回复
  5. 如果最终回复只有文本,打印并结束处理

聊天循环函数

def chat_loop():

这个函数实现了一个简单的聊天循环:

  1. 提示用户输入查询或输入’quit’退出
  2. 处理用户的查询
  3. 捕获并显示任何错误

主程序

if __name__ == "__main__":chat_loop()

当脚本直接运行时,启动聊天循环。

总结

这个脚本实现了一个基于OpenAI API的聊天机器人,它可以:

  1. 搜索arXiv上的论文并保存信息
  2. 提取已保存的论文信息
  3. 通过OpenAI API处理用户查询
  4. 支持工具调用功能,实现与arXiv的交互

运行示例

目录结构
在这里插入图片描述

运行结果
在这里插入图片描述
在这里插入图片描述

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.pswp.cn/diannao/85270.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

Netty 实战篇:手写一个轻量级 RPC 框架原型

本文将基于前文实现的编解码与心跳机制,构建一个简单的 RPC 框架,包括请求封装、响应解析、动态代理调用。为打造微服务通信基础打下基础。 一、什么是 RPC? RPC(Remote Procedure Call,远程过程调用)允许…

边缘计算新基建:iVX 轻量生成模块的 ARM 架构突围

一、引言 随着工业 4.0 和物联网的快速发展,边缘计算作为连接云端与终端设备的关键技术,正成为推动数字化转型的核心力量。在边缘计算场景中,设备的实时性、低功耗和离线处理能力至关重要。ARM 架构凭借其低功耗、高能效的特点,成…

C# 基于 Windows 系统与 Visual Studio 2017 的 Messenger 消息传递机制详解:发布-订阅模式实现

🧑 博主简介:CSDN博客专家、CSDN平台优质创作者,高级开发工程师,数学专业,10年以上C/C, C#, Java等多种编程语言开发经验,拥有高级工程师证书;擅长C/C、C#等开发语言,熟悉Java常用开…

js数据类型有哪些?它们有什么区别?

js数据类型共有8种,分别是undefined,null,boolean,number,string,Object,symbol,bigint symbol和bigint是es6中提出来的数据类型 symbol创建后独一无二不可变的数据类型,它主要是为了解决出现全局变量冲突的问题 bigint 是一种数字类型的数据,它可以表示任意精度格式的整数,…

Vite打包优化实践:从分包到性能提升

前言: ​​​​​​​ 随着前端应用功能的增加,项目的打包体积也会不断膨胀,影响加载速度和用户体验。本文介绍了几种常见的打包优化策略,通过Vite和相关插件,帮助减少项目体积、提升性能,优化加载速度。 rollup-plugi…

C++语法系列之模板进阶

前言 本次会介绍一下非类型模板参数、模板的特化(特例化)和模板的可变参数&#xff0c;不是最开始学的模板 一、非类型模板参数 字面意思,比如&#xff1a; template<size_t N 10> 或者 template<class T,size_t N 10>比如&#xff1a;静态栈就可以用到&#…

html5的响应式布局的方法示例详解

以下是HTML5实现响应式布局的5种核心方法及代码示例: 1. 媒体查询(核心方案) /* 默认样式(移动优先) */ .container {padding: 15px; }/* 中等屏幕(平板) */ @media (min-width: 768px) {.container {padding: 30px;max-width: 720px;} }/* 大屏幕(桌面) */ @media …

数字化转型进阶:精读41页华为数字化转型实践【附全文阅读】

该文档聚焦华为数字化转型实践&#xff0c;核心内容如下&#xff1a; 转型本质与目标&#xff1a;数字化转型是通过数字技术穿透业务&#xff0c;实现物理世界与数字世界的融合&#xff0c;目标是支撑主业成功、提升体验与效率、探索模式创新。华为以 “平台 服务” 为核心&am…

C++ - STL #什么是STL #STL的版本 #闭源开源 #STL的六大组件

文章目录 前言 一、什么是STL 二、STL的版本 1、原始版本 2、P.J.版本 3、RW版本 4、SGI版本 三、闭源、开源 四、STL的六大组件 总结 前言 路漫漫其修远兮&#xff0c;吾将上下而求索&#xff1b; 一、什么是STL STL(standard template libaray 标准模板库)&#…

智慧康养护理:科技重塑老龄化社会的健康守护体系

在我国迈入深度老龄化社会的背景下&#xff0c;智慧康养护理作为融合科技与人文的创新模式&#xff0c;正成为提升老年人生活质量、减轻家庭照护压力、促进健康老龄化的重要路径。我们将从核心概念、关键技术、实际应用与未来趋势四个维度&#xff0c;为您呈现智慧康养护理的全…

权威认证与质量保障:第三方检测在科技成果鉴定测试中的核心作用

科技成果鉴定测试是衡量科研成果技术价值与应用潜力的关键环节&#xff0c;其核心目标在于通过科学验证确保成果的可靠性、创新性和市场适配性。第三方检测机构凭借其独立性、专业性和权威性&#xff0c;成为科技成果鉴定测试的核心支撑主体。本文从测试流程、第三方检测的价值…

Linux.docker.k8s基础概念

1.Linux基本命令 cat 查看文件内容。 cd 进入目标目录。 ll 查询当前路劲下文件的详细信息。 ls 查询当前路劲下的文件。 touch 建立一个文件。 mkdir 建立一个文件夹。 rm 删除文件或者目录。 mv 移动目录和重新命名文件。 unzip 解压。 top 查看当前线程的信息。 find …

Python小白的蜕变之旅:从环境搭建到代码规范(1/10)

摘要&#xff1a;全文围绕 Python 编程展开&#xff0c;先是介绍如何搭建 Python 开发环境&#xff0c;推荐使用 Anaconda 和 VSCode&#xff0c;并详细说明了二者的安装及配置步骤&#xff0c;包括安装 Anaconda、安装 VSCode 并配置 Python 插件、选择 Anaconda 的 Python 解…

linux 1.0.7

用户和权限的含义与作用 linux中的用户和文件 用户的权限是非常重要的 而且有些程序需要使用管理员身份去执行 这些都是非常重要的 不可能让所有的人拥有所有的权限 这样的工具可以避免非法的手段来修改计算机中的数据 linux之所以安全还是权限管理做的很棒 每个登录的用户都有…

【第4章 图像与视频】4.6 结合剪辑区域来绘制图像

文章目录 前言示例 前言 本节将综合运用图像处理、离屏 canvas 以及剪辑区域等技术实现墨镜效果。 示例 主线程代码&#xff1a; <!DOCTYPE html> <html lang"en"><head><meta charset"UTF-8" /><meta name"viewport&qu…

UV 包管理工具:替代 pip 的现代化解决方案

安装 方法一&#xff1a;使用安装脚本 # macOS 和 Linux curl -LsSf https://astral.sh/uv/install.sh | sh# Windows PowerShell powershell -c "irm https://astral.sh/uv/install.ps1 | iex" 方法二&#xff1a;使用包管理器 # macOS (Homebrew) brew install uv#…

Java注解规范与使用详解

注解中的空值限制 在Java注解中,元素值不允许使用null引用。这是注解使用中的一项重要约束规则,违反该规则将导致编译错误。需要注意的是,虽然禁止使用null值,但允许为String类型元素指定空字符串(“”),为数组类型元素指定空数组({})。 空值约束示例 以下两种注解用法…

从零开始的数据结构教程(八)位运算与状态压缩

&#x1f3a9; 标题一&#xff1a;位运算基础——魔术师的二进制手套 位运算是一种直接操作数字二进制位的运算方式&#xff0c;它高效且巧妙&#xff0c;就像魔术师戴上了二进制手套&#xff0c;能够精准地操控每一个比特。理解位运算是深入学习状态压缩和其他底层优化技巧的…

GraalVM加持下的Quarkus极速启动

1. 引言 1.1 Quarkus与云原生时代的挑战 随着云原生架构的普及,传统Java应用在部署效率、资源消耗和冷启动性能方面逐渐暴露出短板。Spring Boot等框架虽然功能强大,但在Serverless、边缘计算等场景下表现乏力。 Quarkus 是 Red Hat 推出的一个专为云原生设计的 Java/Kotl…

vue3 el-input type=“textarea“ 字体样式 及高度设置

在Vue 3中&#xff0c;如果你使用的是Element Plus库中的<el-input>组件作为文本域&#xff08;type"textarea"&#xff09;&#xff0c;你可以通过几种方式来设置字体样式和高度。 1. 直接在<el-input>组件上使用style属性 你可以直接在<el-input&…