Qwen3-Coder:介绍及使用 -- 超强AI编程助手


更多内容:XiaoJ的知识星球


目录

  • 一、Qwen3-Coder模型介绍
    • 1.预训练阶段(Pre-Training)
    • 2.后训练阶段(Post-Training)
      • 1)Scaling Code RL: Hard to Solve, Easy to Verify
      • 2)Scaling Long-Horizon RL
  • 二、Qwen3-Coder模型使用
    • 1. Web中使用Qwen3-Coder:ChatQwenAI
    • 2. Windows中使用Qwen3-Coder:VSCode+cline
      • 1)获取API Key
      • 2)安装cline插件
      • 3)配置Qwen3-coder
    • 3. Linux中使用Qwen3-Coder:Qwen Code CLI工具
      • 1)环境安装
        • (1)安装Node.js
        • (2)安装Qwen Code CLI
      • 2)API 配置
        • (1)获取API Key
        • (2)设置环境变量:API和模型
      • 3)使用Qwen Code CLI
        • (1)运行Qwen Code CLI
        • (2)使用Qwen Code CLI


.

本文将介绍内容:

  • Qwen3-Coder模型介绍

  • Qwen3-Coder不同平台上使用

.

一、Qwen3-Coder模型介绍

阿里发布的 Qwen3-Coder 系列最强版本:Qwen3-Coder-480B-A35B-Instruct。该模型为 480B 总参数、35B 激活的 MoE 架构,原生支持 256K 上下文,可通过 YaRN 扩展至 1M token。在 Agentic Coding、Browser-Use 和 Tool-Use 上达到开源模型 SOTA,媲美 Claude Sonnet4。
在这里插入图片描述.

1.预训练阶段(Pre-Training)

Qwen3-Coder 在不同角度进行扩展,以提升模型的代码能力:

  • 数据扩展:总计 7.5T(代码占比 70%),在保持通用与数学能力的同时,具备卓越的编程能力;

  • 上下文扩展:原生支持 256K 上下文,借助 YaRN 可拓展至 1M,专为仓库级和动态数据(如 Pull Request,拉取请求)优化,助力 Agentic Coding(代理式编程);

  • 合成数据扩展:利用 Qwen2.5-Coder 对低质数据进行清洗与重写,显著提升整体数据质量

YaRN(Yet another RoPE extension method,通常指对 RoPE 的改进)是一种上下文长度扩展技术,用于让原本训练在较短上下文上的模型,能够高效支持更长的输入。

  • 原生 RoPE(Rotary Position Embedding)限制了模型处理的最长上下文(如 32K、64K);
  • YaRN 通过对位置编码进行重加权和插值,在不重新预训练的前提下,将上下文扩展到 1M token,同时保持生成质量。

.

2.后训练阶段(Post-Training)

1)Scaling Code RL: Hard to Solve, Easy to Verify

在这里插入图片描述

与当前社区普遍聚焦于竞赛类代码生成不同,Qwen3-Coder关注的代码任务在于执行驱动的大规模强化学习上。因此选择在更丰富的真实代码任务上扩展 Code RL(Reinforcement Learning,强化学习) 训练。

通过自动扩展测试样例,构建了大量高质量训练数据,成功释放了强化学习的潜力:不仅显著提升了代码执行成功率,还对其他任务带来了增益。这将激励继续寻找“难解但易验证(Hard to Solve, Easy to Verify)”的任务,作为强化学习的理想场景。

2)Scaling Long-Horizon RL

在这里插入图片描述

在真实软件工程任务(如 SWE-Bench)中,模型需自主规划、调用工具、多轮交互并持续决策,属于典型的长周期强化学习Long-Horizon RL) 任务。为此,在 Qwen3-Coder 的后训练中引入 Agent RL,鼓励模型通过多轮交互使用工具解决问题。

主要挑战是环境扩展(Environment Scaling),我们构建了可验证的扩展系统,依托阿里云基础设施,支持同时运行 20,000 个独立环境,实现大规模强化学习训练与自动评测。

最终,Qwen3-Coder 在 SWE-bench Verified 上达到开源模型 SOTA 水平。

.

二、Qwen3-Coder模型使用

下面展示在不同平台使用Qwen模型,以使用Qwen3-Coder模型为例。

.

1. Web中使用Qwen3-Coder:ChatQwenAI

进入ChatQwenAI网页:https://chat.qwen.ai/

左上角选择模型Qwen3-Coder即可使用。

.

2. Windows中使用Qwen3-Coder:VSCode+cline

使用Qwen3-Coder模型,可以通过VSCode安装cline插件来实现,以下是具体步骤:

1)获取API Key

  • 中国大陆用户,请前往 https://bailian.console.aliyun.com/ 或 https://modelscope.cn/docs/model-service/API-Inference/intro 申请 API 密钥

  • 非中国大陆用户,请前往 https://modelstudio.console.alibabacloud.com/ 申请 API 密钥

我参考了阿里云百炼–API认证获取:https://bailian.console.aliyun.com/?tab=api#/api 进行认证获取API Key。

2)安装cline插件

  • 安装VSCode:打开https://code.visualstudio.com下载安装。

  • 安装cline:打开VSCode,进入扩展商店(Ctrl/Cmd+Shift+X),搜索“cline”安装。

  • 登录cline:点击"Get Started for Free",跳转到谷歌邮箱登录网页进行登录。

3)配置Qwen3-coder

  • 打开cline设置:点击VSCode左侧cline图标,点击设置按钮(齿轮图标)。

  • 选择模型类型:API Provider 选择“OpenAI Compatible”。

  • 配置模型api:设置内容 Base URL(阿里API地址)、OpenAl Compatible API Key(阿里API Key)、Model ID(模型名称)。

  • 保存设置:点击 “Done” ,即可在VSCode中使用Qwen3-coder。

配置示例:

# 打开cline设置# API Provider
OpenAI Compatible# Base URL
https://dashscope.aliyuncs.com/compatible-mode/v1
# OpenAl Compatible API Key
<you api key>
# Model ID
qwen3-coder-plus# 点击 "Done" 保存即可使用

以上配置完成后,就可以在VSCode的cline插件中使用qwen3-coder-plus模型了,其他qwen模型,只需要更换Model ID为模型名即可使用。

.

3. Linux中使用Qwen3-Coder:Qwen Code CLI工具

下面将介绍,在Linux中安装Qwen Code CLI调用Qwen3-Coder模型。构建你的AI编程助手。

Qwen Code 是一款改编自 Gemini CLI 的命令行 AI 工作流工具(更多详细信息,请参阅本文档),针对 Qwen3-Coder 模型进行了优化,并增强了解析器支持和工具支持。

1)环境安装

(1)安装Node.js

Qwen Code 要求 Node.js 版本 >= 20

安装或升级 Node.js:使用 nvm 管理,环境变量可以添加到~/.bashrc中永久生效。

# 安装nvm
curl -o install_nvm.sh https://raw.githubusercontent.com/nvm-sh/nvm/v0.39.7/install.sh
bash install_nvm.sh# 生效nvm环境
export NVM_DIR="$HOME/.nvm"
source "$NVM_DIR/nvm.sh"# 安装Node.js 20
nvm install 20
nvm use 20

验证是否安装成功:

node -v
npm -v
(2)安装Qwen Code CLI

安装:(运行时执行qwen即可)

# 方式 1:全局安装(推荐)
npm install -g @qwen-code/qwen-code# 方式 2:源码安装(可选)
git clone https://github.com/QwenLM/qwen-code.git
cd qwen-code
npm install
npm install -g .

验证是否安装成功:

qwen --version

2)API 配置

设置您的 Qwen API 密钥(在 Qwen Code 项目中,您也可以在 .env 文件中设置您的 API 密钥)。.env 文件应放置在当前项目的根目录中。

(1)获取API Key
  • 中国大陆用户,请前往 https://bailian.console.aliyun.com/ 或 https://modelscope.cn/docs/model-service/API-Inference/intro 申请 API 密钥

  • 非中国大陆用户,请前往 https://modelstudio.console.alibabacloud.com/ 申请 API 密钥

我参考了阿里云百炼–API认证获取:https://bailian.console.aliyun.com/?tab=api#/api 进行认证获取API Key。

(2)设置环境变量:API和模型

中国大陆,可以通过阿里云百炼平台使用Qwen3-Coder。

export OPENAI_API_KEY="your_api_key_here"
export OPENAI_BASE_URL="https://dashscope.aliyuncs.com/compatible-mode/v1"
export OPENAI_MODEL="qwen3-coder-plus"

中国大陆,ModelScope 每天提供 2,000 次免费模型推理 API 调用

export OPENAI_API_KEY="your_api_key_here"
export OPENAI_BASE_URL="https://api-inference.modelscope.cn/v1"
export OPENAI_MODEL="Qwen/Qwen3-Coder-480B-A35B-Instruct"

非中国大陆,可以通过阿里云modelstuido平台使用Qwen3-Coder。

export OPENAI_API_KEY="your_api_key_here"
export OPENAI_BASE_URL="https://dashscope-intl.aliyuncs.com/compatible-mode/v1"
export OPENAI_MODEL="qwen3-coder-plus"

3)使用Qwen Code CLI

(1)运行Qwen Code CLI
# 进入安装目录运行qwen
cd your-path/qwen-code
qwen

如果前面没设置API Key和模型变量,这里同样可以设置:

 API Key: <your_api_key>                                                              Base URL: <your_base_url>     Model: "qwen3-coder-plus"   # 或其他模型名
(2)使用Qwen Code CLI

出现以下内容,即可通过在命令行输入问题,使用Qwen Code CLI进行交互了。

██╗       ██████╗ ██╗    ██╗███████╗███╗   ██╗
╚██╗     ██╔═══██╗██║    ██║██╔════╝████╗  ██║╚██╗    ██║   ██║██║ █╗ ██║█████╗  ██╔██╗ ██║██╔╝    ██║▄▄ ██║██║███╗██║██╔══╝  ██║╚██╗██║
██╔╝     ╚██████╔╝╚███╔███╔╝███████╗██║ ╚████║
╚═╝       ╚══▀▀═╝  ╚══╝╚══╝ ╚══════╝╚═╝  ╚═══╝Tips for getting started:
1. Ask questions, edit files, or run commands.
2. Be specific for the best results.
3. /help for more information.Using 1 QWEN.md file
╭─────────────────────────────────────────────────────────────────────────────────────────────╮
│ >   Type your message or @path/to/file                                                      |
╰─────────────────────────────────────────────────────────────────────────────────────────────╯~/qwen-code  no sandbox (see  qwen3-coder-plus (100% context left|1 error (ctrl+o for
(main*)                       /docs)                                                    details)

简单示例:输入问题“qwen3-coder-plus是一个什么类型的模型?”


╭────────────────────────────────────────────╮
│  > qwen3-coder-plus是一个什么类型的模型?  │
╰────────────────────────────────────────────╯✦ qwen3-coder-plus 是阿里巴巴通义千问系列中的一个代码生成模型。它是 qwen3 系列模型的增强版本,专门针对代码生成任务进行了优化和加强。相比基础版本,它可能在代码理解、多语言支持、复杂逻辑推理以及生成代码的质量和准确性方面有显著提升。如果你正在使用或开发基于该模型的应用,可以告诉我具体的需求或问题,我会尽力提供帮助。Using 1 QWEN.md file
╭──────────────────────────────────────────────────────────╮
│ >   Type your message or @path/to/file                   │
╰──────────────────────────────────────────────────────────╯

声明:资源可能存在第三方来源,若有侵权请联系删除!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。
如若转载,请注明出处:http://www.pswp.cn/bicheng/91199.shtml
繁体地址,请注明出处:http://hk.pswp.cn/bicheng/91199.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

uniapp 如果进入页面输入框自动聚焦,此时快速返回页面或者跳转到下一个页面,输入法顶上来的页面出现半屏的黑屏问题。

如果进入页面输入框自动聚焦&#xff0c;此时快速返回页面或者跳转到下一个页面&#xff0c;输入法顶上来的页面出现半屏的黑屏问题。输入法出来后&#xff0c;设置了自动将页面顶上来的配置&#xff1a;pages.json"softinputMode": "adjustResize""g…

深入了解 Kubernetes(k8s):从概念到实践

目录 一、k8s 核心概念 二、k8s 的优势 三、k8s 架构组件 控制平面组件 节点组件 四、k8s docker 运行前后端分离项目的例子 1. 准备前端项目 2. 准备后端项目 3. 创建 k8s 部署配置文件 4. 部署应用到 k8s 集群 在当今云计算和容器化技术飞速发展的时代&#xff0c…

Android User版本默认用test-keys,如何改用release-keys

Android User版本 默认用test-keys&#xff0c; 如何改用release-keys 开发云 - 一站式云服务平台 --- build/core/Makefile | 5 1 file changed, 5 insertions() diff --git a/build/core/Makefile b/build/core/Makefile index --- a/build/core/Makefile b/build/core…

从零开始学习Dify-数据库数据可视化(五)

概述上一篇文章我们围绕 Excel 文件展开数据可视化教学&#xff0c;逐步掌握了数据导入、图表构建和 AI 智能分析。在实际业务环境中&#xff0c;很多数据并不是保存在表格中&#xff0c;而是存储于数据库系统中&#xff0c;尤其是最常见的 MySQL。本篇作为本系列的第五篇&…

使用vue2和 element-ui 做一个点餐收银台系统前端静态项目

今天给大家分享一个 关于点餐收银台的静态网站&#xff0c;最近一直在练习前端项目&#xff0c;就使用vue2和 element-ui 做了一个 这样简单的 收银台系统。先给大家看一下 做出来的样子。 因为是练习项目 所以页面功能还是比较简单的。 使用的技术是&#xff1a; 技术栈 Vu…

Spring Boot自动配置原理深度解析

Spring Boot自动配置原理深度解析 一、自动配置核心概念 1.1 什么是自动配置 Spring Boot自动配置(Auto-Configuration)是其核心特性之一&#xff0c;能够根据项目依赖自动配置Spring应用程序。例如&#xff1a; 当检测到H2数据库依赖时&#xff0c;自动配置内存数据库当存在Sp…

关于 Apache Ignite 中 Job 调度(Job Scheduling)与冲突控制(Collision Control) 的机制说明

这段内容是关于 Apache Ignite 中 Job 调度&#xff08;Job Scheduling&#xff09;与冲突控制&#xff08;Collision Control&#xff09; 的机制说明。我来为你逐段解析&#xff0c;帮助你深入理解其原理和使用方式。&#x1f50d; 一、核心概念&#xff1a;Job 调度与 Colli…

网络资源模板--基于Android Studio 实现的课程管理App

目录 一、测试环境说明 二、项目简介 三、项目演示 四、部设计详情&#xff08;部分) 登录页 首页 五、项目源码 一、测试环境说明 电脑环境 Windows 11 编写语言 JAVA 开发软件 Android Studio (2020) 开发软件只要大于等于测试版本即可(近几年官网直接下载也可…

ROUGE-WE:词向量化革新的文本生成评估框架

一、ROUGE 基础与核心局限 ROUGE&#xff08;Recall-Oriented Understudy for Gisting Evaluation&#xff09; 是自动文本摘要与机器翻译的主流评估指标&#xff0c;由 Chin-Yew Lin 在2004年发表的论文中首次系统提出。其核心变体包括&#xff1a; ROUGE-N&#xff1a;基于…

MGER综合实验

一.拓扑二、实验需求 1、R5为ISP&#xff0c;只能进行IP地址配置&#xff0c;其所有地址均配为公有IP地址; 2、R1和R5间使用PPP的PAP认证&#xff0c;R5为主认证方; R2与R5之间使用ppp的CHAP认证&#xff0c;R5为主认证方; R3与R5之间使用HDLC封装; 3、R1、R2、R3构建一个MGRE环…

高可用集群Keepalived、Redis、NoSQL数据库Redis基础管理

1. 总结负载均衡常见的算法 轮询 (Round Robin)&#xff1a;按顺序将请求依次分配给后端服务器&#xff0c;适合服务器性能相近的场景。 加权轮询 (Weighted Round Robin)&#xff1a;在轮询的基础上&#xff0c;根据服务器的权重分配请求。 随机 (Random)&#xff1a;随机选…

【深度学习】独热编码(One-Hot Encoding)

独热编码&#xff08;One-Hot Encoding&#xff09; 在机器学习中&#xff0c;数据预处理是不可或缺的关键一步。面对各种非数值类型的分类数据&#xff08;Categorical Data&#xff09;&#xff0c;如何将其转换为机器学习模型能够“理解”的语言呢&#xff1f;独热编码&…

Promise完全体总结

我们在上篇文章提到了异步会导致无法通过返回值来获取函数的执行结果&#xff0c;我们通过传入一个回调函数的方式&#xff0c;以参数的形式获取到了我们想要获取的数据&#xff0c;但是这样如果需要对数据进行多次操作导致形成回调地狱那种不便于阅读以及护理的代码。为了解决…

SpringJDBC源码初探-DataSource类

一、DataSource接口核心作用 DataSource是JDBC规范的核心接口&#xff0c;位于javax.sql包中&#xff0c;用于替代传统的DriverManager获取数据库连接。Spring框架通过org.springframework.jdbc.datasource包对该接口进行了增强&#xff0c;提供连接池管理、事务绑定等高级特性…

C语言(08)——关于指针(逐渐清晰版)

为了更好地理解本篇文章的知识内容&#xff0c;读者可以将以下文章作为补充知识进行阅读 &#xff1a; C语言————原码 补码 反码 &#xff08;超绝详细解释&#xff09;-CSDN博客 C语言————二、八、十、十六进制的相互转换-CSDN博客 C语言————斐波那契数列的理解…

LeetCode 1616.分割两个字符串得到回文串

给你两个字符串 a 和 b &#xff0c;它们长度相同。请你选择一个下标&#xff0c;将两个字符串都在 相同的下标 分割开。由 a 可以得到两个字符串&#xff1a; aprefix 和 asuffix &#xff0c;满足 a aprefix asuffix &#xff0c;同理&#xff0c;由 b 可以得到两个字符串 …

算法【1】

网址&#xff1a;主站 工具补充 1. sort 函数的使用规则 作用&#xff1a;对容器元素进行排序&#xff0c;默认升序。语法&#xff1a;sort(起始迭代器, 结束迭代器, 比较规则) 前两个参数是排序范围&#xff1a;[begin, end)&#xff08;包含begin&#xff0c;不包含end&am…

信创国产Linux操作系统汇总:从桌面到服务器,百花齐放

在数字化浪潮席卷全球的今天&#xff0c;操作系统作为信息产业的基石&#xff0c;其战略地位日益凸显。曾经由国外巨头垄断的格局正悄然改变——中国本土Linux操作系统历经多年沉淀&#xff0c;已形成了百花齐放的局面。无论是日常办公、专业开发&#xff0c;还是关键行业应用&…

claudia for claude code

一.安装所有必需的依赖项 1.安装 Git for Windows 步骤: 访问 Git 的官方网站 git-scm.com。 下载适用于 Windows 的最新版本安装程序。 运行安装程序。在安装向导的各个步骤中&#xff0c;建议保留所有默认设置&#xff0c;这些设置对于本指南的后续操作已经足够。 验证…

企业内外网文件安全传输解决方案

企业内外网文件安全传输解决方案 基于零信任架构的智能中转系统设计 一、业务背景与挑战分析 1.1 企业网络安全现状 在数字化转型浪潮下&#xff0c;企业面临着前所未有的安全挑战。传统的"城墙式"网络防护已无法满足现代企业灵活协作的需求。根据《2024年中国企业…