(满满的坑LLAMA3使用申请被拒绝rejected)利用huggingface导入LLAMA3模型

文章目录

      • 前言
      • 后续

前言

大家都知道,使用huggingface导入大模型是使用如下办法

from transformers import AutoModelForCausalLM, AutoTokenizermodel_name = "Qwen/Qwen2.5-7B-Instruct"#要导入的大模型名称。model = AutoModelForCausalLM.from_pretrained(model_name,torch_dtype="auto",device_map="auto"
)
tokenizer = AutoTokenizer.from_pretrained(model_name)

我们将上述model_name换成gpt2-xl也可以导入成功,但是换成meta-llama/Llama-3.1-8B-Instruct就会失败。因为llama系列的模型矫情,使用需要申请。

在huggingface官网上https://huggingface.co/注册一个账号。这里会碰到第一个问题,那就是这个破网站在国内进去不。我自己是买了梯子的,你要是嫌贵不舍得,那没办法了,我自己觉得还行,基本上所有网站都可以访问了。没有梯子的话,github都要看运气能不能访问。

在网站上填写好了注册信息并且提交之后,记得查看邮件,需要在邮件里确认才算真正的注册成功。

注册好了之后,点击那个models。

在这里插入图片描述

在搜索框输入llama

在这里插入图片描述
发现会返回特别特别多的结果,我们找到我们想要的,常用的有那个第一个meta-llama/Llama-3.1-8B-Instruct还有下面的meta-llama/Meta-Llama-3-8B-Instruct。我们随便选择一个,我这里选择第一个meta-llama/Llama-3.1-8B-Instruct,点击进去,进入下面界面。
在这里插入图片描述
上面界面大概是说,LLAMA系列的模型的使用是受限的,需要申请后使用,申请之后会给你一个类似密码的东西。以后在python代码里导入LLAMA模型的时候,密码也要作为一个函数参数,才能导入模型成功。

在上面这个界面点击那个蓝色的字,滑到底部,可以看到一个申请表格,我们进行申请。

在这里插入图片描述
填写好信息之后点击提交,似乎信息不一定要完全真实。

提交之后,我们可以在网站右上角用户那里查看申请状态,
在这里插入图片描述
如下,我们发现还在等待状态。
在这里插入图片描述

我没过多久就被拒绝了,

在这里插入图片描述
回到那个meta-llama/Llama-3.1-8B-Instruct界面,也发现那个红色的字,

在这里插入图片描述
也就是说我的申请被拒绝了。

Your request to access this repo has been rejected by the repo’s authors.

这到底他妈的是怎么回事呢?我在网站https://huggingface.co/meta-llama/Llama-Guard-3-8B/discussions/13里面查看到,似乎中国和俄罗斯是被区别对待的,所以我们国家不要填写中国。对于LLAMA系列模型的使用申请,很多人都失败了,网上有一堆人吐槽的,比如https://huggingface.co/meta-llama/Meta-Llama-3-8B/discussions/124。

后面我又注册了两个账号,还是失败了。

第一次账号填的是中国,名字是中国名字的拼音,所属机构是乱写的公司。

第二次账号填的是加拿大,名字是外国名字,所属机构是多伦多大学。

第三次账号填的是香港,名字是中国名字的拼音(乱写的中国名字,但是和账号一致),所属机构是香港大学。这次写香港是因为我的那个梯子好像用的是香港的IP。


后续

已经转向使用qwen模型了,咱国产的,不需要申请,也没有国家地域歧视!不再使用llama!看了一下qwen下载量,比llama高多了,而且听说性能也很好,越来越成为各家大模型对比时的基线模型。

在这里插入图片描述
上个月下载量1500万,而下面的llama下载量500万,被爆杀了。

在这里插入图片描述
家人们,大家都用qwen,势必让固步自封的llama付出代价。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。
如若转载,请注明出处:http://www.pswp.cn/news/913996.shtml
繁体地址,请注明出处:http://hk.pswp.cn/news/913996.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

大规模集群下 Prometheus 监控架构实战经验分享

大规模集群下 Prometheus 监控架构实战经验分享 1 业务场景描述 在互联网金融业务发展过程中,我们需要对数千台主机、上万容器与微服务实例进行指标监控,并统计历史数据以支持 SLA 报表、告警与容量规划。传统监控系统面临以下挑战: 实例动态…

主流消息队列技术总结和对比

消息队列(Message Queue,简称 MQ)作为构建分布式互联网应用的关键组件,松耦合的架构设计能显著提升系统的可用性与可扩展性。在分布式系统中扮演着至关重要的角色,主要承担着实现异步消息传递、应用解耦、流量削峰以及…

数据结构 顺序表(3)---顺序表的应用

在之间的两篇文章中,我们着重讲了顺序表及顺序表的实现。今天这篇文章我们将简单讲解关于顺序表的三个算法题。这三个题也都属于力扣上的经典例题。1.例题1:移除元素例题来源(力扣) : https://leetcode.cn/problems/remove-element/description/这是一道数组操作算法…

逆向入门(9)汇编篇-bound指令的学习

看程序的时候碰到这么一行没见过的代码,简单记录一下 00427AC8 |. 6215 3C7B4200 |bound edx,qword ptr ds:[0x427B3C]这里是用到了bound指令,这是 x86 汇编中的指令,用于检查数组索引是否在有效范围内。 指令解析 bound edx, qword ptr ds…

【web应用】若依框架中,使用Echarts导出报表为PDF文件

文章目录前言一、Echarts准备工作1、查看是否安装了Echarts2、Echarts导入script 中3、使用Echarts创建图表二、报表制作打印html2canvas和jsPDF准备工作1、安装html2canvas和jsPDF依赖包2、html2canvas和jsPDF引用到script中3、制作并打印报表三、导出结果前言 若依框架前端中…

优选算法 --(双指针算法 1~8)

引言:此专栏为记录算法学习,本专题作为算法学习的第一部分,优选算法专题共计100题,分为不同小模块进行,算法学习需坚持积累,时代不会辜负长期主义者,仅以此句,与君共勉。 讲解算法分…

XRDMatch代码复现与分析报告

XRDMatch代码复现与分析报告 1. 项目概述 XRDMatch是一个用于X射线衍射(XRD)数据匹配和分析的开源工具,由zhengwan-chem开发并托管在GitHub上。本项目旨在复现XRDMatch的核心功能,并对其实现进行详细分析。 X射线衍射是材料科学中用于确定晶体结构的重要技术,通过分析衍射…

SpringAI×Ollama:Java生态无缝集成本地大模型实践指南

摘要 随着大语言模型(LLM)的普及,数据隐私和技术栈统一性成为企业级AI应用的核心挑战。本文系统阐述如何通过SpringAI框架与Ollama本地化模型引擎的结合,构建安全高效的生成式AI应用。通过实战案例解析配置优化、流式响应、工具调用等关键技术,为Java开发者提供零Python依…

从采购申请到报废核销:如何用数字化缝合企业物资管理的“断点”?

在企业的日常运营中,物资管理是一项至关重要的工作。从采购申请到物资的入库、使用,再到最终的报废核销,这一系列流程就像一条长长的链条,环环相扣。然而,在传统管理模式下,这条链条上却存在着诸多“断点”…

AVL平衡二叉树

01. 初始AVL树 AVL树是最早发明的自平衡二叉搜索树。在AVL树中,任何节点的两个子树的高度差(平衡因子)最多为1,这使得AVL树能够保持较好的平衡性,从而保证查找、插入和删除操作的时间复杂度都是O(log n)。包含n个节点…

教育行业可以采用Html5全链路对视频进行加密?有什么优势?

文章目录前言一、什么是Html5加密?二、使用Html5对视频加密的好处三、如何采用Html5全链路对视频进行加密?四、教育行业采用Html5全链路视频加密有什么优势?总结前言 面对优质课程盗录传播的行业痛点,教育机构如何守护核心知识产…

Vue3 tailwindcss

1、安装tailwindcsspnpm i -D tailwindcss postcss autoprefixer # yarn add -D tailwindcss postcss autoprefixer # npm i -D tailwindcss postcss autoprefixer2、 创建TailwindCSS配置文件npx tailwindcss init -ptailwind.config.js/** type {import(tailwindcss).Config}…

提示工程:解锁大模型潜力的核心密码

以下是对Lilian Weng的提示工程权威指南(原文链接)的深度解析与博客化重构,融入最新行业实践: 提示工程:解锁大模型潜力的核心密码 ——从基础技巧到工业级解决方案全解析 一、重新定义人机交互范式 传统编程 vs 提示…

Python3邮件发送全指南:文本、HTML与附件

在 Python3 中,使用内置的 smtplib 库和 email 模块发送邮件是一个常见的需求。以下是更详细的实现指南,包含各种场景的解决方案和技术细节:一、发送纯文本邮件的完整实现准备工作:确保已开通 SMTP 服务(各邮箱开启方式…

CSS和CSS3区别对比

CSS(层叠样式表)与CSS3(CSS的第三个版本)的区别主要体现在功能扩展、语法特性以及应用场景等方面。以下是两者的核心对比: 一、核心概念与版本关系CSS:是基础样式表语言,用于分离网页内容与样式…

JVM--监控和故障处理工具

一、命令行工具 1. jps (Java Process Status) 作用:列出当前系统中所有的 Java 进程 常用命令: jps -l # 显示进程ID和主类全名 jps -v # 显示JVM启动参数 输出示例: 1234 com.example.MainApp 5678 org.apache.catalina.startup.Bootstra…

推荐 7 个本周 yyds 的 GitHub 项目。

01.开源的 CRM 软件这是一个开源的客户关系管理(CRM)系统,现在又 32.5K 的 Star。为企业和团队提供比肩 Salesforce 等商业产品的功能,同时强调用户自主权、数据自由与高度可定制性。开源地址:https://github.com/twen…

linux网络编程之单reactor模型(一)

Reactor 是一种事件驱动的设计模式(Event-Driven Pattern),主要用于处理高并发 I/O,特别适合网络服务器场景。它通过一个多路复用机制监听多个事件源(如 socket 文件描述符),并在事件就绪时将事…

浏览器重绘与重排

深入解析浏览器渲染:重排(Reflow)与重绘(Repaint)的性能陷阱与优化策略作为一名前端开发者,你是否遇到过界面突然卡顿、滚动时页面抖动或输入框响应迟钝?这些常见性能问题背后,往往是重排与重绘在作祟。本文将深入剖析浏览器渲染机…

day049-初识Ansible与常用模块

文章目录0. 老男孩思想-人脉的本质1. Ansible1.1 密钥认证1.2 安装ansible1.3 添加ansible配置文件1.4 配置主机清单文件(Inventory)1.5 测试1.6 ansible的模块思想1.7 command模块1.8 需求:每台服务器的密码都不同,怎么批量执行业…