R中匹配函数

在 R 中,字符串匹配是一个常见的任务,可以使用正则表达式或非正则表达式的方法来完成。以下是对这些方法的总结,包括在向量和数据框中的应用。

正则表达式匹配

常用函数
  1. grepl

    • 功能:检查向量中的每个元素是否匹配某个正则表达式。
    • 返回值:逻辑向量,匹配的元素返回 TRUE,不匹配的返回 FALSE
    • 示例
      my_vector <- c("apple", "banana", "cherry", "date", "elderberry")
      matches <- grepl("a", my_vector)
      print(matches)  # 输出: [1]  TRUE  TRUE FALSE  TRUE  TRUE
      
  2. grep

    • 功能:返回匹配正则表达式的元素的索引。
    • 返回值:整数向量,表示匹配的元素的索引。
    • 示例
      my_vector <- c("apple", "banana", "cherry", "date", "elderberry")
      indices <- grep("a", my_vector)
      print(indices)  # 输出: [1] 1 2 4 5
      
  3. subgsub

    • sub:替换每个元素中第一次出现的匹配模式。
    • gsub:替换每个元素中所有出现的匹配模式。
    • 示例
      my_vector <- c("apple", "banana", "cherry", "date", "elderberry")
      sub_result <- sub("a", "X", my_vector)
      gsub_result <- gsub("a", "X", my_vector)
      print(sub_result)  # 输出: [1] "Xpple"  "bXnXnX" "cherry" "dXte"  "elderberry"
      print(gsub_result)  # 输出: [1] "Xpple"  "bXnXnX" "cherry" "dXte"  "elderXerry"
      
在数据框中使用
  • greplgrep

    • 可以对数据框的某一列使用 greplgrep
    • 示例
      my_df <- data.frame(name = c("Alice", "Bob", "Charlie", "David", "Eve"),description = c("apple lover", "banana fan", "cherry enthusiast", "date admirer", "elderberry connoisseur"),stringsAsFactors = FALSE
      )# 使用 grepl 检查 description 列中哪些行包含 "a"
      matches <- grepl("a", my_df$description)
      print(matches)  # 输出: [1]  TRUE  TRUE FALSE  TRUE  TRUE# 使用 grep 获取匹配的行索引
      indices <- grep("a", my_df$description)
      print(indices)  # 输出: [1] 1 2 4 5
      
  • subgsub

    • 可以对数据框的某一列使用 subgsub
    • 示例
      my_df <- data.frame(name = c("Alice", "Bob", "Charlie", "David", "Eve"),description = c("apple lover", "banana fan", "cherry enthusiast", "date admirer", "elderberry connoisseur"),stringsAsFactors = FALSE
      )# 使用 sub 替换 description 列中第一次出现的 "a"
      my_df$description <- sub("a", "X", my_df$description)
      print(my_df)
      

非正则表达式匹配

常用函数
  1. %in%

    • 功能:检查向量中的元素是否存在于另一个向量中。
    • 返回值:逻辑向量,匹配的元素返回 TRUE,不匹配的返回 FALSE
    • 示例
      my_vector <- c("apple", "banana", "cherry", "date", "elderberry")
      search_vector <- c("banana", "date")
      matches <- my_vector %in% search_vector
      print(matches)  # 输出: [1] FALSE  TRUE FALSE  TRUE FALSE
      
  2. match

    • 功能:返回向量中每个元素在另一个向量中的位置。
    • 返回值:整数向量,表示匹配的元素的位置,未匹配的返回 NA
    • 示例
      my_vector <- c("apple", "banana", "cherry", "date", "elderberry")
      search_vector <- c("banana", "date")
      indices <- match(my_vector, search_vector)
      print(indices)  # 输出: [1] NA  1 NA  2 NA
      
在数据框中使用
  • %in%

    • 可以对数据框的某一列使用 %in%
    • 示例
      my_df <- data.frame(name = c("Alice", "Bob", "Charlie", "David", "Eve"),description = c("apple lover", "banana fan", "cherry enthusiast", "date admirer", "elderberry connoisseur"),stringsAsFactors = FALSE
      )# 使用 %in% 检查 description 列中哪些行包含 "banana" 或 "date"
      search_vector <- c("banana fan", "date admirer")
      matches <- my_df$description %in% search_vector
      print(matches)  # 输出: [1] FALSE  TRUE FALSE  TRUE FALSE
      
  • match

    • 可以对数据框的某一列使用 match
    • 示例
      my_df <- data.frame(name = c("Alice", "Bob", "Charlie", "David", "Eve"),description = c("apple lover", "banana fan", "cherry enthusiast", "date admirer", "elderberry connoisseur"),stringsAsFactors = FALSE
      )# 使用 match 获取 description 列中每个元素在 search_vector 中的位置
      search_vector <- c("banana fan", "date admirer")
      indices <- match(my_df$description, search_vector)
      print(indices)  # 输出: [1] NA  1 NA  2 NA
      

总结

  • 正则表达式匹配

    • grepl:检查匹配,返回逻辑向量。
    • grep:返回匹配的索引。
    • subgsub:替换匹配的内容。
  • 非正则表达式匹配

    • %in%:检查元素是否存在于另一个向量中,返回逻辑向量。
    • match:返回元素在另一个向量中的位置,未匹配的返回 NA

这些方法在向量和数据框中都可以使用,具体选择哪种方法取决于你的具体需求。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。
如若转载,请注明出处:http://www.pswp.cn/web/90996.shtml
繁体地址,请注明出处:http://hk.pswp.cn/web/90996.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

Ubuntu服务器上JSP运行缓慢怎么办?全面排查与优化方案

随着企业系统越来越多地部署在Linux平台上&#xff0c;Ubuntu成为JSP Web系统常见的部署环境。但不少开发者会遇到一个共同的问题&#xff1a;在Ubuntu服务器上运行的JSP项目访问缓慢、页面加载时间长&#xff0c;甚至出现卡顿现象。这类问题如果不及时解决&#xff0c;容易导致…

web刷题

[极客大挑战 2019]RCE ME 打开环境&#xff0c;代码逻辑还是很简单的 思路是传参code参数&#xff0c;一般传参shell然后用蚁剑连接看flag&#xff0c;但是这题做了之后就会发现思路是没错但是这题多了一些验证&#xff0c;这题就是无字符rce&#xff0c;可以考虑用取反&…

FFmpeg+javacpp中FFmpegFrameGrabber

FFmpegjavacpp中FFmpegFrameGrabber1、FFmpegFrameGrabber1.1 Demo使用1.2 音频相关1.3 视频相关2、Frame属性2.1 视频帧属性2.2 音频帧属性2.3 音频视频区分JavaCV 1.5.12 API JavaCPP Presets for FFmpeg 7.1.1-1.5.12 API1、FFmpegFrameGrabber org\bytedeco\javacv\FFmpeg…

1-FPGA的LUT理解

FPGA的LUT理解 FPGA的4输入LUT中&#xff0c;SRAM存储的16位二进制数&#xff08;如 0110100110010110&#xff09;直接对应真值表的输出值。下面通过具体例子详细解释其含义&#xff1a; 1. 4输入LUT 4输入LUT的本质是一个161的SRAM&#xff0c;它通过存储真值表的方式实现任意…

Vue2文件上传相关

导入弹窗<template><el-dialog:title"title":visible.sync"fileUploadVisible"append-to-bodyclose-on-click-modalclose-on-press-escapewidth"420px"><div v-if"showDatePicker">选择时间&#xff1a;<el-date…

vue使用xlsx库导出excel

引入xlsx库 import XLSX from "xlsx";将后端接口返回的数据和列名&#xff0c;拼接到XLSX.utils.aoa_to_sheet中exportExcel() {debugger;if (!this.feedingTableData || this.feedingTableData.length "0") {this.$message.error("投料信息为空&…

卷积神经网络(CNN)处理流程(简化版)

前言 是看了这个大佬的视频后想进行一下自己的整理&#xff08;流程只到了扁平化&#xff09;&#xff0c;如果有问题希望各位大佬能够给予指正。卷积神经网络&#xff08;CNN&#xff09;到底卷了啥&#xff1f;8分钟带你快速了解&#xff01;_哔哩哔哩_bilibilihttps://www.…

DBSyncer:开源免费的全能数据同步工具,多数据源无缝支持!

DBSyncer&#xff08;英[dbsɪŋkɜː]&#xff0c;美[dbsɪŋkɜː 简称dbs&#xff09;是一款开源的数据同步中间件&#xff0c;提供MySQL、Oracle、SqlServer、PostgreSQL、Elasticsearch(ES)、Kafka、File、SQL等同步场景。支持上传插件自定义同步转换业务&#xff0c;提供…

kafka开启Kerberos使用方式

kafka SASL_PLAINTEXT serviceName 配置&#xff1a; /etc/security/keytabs/kafka.service.keytab 对应的用户名 $ cat /home/sunxy/kafka/jaas25.conf KafkaClient { com.sun.security.auth.module.Krb5LoginModule required useKeyTabtrue renewTickettrue serviceName“ocd…

Unity教程(二十四)技能系统 投剑技能(中)技能变种实现

Unity开发2D类银河恶魔城游戏学习笔记 Unity开发2D类银河恶魔城游戏学习笔记目录 技能系统 Unity教程&#xff08;二十一&#xff09;技能系统 基础部分 Unity教程&#xff08;二十二&#xff09;技能系统 分身技能 Unity教程&#xff08;二十三&#xff09;技能系统 掷剑技能…

局域网TCP通过组播放地址rtp推流和拉流实现实时喊话

应用场景&#xff0c;安卓端局域网不用ip通过组播放地址实现实时对讲功能发送端: ffmpeg -f alsa -i hw:1 -acodec aac -ab 64k -ac 2 -ar 16000 -frtp -sdp file stream.sdp rtp://224.0.0.1:14556接收端: ffmpeg -protocol whitelist file,udp,rtp -i stream.sdp -acodec pcm…

基于深度学习的医学图像分析:使用YOLOv5实现细胞检测

最近研学过程中发现了一个巨牛的人工智能学习网站&#xff0c;通俗易懂&#xff0c;风趣幽默&#xff0c;忍不住分享一下给大家。点击链接跳转到网站人工智能及编程语言学习教程。读者们可以通过里面的文章详细了解一下人工智能及其编程等教程和学习方法。下面开始对正文内容的…

32.768KHZ 3215晶振CM315D与NX3215SA应用全场景

在现代电子设备中&#xff0c;一粒米大小的晶振&#xff0c;却是掌控时间精度的“心脏”。CITIZEN的CM315D系列与NDK的NX3215SA系列晶振便是其中的佼佼者&#xff0c;它们以 3.2 1.5 mm 的小尺寸”(厚度不足1mm)&#xff0c;成为智能设备中隐形的节奏大师。精准计时的奥秘这两…

嵌软面试——ARM Cortex-M寄存器组

Cortex-M内存架构包含16个通用寄存器&#xff0c;其中R0-R12是13个32位的通用寄存器&#xff0c;另外三个寄存器是特殊用途&#xff0c;分别是R13&#xff08;栈指针&#xff09;,R14&#xff08;链接寄存器&#xff09;,R15&#xff08;程序计数器&#xff09;。对于处理器来说…

7.DRF 过滤、排序、分页

过滤Filtering 对于列表数据可能需要根据字段进行过滤&#xff0c;我们可以通过添加django-fitlter扩展来增强支持。 pip install django-filter在配置文件中增加过滤器类的全局设置&#xff1a; """drf配置信息必须全部写在REST_FRAMEWORK配置项中""…

二、CUDA、Pytorch与依赖的工具包

CUDA Compute Unified Device Architecture&#xff08;统一计算架构&#xff09;。专门用于 GPU 通用计算 的平台 编程接口。CUDA可以使你的程序&#xff08;比如矩阵、神经网络&#xff09;由 GPU 执行&#xff0c;这比CPU能快几十甚至上百倍。 PyTorch 是一个深度学习框架…

SpringCloude快速入门

近期简单了解一下SpringCloude微服务,本文主要就是我学习中所记录的笔记,然后具体原理可能等以后再来深究,本文可能有些地方用词不专业还望包容一下,感兴趣可以参考官方文档来深入学习一下微服务,然后我的下一步学习就是docker和linux了。 nacos: Nacos 快速开始 | Nacos 官网…

GPT Agent与Comet AI Aent浏览器对比横评

1. 架构设计差异GPT Agent的双浏览器架构&#xff1a;文本浏览器&#xff1a;专门用于高效处理大量文本内容&#xff0c;适合深度信息检索和文献追踪&#xff0c;相当于Deep Research的延续可视化浏览器&#xff1a;具备界面识别与交互能力&#xff0c;可以点击网页按钮、识别图…

应用信息更新至1.18.0

增加DO权限 增加权限管理&#xff08;需DO支持&#xff09; 增加应用冻结隐藏&#xff08;需DO支持&#xff09; 增加权限委托&#xff08;需DO支持&#xff09; 增加特殊组件 ...

常用git命令集锦

git init 初始化 将当前目录初始化为 git 本地仓库&#xff0c;此时会在本地创建一个 .git 的文件夹 git init -q 静默执行&#xff0c;就是在后台执行 git init --bare –bare 参数,一般用来初始化一个空的目录&#xff0c;作为远程存储仓库 git init --template dir –templa…