R正则表达式语法细节_光环大数据培训

来源:互联网 由 光环IT学院 贡献 责任编辑:李志  
http://hadoop.aura-el.com

R正则表达式语法细节_光环大数据培训

1.Metacharacters

最简单的正则表达式是匹配一个简单的字符,如字母、数字和标点等。对于标点等特殊字符,通常被称为“metacharacter”,在匹配这些元字符时,R语言里面需要使用’/’。主要的元字符有:. $ * + ? | / ^ [ ] { } ( )等。

# 带元字符的单词

money = “$money”

# 错误的匹配方式

sub(pattern = “$”, replacement = “”, x = money)

## [1] “$money”

# 正确的匹配方式

sub(pattern = “//$”, replacement = “”, x = money)

## [1] “money”

# 类似的案例

sub(“//$”, “”, “$Peace-Love”)

http://hadoop.aura-el.com

## [1] “Peace-Love”

sub(“//.”, “”, “Peace.Love”) ## [1] “PeaceLove”

sub(“//+”, “”, “Peace+Love”) ## [1] “PeaceLove”

sub(“//^”, “”, “Peace^Love”) ## [1] “PeaceLove”

sub(“//|”, “”, “Peace|Love”) ## [1] “PeaceLove”

sub(“//(“, “”, “Peace(Love)”) ## [1] “PeaceLove)”

http://hadoop.aura-el.com

sub(“//)”, “”, “Peace(Love)”) ## [1] “Peace(Love”

sub(“//[“, “”, “Peace[Love]”) ## [1] “PeaceLove]”

sub(“//[“, “”, “Peace[Love]”) ## [1] “PeaceLove]”

sub(“//{“, “”, “Peace{Love}”) ## [1] “PeaceLove}”

sub(“//}”, “”, “Peace{Love}”) ## [1] “Peace{Love”

sub(“////”, “”, “Peace//Love”)

http://hadoop.aura-el.com

## [1] “PeaceLove”

2.Sequences

Sequences用于匹配字符序列,主要的序列有: /d 匹配数字字符

/D 匹配非数字字符

/s 匹配间隔符

/S 匹配非间隔符

/w 匹配单词字符

/W 匹配非单词字符

/b 匹配词界

/B 匹配非词界

http://hadoop.aura-el.com

/h 匹配水平间隔

/H 匹配非水平间隔

/v 匹配垂直间隔

/V 匹配非垂直间隔

2.1数字和非数字

# 用’_’替换数字

sub(“//d”, “_”, “the dandelion war 2010”) ## [1] “the dandelion war _010”

gsub(“//d”, “_”, “the dandelion war 2010”) ## [1] “the dandelion war ____”

# 用’_’替换非数字型字符

sub(“//D”, “_”, “the dandelion war 2010”)

以下内容为系统自动转化的文字版,可能排版等有问题,仅供您参考:

光环大数据--大数据培训&人工智能培训 http://hadoop.aura-el.com R 正则表达式语法细节_光环大数据培训

1.Metacharacters

最简单的正则表达式是匹配一个简单的字符,如字母、数字和标点等。对于标点 等特殊字符,通常被称为“metacharacter”,在匹配这些元字符时,R 语言里 面需要使用’/’。主要的元字符有:. $ * + ? | / ^ [ ] { } ( )等。

# 带元字符的单词 money = “$money” # 错误的匹配方式 sub(pattern = “$”, replacement = “”, x = money)

## [1] “$money”

# 正确的匹配方式 sub(pattern = “//$”, replacement = “”, x = money)

## [1] “money”

# 类似的案例 sub(“//$”, “”, “$Peace-Love”)

光环大数据 http://hadoop.aura-el.com

光环大数据--大数据培训&人工智能培训 http://hadoop.aura-el.com ## [1] “Peace-Love”

sub(“//.”, “”, “Peace.Love”)

## [1] “PeaceLove”

sub(“//+”, “”, “Peace+Love”)

## [1] “PeaceLove”

sub(“//^”, “”, “Peace^Love”)

## [1] “PeaceLove”

sub(“//|”, “”, “Peace|Love”)

## [1] “PeaceLove”

sub(“//(“, “”, “Peace(Love)”)

## [1] “PeaceLove)”

光环大数据 http://hadoop.aura-el.com

光环大数据--大数据培训&人工智能培训 http://hadoop.aura-el.com sub(“//)”, “”, “Peace(Love)”)

## [1] “Peace(Love”

sub(“//[“, “”, “Peace[Love]”)

## [1] “PeaceLove]”

sub(“//[“, “”, “Peace[Love]”)

## [1] “PeaceLove]”

sub(“//{“, “”, “Peace{Love}”)

## [1] “PeaceLove}”

sub(“//}”, “”, “Peace{Love}”)

## [1] “Peace{Love”

sub(“////”, “”, “Peace//Love”)

光环大数据 http://hadoop.aura-el.com

光环大数据--大数据培训&人工智能培训 http://hadoop.aura-el.com ## [1] “PeaceLove”

2.Sequences

Sequences 用于匹配字符序列,主要的序列有:

/d 匹配数字字符

/D 匹配非数字字符

/s 匹配间隔符

/S 匹配非间隔符

/w 匹配单词字符

/W 匹配非单词字符

/b 匹配词界

/B 匹配非词界

光环大数据 http://hadoop.aura-el.com

光环大数据--大数据培训&人工智能培训 http://hadoop.aura-el.com /h 匹配水平间隔

/H 匹配非水平间隔

/v 匹配垂直间隔

/V 匹配非垂直间隔

2.1 数字和非数字

# 用’_’替换数字 sub(“//d”, “_”, “the dandelion war 2010”)

## [1] “the dandelion war _010”

gsub(“//d”, “_”, “the dandelion war 2010”)

## [1] “the dandelion war ____”

# 用’_’替换非数字型字符 sub(“//D”, “_”, “the dandelion war 2010”)

光环大数据 http://hadoop.aura-el.com

光环大数据--大数据培训&人工智能培训 http://hadoop.aura-el.com ## [1] “_he dandelion war 2010”

gsub(“//D”, “_”, “the dandelion war 2010”)

## [1] “__________________2010”

2.2 空格与非空格

# 用’_’替空格 sub(“//s”, “_”, “the dandelion war 2010”)

## [1] “the_dandelion war 2010”

gsub(“//s”, “_”, “the dandelion war 2010”)

## [1] “the_dandelion_war_2010”

# 用’_’替非空格字符 sub(“//S”, “_”, “the dandelion war 2010”)

## [1] “_he dandelion war 2010”

光环大数据 http://hadoop.aura-el.com

光环大数据--大数据培训&人工智能培训 http://hadoop.aura-el.com gsub(“//S”, “_”, “the dandelion war 2010”)

## [1] “___ _________ ___ ____”

2.3 单词与非单词

# 用’_’替单词 sub(“//w”, “_”, “the dandelion war 2010”)

## [1] “_he dandelion war 2010”

gsub(“//w”, “_”, “the dandelion war 2010”)

## [1] “___ _________ ___ ____”

# 用’_’替非单词 sub(“//W”, “_”, “the dandelion war 2010”)

## [1] “the_dandelion war 2010”

gsub(“//W”, “_”, “the dandelion war 2010”)

光环大数据 http://hadoop.aura-el.com

光环大数据--大数据培训&人工智能培训 http://hadoop.aura-el.com ## [1] “the_dandelion_war_2010”

2.4 词界与非词界

# 用’_’替词界 sub(“//b”, “_”, “the dandelion war 2010”)

## [1] “_the dandelion war 2010”

gsub(“//b”, “_”, “the dandelion war 2010”)

## [1] “_t_h_e_ _d_a_n_d_e_l_i_o_n_ _w_a_r_ _2_0_1_0_”

# 用’_’替非词界 sub(“//B”, “_”, “the dandelion war 2010”)

## [1] “t_he dandelion war 2010”

gsub(“//B”, “_”, “the dandelion war 2010”)

## [1] “t_he d_an_de_li_on w_ar 2_01_0”

光环大数据 http://hadoop.aura-el.com

光环大数据--大数据培训&人工智能培训 http://hadoop.aura-el.com 3.Character Class

字符类或字符集是用“[ ]”括起来的字符集,只要匹配字符集中的任意类。例 如[aA]表示匹配任意小写 a 或大写字母 A,[0123456789]表示匹配任意单个数字, 这里要区别字符类与字符的区别。常见的一些字符类有:

[aeiou] 匹配任意元音字母

[AEIOU] 匹配任何一个大写元音

[0123456789] 匹配任意单个数字

[0-9] 匹配任意数字(同上)

[a-z] 匹配任何 ASCII 小写字母

[A-Z] 匹配任何 ASCII 大写字母

[a-zA-Z0-9] 匹配任意上面的类

[^aeiou] 匹配除小写元音外的字母

[^0-9] 匹配除数字外的字符

光环大数据 http://hadoop.aura-el.com

光环大数据--大数据培训&人工智能培训 http://hadoop.aura-el.com

transport = c(“car”, “bike”, “plane”, “boat”) # 匹配’e’和’i’ grep(pattern = “[ei]”, transport, value = TRUE)

## [1] “bike”

“plane”

numerics = c(“123”, “17-April”, “I-II-III”, “R 3.0.1”) # 匹配含’0’或’1’的字符 grep(pattern = “[01]”, numerics, value = TRUE)

## [1] “123”

“17-April” “R 3.0.1”

# 匹配含任意数字的字符 grep(pattern = “[0-9]”, numerics, value = TRUE)

## [1] “123”

“17-April” “R 3.0.1”

# 匹配不含数字的字符 grep(pattern = “[^0-9]”, numerics, value = TRUE)

## [1] “17-April” “I-II-III” “R 3.0.1”

光环大数据 http://hadoop.aura-el.com

光环大数据--大数据培训&人工智能培训 http://hadoop.aura-el.com

4.POSIX Character Classes

POSIX 字符类是用”[[ ]]“括起来的正则表达,常见的 POSIX 字符类有:

[[:lower:]] 小写字母

[[:upper:]] 大写字母

[[:alpha:]] 所以字母 ([[:lower:]] and [[:upper:]])

[[:digit:]] 数字: 0, 1, 2, 3, 4, 5, 6, 7, 8, 9

[[:alnum:]] 字母和数字 ([[:alpha:]] and [[:digit:]])

[[:blank:]] 空白字符: space and tab

[[:cntrl:]] 控制字符

[[:punct:]] 标点符号: ! ” # % & ‘ ( ) * + , – . / : ;

[[:space:]] 空格字符:制表符,换行符, 垂直制表符,换页符,回车和空格

光环大数据 http://hadoop.aura-el.com

光环大数据--大数据培训&人工智能培训 http://hadoop.aura-el.com

[[:xdigit:]] 十六进制数字: 0-9 A B C D E F a b c d e f

[[:print:]]控制字符 ([[:alpha:]], [[:punct:]] and space)

[[:graph:]] 图形化字符 ([[:alpha:]] and [[:punct:]])

# la vie (string) la_vie = “La vie en #FFC0CB (rose);/nCes’t la vie! tres jolie” print(la_vie)

## [1] “La vie en #FFC0CB (rose);/nCes’t la vie! tres jolie”

cat(la_vie)

## La vie en #FFC0CB (rose); ## Ces’t la vie! tres jolie

# 删除空格字符 gsub(pattern = “[[:blank:]]”, replacement = “”, la_vie)

## [1] “Lavieen#FFC0CB(rose);/nCes’tlavie!tresjolie”

光环大数据 http://hadoop.aura-el.com

光环大数据--大数据培训&人工智能培训 http://hadoop.aura-el.com

# 删除标点 gsub(pattern = “[[:punct:]]”, replacement = “”, la_vie)

## [1] “La vie en FFC0CB rose/nCest la vie tres jolie”

# 删除数字 gsub(pattern = “[[:xdigit:]]”, replacement = “”, la_vie)

## [1] “L vi n # (ros);/ns’t l vi! trs joli”

# 删除控制字符 gsub(pattern = “[[:print:]]”, replacement = “”, la_vie)

## [1] “/n”

# 删除非控制符 gsub(pattern = “[^[:print:]]”, replacement = “”, la_vie)

## [1] “La vie en #FFC0CB (rose);Ces’t la vie! tres jolie”

# 删除图形化字符

光环大数据 http://hadoop.aura-el.com

光环大数据--大数据培训&人工智能培训 http://hadoop.aura-el.com gsub(pattern = “[[:graph:]]”, replacement = “”, la_vie)

## [1] ”

/n

# 删除非图形化字符 gsub(pattern = “[^[:graph:]]”, replacement = “”, la_vie)

## [1] “Lavieen#FFC0CB(rose);Ces’tlavie!tresjolie”

为什么大家选择光环大数据!

大数据培训、 人工智能培训、 Python 培训、 大数据培训机构、 大数据培训班、 数据分析培训、大数据可视化培训,就选光环大数据!光环大数据,聘请大数据 领域具有多年经验的讲师,提高教学的整体质量与教学水准。讲师团及时掌握时 代的技术,将时新的技能融入教学中,让学生所学知识顺应时代所需。通过深入 浅出、通俗易懂的教学方式,指导学生较快的掌握技能知识,帮助莘莘学子实现 就业梦想。

光环大数据启动了推进人工智能人才发展的“AI 智客计划” 。光环大数据专注国内 大数据和人工智能培训,将在人工智能和大数据领域深度合作。未来三年,光环大数据 将联合国内百所大学,通过“AI 智客计划” ,共同推动人工智能产业人才生态建设,培 养和认证 5-10 万名 AI 大数据领域的人才。

光环大数据 http://hadoop.aura-el.com

光环大数据--大数据培训&人工智能培训 http://hadoop.aura-el.com 参加“AI 智客计划” ,享 2000 元助学金!

【报名方式、详情咨询】 光环大数据网站报名:http://hadoop.aura-el.com 手机报名链接:http:// hadoop.aura-el.com /mobile/

光环大数据 http://hadoop.aura-el.com


  • 与《R正则表达式语法细节_光环大数据培训》相关:
  • 大数据面试小细节你知道哪些_光环大数据培训
  • 用R处理大数据集_光环大数据培训机构
  • 提速正则表达式的方案汇总_光环大数据培训
  • 如何制作自己的R包_光环大数据培训
  • 正则表达式30分钟入门教程_光环大数据培训
  • 光环大数据培训 一篇搞定Python正则表达式
  • R语言数据文件读写_光环大数据培训
  • 如何制作自己的R包_光环大数据培训机构
  • 数值计算及正则表达式_光环大数据python培训
  • R可以做所有SAS做的事情_光环大数据培训
  • 本站网站首页首页教育资格全部考试考试首页首页考试首页职业资格考试最近更新儿童教育综合综合文库22文库2建筑专业资料考试首页范文大全公务员考试首页英语首页首页教案模拟考考试pclist学路首页日记语文古诗赏析教育教育资讯1高考资讯教育头条幼教育儿知识库教育职场育儿留学教育高考公务员考研考试教育资讯1问答教育索引资讯综合学习网站地图学习考试学习方法首页14托福知道备考心经冲刺宝典机经真题名师点睛托福课程雅思GREGMATSAT留学首页首页作文
    免责声明 - 关于我们 - 联系我们 - 广告联系 - 友情链接 - 帮助中心 - 频道导航
    Copyright © 2017 www.xue63.com All Rights Reserved