detecting word boundary with regex in data frame in R
我有一个名为 all 的 data.frame,它有一列因素,这些因素包括 "word"、"nonword" 和其他一些因素。我的目标是只选择具有因子值"word"的行。
我的解决方案 grep("\\bword\\b",all[,5]) 什么也不返回。
为什么不识别单词边界?
- 为什么不只是 all %>% filter(column %in%"word")?
在 R 中,你需要两次 \\:
1
| grep("\\\\bword\\\\b", all[5]) |
替代解决方案:
1 2 3
| grep("^word$", all[5])
which(all[5] =="word") |
- 您的两个解决方案都有效,谢谢。你知道为什么"\\\\bword\\\\b" 在这种情况下不起作用吗?
-
1 模式 grep("^word$", ...) 将匹配整个字符串,而不仅仅是单词..即使在这里它们没有任何区别。