RegEx 匹配打开的标记, 但 XHTML 独立标记除外

我需要匹配所有这些打开的标签: ……

共30个回答,已解决, 标签: html regex xhtml
根据字母计数检索括号缩写的定义

我需要根据括号中包含的字母数量来检索首字母 acronym 词的定义。对于我正在处理的数据,括号中的字母数量与要检索的单词数量相对应。我知道这不是获取缩写的可靠方法,但是在我的情况下,它会是。例如: String = '虽然家庭健康史 (FHH) 被普遍认为是常见慢性病的重要危险因素,但护士很少考虑它。' 期望输出: 家庭健康史 (FHH) 、护士 (NP) 我知道如何从字符串中提取括号,但是在那之后,我被卡住了。感谢任何帮助。 重新导入 A = '虽然家庭健康史 (FHH) 被普遍接受为 常见慢性病的重要危险因素,很少被考虑 一位护士 (NP) X2 = re.findall ('(\ (.*?\)',a) X2 中的 x: 长度 = len (x) 打印 (x,长度) ……

共5个回答,已解决, 标签: python regex text text-parsing abbreviation
如何找到双字母并用三个字母替换?

我没有使用任何特定的编码语言,只是一个包含 “查找” 和 “替换” 的程序,其中两个字段都使用正则表达式。例如,短语 专业人士太多 会变成 很多教授 我想 “找到” 任何双字母的出现,我知道我可以用它来做 (.) \ 1 让我困惑的是 “把双倍的字母和三倍的字母拿过来”。正则表达式中是否有引用 “当前字符” 之类的符号? 编辑: 谢谢大家的建议。事实证明,“替换” 字段实际上不使用 IMO,IMO 是 bullcrap,我的问题现在毫无价值。 ……

共5个回答, 标签: regex regex-group backreference
用于在嵌套括号中捕获值的正则表达式

我试图使用正则表达式来匹配两个字符之间的内部文本,但是我得到了错误的文本 我试着把 [A-z] * 代替。 * 只匹配内部文本,它就可以工作了。但是我也需要匹配非字母字符。 /\ [?(,?) \ [(.)-(.) \]?/G 这是我的正则表达式,我想匹配方括号之间的字符: > [[][你好-你好]],[你好-嗨] 粗体字符是匹配的字符。 > 我希望能和 [[比赛你好-你好]] 、 [[嗨-嗨] 在比赛 1 和 [你好-你好]] 、 [嗨-嗨] 在第二场比赛中。 ……

共5个回答,已解决, 标签: javascript regex regex-lookarounds regex-group regex-greedy
允许数字、破折号、逗号的正则表达式

我想知道 c # 的正则表达式实现了以下模式: * 只允许数字,逗号和数字 * 必须以数字开头和结尾 * 数字的范围是 0 到 999 * 用 ',' 分隔数字 (例如 1,2,3) 或范围 (例如 1-3,2-5) * 两个 “,” 之间必须是数字或范围 * '-' 必须以数字开头和结尾 * 在 ',' 之后只允许 0-1 空白 示例: 1-100,134,200-> 通过。数字 0-999 的最大范围 1,18,100-> PASS 1 、 18 、 100 --> PASS。在 ',' 之后允许 0-1 空白 1,18,100-> 失败。由于在 ',' 之后有超过 1 个空格 1-,18,100-> 失败。由于 '-' 后没有数字 -2,18,100-> 失败。由于 '-' 之前没有数字 18,100-> 失败。由于 ',' 之间没有数字 18,100-> 失败。由于 ',' 之间没有数字 ,2,18,100-> 失败。由于之前没有数字, 1,18,100,-> 失败。由于 '之后没有数字,' 我尝试使用以下代码,但它总是返回一个真实的结果: 字符串模式 = @ "[0-9] ……

共5个回答,已解决, 标签: c# regex
如何详细说明正则表达式,以便仅显示文件扩展名后第一个问号前最后一个斜线后的字符?

我正在与 Reactjs 合作,我试图展示图像的价值。Valyue/url 很大,所以在 UI 上看起来很难看。 我想知道如何做类似问题标题的事情: > 正则表达式,只显示最后一个字符后的字符/ and before the first ?文件扩展名后 所以,在下面的 URL 的情况下。 https://axsfundbeta-assets.s3.amazonaws.com/images/originals/TrCZMu1OuVYXAK4cdSS57EZyUCYDWK29KWr6vlbh.png?X-Amz-Content-Sha256=UNSIGNED-PAYLOAD&X-Amz-Algorithm=AWS4-HMAC-SHA256&X-Amz-Credential=AKIA6GTYRA24ZFJLKRMN/20190604/us-east-1/s3/aws4_request&X-Amz-Date=20190604T071137Z&X-Amz-SignedHeaders=host&X-Amz-Expires=1200&X-Amz-Signature=de0b4f862f69382002c3c0e3 ……

共4个回答,已解决, 标签: javascript regex
使用 RegEx 选择数千个分隔符

我需要更改给定字符串中包含数字的十进制分隔符。 什么正则表达式代码只能选择字符串中的千位分隔符字符? 当周围有数字时,它只需要选择。例如,只有当123,456 I need to select and replace , 我正在将英文数字转换成波斯语 (例如:Hello 123 becomes Hello ۱۲۳). Now I need to replace the decimal separator with Persian version too. But I don't know how I can select it with regex. e.g. Hello 121,534 most become Hello ۱۲۱/۵۳۴ 需要替换的字符是, with / ……

共4个回答,已解决, 标签: php regex localization numbers
用于从两端删除非 ASCII 字符的正则表达式

我必须使用这个代码循环多次,有更好的方法吗? 项目 = '!@ # $ abc-123-4; 5.def) 或者 '!@ # $ Abc-123-4; 5.def) (* & ^; \ n _' 或者 '!@ # $ Abc-123-4; 5.def) _ (* & ^; \ n _' 我喜欢的那个不起作用 Item = re.sub ('^ \ W | \ W $','',item) 期待 5.def abc-123-4 最后的目标是只移除任何不【 A-zA-Z0-9 】从两端同时保持任何字符之间。第一个也是最后一个字母在课堂上【 A-zA-Z0-9 】 ……

共4个回答,已解决, 标签: python regex python-2.7 regex-group regex-greedy
如何在任何给定的字符串中添加空格并维护 N 个字符?

在使用正则表达式的 Ruby 中,我想修改一个比 15 个字符短或正好 15 个字符的给定字符串,这样通过添加空格,它总是 15 个字符。 例如: “苹果” => “苹果 (这里有 10 个空格)” “Orang” => “orange (这里有 9 个空格)” => 'Fifteenspaceshi' 'fifteenspaceshi' 我已经尝试过了,但是 regex 会有更优雅的解决方案吗? X = 'apple' X = x ''* (长度为 15-x) ……

共3个回答,已解决, 标签: regex ruby string
为什么/如何在将重复的任意字符与捕获组匹配时需要一个额外的变量?

我使用 perl6 正则表达式匹配重复任意字符的序列,长度最小。 通过阅读后Https://docs.perl6.org/language/regexes#Capture_numbers [https://docs.perl6.org/language/regexes#Capture_numbers]并调整了给定的例子,我已经使用 “外部变量” 想出了这个代码: # 使用额外的变量 $ c Perl6-e '$_ = "bbaaaaawer";/(.) {}: 我的 $ c = $0; ($ c) * 2.* # 输出: aaaaa 为了帮助说明我的问题,perl5 中有一个类似的正则表达式: # 不需要额外的变量 Perl-e '$_ = "bbaaaaawer";/(.) \ 2 {2,}/& & 打印 $1; 有人能告诉我 “拯救” 的需要/好处吗$0 into $c and the requirement of the empty {}?是否有另一种 (更好/更好的) perl6 正则表达式可以匹配? 提前谢谢。 ……

共3个回答,已解决, 标签: regex perl6
在 “11111” 中找到 “111111111111111” 的索引的正确正则表达式是什么?[复制]

这个问题在这里已经有了答案: * 返回重叠正则表达式 [/questions/7760162/returning-overlapping-regular-expressions]1 回答 导入 java.util.mat. Matcher; 导入 java.util.regex.模式; 导入 java.util.*; Java.lang.* 导入; 导入 java.io.*; Ideone 类 { 公共静态 void main (字符串 [] args) 抛出 java.lang.Exception { 你的代码在这里 = "111111111111111" 中的字符串; 模式 p = 模式编译 ("(11111)"); Matcher m = p.matcher (in); 而 (m.find () { 系统.输出.打印 (m.start () ""); } } } 我得到的上述代码的输出是 0 5 10 我应该得到的输出是 0 1 2 3 4 5 6 7 8 9 10 有人能告诉我我做错了什么吗? ……

共3个回答,已解决, 标签: java regex
然后用子程序的输出替换 Perl6 搜索

我已经梳理了文档,但是我似乎找不到如何在 perl6 中做到这一点。 在 perl5 中,我会做 (只是一个例子): 子函数 {.} $ Str = ~ s/针/func ($1)/e; 即用对 “函数” 的调用的输出替换 “需要” ……

共2个回答,已解决, 标签: regex replace perl6 evaluation string-substitution
分割字符串的正则表达式

我发现这个答案 [https://superuser.com/a/666692]对于如何用 RegExp 将电影名称分段,它工作正常,但不完全是我需要的。 输入字符串为:2001.A.Space.Odyssey.1968.720p.BluRay.DD5.1.x264-LiNG.mkv 答案中使用的正则表达式是这样的:().(\ D {4}..(mp4 | avi | mkv) $和那输出 [https://regex101.com/r/ZAyMQL/1]是: 2001.A.太空.奥德赛 1968 Mkv 我需要的是如下: 2001.A.太空.奥德赛 1968 凌 Mkv 我的尝试是:(.).(\ D {4}.([^ _]).(mp4 | avi | mkv) $但是输出 [https://regex101.com/r/Hfljd7/1]是: 2001.A.太空.奥德赛 1968 G Mkv 我怎样才能凌而不是G ? ……

如何匹配 per6 语法中的十六进制数组

我有一根绳子"39 3A 3B 9:;"我想提取 “39,3A,3B” 我试过了 我的 $ a = "39 3A 3B 9:;"; 语法十六进制 { Token TOP {.*} 令牌 hex_ 数组 {<[0..9 A..F]> "} }; 解析 ($ a); 但是这似乎不起作用。甚至这似乎也不起作用。 我的 $ a = "39 3A 3B"; 语法十六进制 { 令牌顶 {} 令牌 hex_ 数组 {<[0..9 A..F]> "} }; 解析 ($ a); 我确实尝试了语法:: TOP 和 hex_ 数组都失败了 顶部 | Hex_array | * 失败 * 失败 ……

共2个回答,已解决, 标签: regex grammar perl6
匹配正则表达式时获取单个元素

我有一个这样的字符串.. let string = "[@he man:user:123] [@super man:user:456] [@bat man:user:789]" 现在,我需要一个只包含名称和 id 的数组。为此,我应用了以下正则表达式.. 扩展字符串 { Func findMentionText2 ()-> [[字符串]] { 我们正则表达式 = 试试?(模式: “(@ \ \ w (?: \ \ w) *): 用户: (\ \ w)”,选项: []) 匹配 (in: self,选项: [],范围: NSMakeRange (0,self.count)) { 返回匹配项。地图 {匹配 退货 (1. '' 现在,当我这样做let hashString = string.findMentionText() and print hashString ,我得到一个这样的数组.. 【 @ 何人】、【 123 】、【 @ 超人】、【 456 】、【【 @ 蝙蝠人】、【 789 】 到目前为止很好..:) 现在我做了一个类型别名,并想将它添加到数组中..所以我就这么做了 UserTag ……

共1个回答,已解决, 标签: ios swift regex
除了包含的特定字符串之外,每个 URl 的正则表达式合规性

如果 URL 与国家不匹配,我想通过 URL 重写来定制 URL 的货币。 我目前在 Apache 上的重写规则如下: RedirectMatch 永久 “/(.*) _ DE/(?!.* (EUR) (.*) $” https:/$ 1_DE/EUR $2 因此 URL本地主机/de _ de/USD [https://localhost/de_DE/USD]将不得不更改为Https://本地主机/de _ de/EUR [https://localhost/de_DE/EUR],但不幸的是,该规则不适用。 Apache RegEx 是否有 web 测试程序?对于 Apache 来说,regex101.com 似乎并不准确。 ……

共1个回答, 标签: regex apache url-rewriting
参考-这个正则表达式是什么意思?

这是怎麽? 这是一个常见的 Q & A 的集合。这也是一个社区维基, 所以邀请每个人都参与维护它。 为什么会这样? 正则表达式 [/questions/tagged/regex]是痛苦的给我的代码类型的问题和糟糕的答案没有解释。此引用旨在提供指向质量 Q & A 的链接。 范围是多少? 此参考适用于以下语言: php [/questions/tagged/php]、 perl [/questions/tagged/perl]、 javascript [/questions/tagged/javascript]、巨蟒 [/questions/tagged/python]、红宝石 [/questions/tagged/ruby]、java、 . [/questions/tagged/java] net [/questions/tagged/.net]。 这可能过于宽泛, 但这些语言共享相同的语法。对于特定功能, 它背后有语言的标签, 例如: * 什么是正则表达式平衡组?. net [/questions/tagged/.net] ……

共1个回答,已解决, 标签: regex
正则表达式段错误

我有一个正则表达式分段故障错误。经过一些测试,我注意到[\ S \ S] * \ s如果字符串大于 15kb,正则表达式的一部分会出问题,所以有时它会工作,但有时会崩溃。 下面是用 g (gcc v.6.3.0) 编译的 C 代码 # 包括 # 包括 # 包括 # 包括 Int main (int argc,char * argv []) { 正则表达式 ( R "([\ s) * \ S", Std:: regex _ constants:: icase ); Std:: ifstream ifs (“/home/input.txt”); Std std:: 字符串输入 ( (Std:: istreambuf _ iterator (ifs)), (Std:: istreambuf_iterator ()) ); 输入大小: “输入大小”。大小 () <std:: endl; Bool reg_match = std:: regex _ match (输入,正则表达式); Std:: cout <<"匹配:" <reg_match <std:: endl; } 发生了什么,为什么会发生 ……

共0个回答, 标签: c++ regex debian-stretch
如何加快正则表达式搜索 C++ 中大量潜在的大型文件?

我试图使一个程序读取用户输入的通配符文件和通配符字符串使用 excel 文档作为配置文件。例如, 用户可以在 C:\ read *. txt 中输入, c 驱动器中以 Read 开头的任何文件, 然后读取后的任何字符和文本文件都将包含在搜索中。 他们可以搜索消息: * 和所有以 "消息:" 开头的字符串, 并以任何字符序列结尾的字符串都将匹配。 到目前为止, 它是一个工作程序, 但问题是, 速度效率是相当可怕的, 我需要它能够搜索非常大的文件。我使用文件流和正则表达式类这样做, 我不确定是什么需要这么多时间。 我的代码中的大部分时间都花在了下面的循环中 (我只包括了 while 循环上方的行, 这样您就可以更好地了解我要做的事情): smatch matches; vector expressions; for (int i = 0; i < regex_patterns.size(); i++){expressions.emplace_back(regex_patterns.at(i));} auto startTimer = high_resolution_clock::now(); // O ……

共0个回答, 标签: c++ regex string file search
用括号外的逗号分解字符串

我有一个字符串, 我想用逗号分解, 但前提是逗号没有嵌套在某些括号内。这是一个相当常见的用例, 我一直在阅读这个论坛上的答案帖子, 但还没有真正找到我正在寻找的东西。 所以, 在细节上: 重点是, 我有一个字符串 (= SQL 选择..。FROM 语句), 我想从列表中提取元素, 用在此字符串中编码的逗号分隔 (= 要从中选择的列的名称)。但是, 这些元素可以包含括号, 并且有效地是函数调用。例如, 在 SQL 中, SELECT TO_CHAR(min(shippings.shippingdate), 'YYYY-MM-DD') as shippingdate, nameoftheguy FROM shippings WHERE ... 显然, 我希望现在有一个数组, 其中包含作为第一个元素 TO_CHAR(min(shippings.shippingdate), 'YYYY-MM-DD') as shippingdate 并作为第二个元素 nameoftheguy 到目前为止, 我所遵循的方法是php 和 RegEx: 用不在括号内的逗号 (也包括嵌套括号) 拆分 [https://s ……

共0个回答, 标签: php regex