PHP - BBCode parser - Parse both bbcode link tag and not tagged link
我需要这样做:
当用户插入一个 BBCode 标签时,我会使用 preg_replace 和 regex 进行一些转换。
例如
1 2 3 4 5 6 7 8 9 10 11 12 13 | function forumBBCode($str){ $format_search=array( '#\\[url=(.*?)\\](.*?)\\[/url\\]#i' ); $format_replace=array( '$2' ); $str=preg_replace($format_search, $format_replace, $str); $str=nl2br($str); return $str; } |
现在我也想要这个:当用户插入带有链接的普通文本时,这也必须被转换。我无法通过 preg_replace 函数执行此操作,因为如果我将代码编写为
1 2 3 4 5 | $format_search '#(www\\..*?)#i' $format_replace '$1' |
它将转换链接 2 次(在 [url] 中以及当链接没有此标记时)。
所以我认为这个功能:
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 | function checkLinks($string) { $arrelab=""; $arr=split(' |\ \ ', $string); for($i=0; $i<sizeof($arr); $i++) { echo $i." -".$arr[$i]."<br/>"; if ((strpos($arr[$i], 'www.')!==false) or (strpos($arr[$i], 'http://')!==false) or (strpos($arr[$i], 'ftp://')!==false)) { if (strpos($arr[$i], '[url=')===false) { $arr[$i]=''.$arr[$i].''; } } $arrelab=$arrelab."".$arr[$i]; } return $arrelab; } |
问题是我需要拆分换行符,至于空格。
任何帮助将不胜感激。
附言对不起我的英语不好:)
干杯
使用后向断言很容易解决。
1 |
因此,正则表达式将跳过任何包含在" 或 > 中或以 / 开头的 URL
这是一种解决方法,而不是解决方案。
PS: target="_blank" 是用户纠缠。把它剪掉。
最简单的选择是首先解析纯文本网址,并确保它们不会立即出现在等号之后。
来自马里奥斯的更新:
有一种更简单的方法可以做到这一点。我在 RedBonzai 开发人员博客中创建了一个演练。它的链接在这里:http://www.redbonzai.com/blog/web-development/how-to-create-a-bb-codes-function-in-php/
如果您有任何问题,请告诉我。
RedBonzai
你的问题可以通过阅读你的标题来识别..结合正则表达式进行解析
您不能使用正则表达式"解析"html 或 bb 代码,因为它们不是正则语言。
你应该编写(或找到)一个 bb 代码解析器,而不是使用正则表达式。
Google 的第一个 BB 代码解析器结果是 NBBC:新的 BBCode 解析器。但我从未使用过它,所以我无法评论质量。