用 PHP 正規表示式清除字串中的多餘空白
2010/05/11
我們經常會在PHP程序中處理來自用戶輸入或從數據庫中讀取的數據,可能在你的字符串中有多餘的空白或製表符,回車等。存儲這些額外的字符是有點浪費空間的。
如果您想要去掉字符串開始和結束的空白可以使用PHP內部函數trim() 。但是, 我們經常想完全清除空白。需要把開始和結束的空白清除掉,將多個空白變為一個空白,使用一個規則來處理同樣的類型的其它空白。
完成這些可以使用PHP的正規表示式來完成
下例可以去除額外Whitespace
<?php $str = " This line contains\tliberal \r\n use of whitespace.\n\n"; // First remove the leading/trailing whitespace //去掉開始和結束的空白 $str = trim($str); // Now remove any doubled-up whitespace //去掉跟隨別的擠在一塊的空白 $str = preg_replace('/\s(?=\s)/', '', $str); // Finally, replace any non-space whitespace, with a space //最後,去掉非space 的空白,用一個空格代替 $str = preg_replace('/[\n\r\t]/', ' ', $str); // Echo out: 'This line contains liberal use of whitespace.' echo "<pre>{$str}</pre>"; ?>
上例一步一步的去掉所有的空白。首先我們使用trim()函數來去掉開始和結束的空白。然後,我們使用preg_replace() 去除重複的。\s代表任何whitespace 。(?=) 表示向前查找 。它味著只匹配後面有和它本身相同字符的字符。所以這個正則表達式的意思是: "被whitespace 字符跟隨的任何whitespace 字符。" 我們用空白來替換掉,這樣也就去除了,留下的將是唯一的whitespace 字符。
最後, 我們使用另一個正則表達式[\n\r\t]來查找任何殘餘的換行符(\n), 回車(\r), 或製表符(\t) 。我們用一個空格來替換這些。