日韩久久久精品,亚洲精品久久久久久久久久久,亚洲欧美一区二区三区国产精品 ,一区二区福利

確保 PHP 應(yīng)用程序的安全

系統(tǒng) 2584 0

開始之前
在本教程中,您將學(xué)習(xí)如何在自己的 PHP Web 應(yīng)用程序中添加安全性。本教程假設(shè)您至少有一年編寫 PHP Web 應(yīng)用程序的經(jīng)驗(yàn),所以這里不涉及 PHP 語言的基本知識(約定或語法)。目標(biāo)是使您了解應(yīng)該如何保護(hù)自己構(gòu)建的 Web 應(yīng)用程序。

目標(biāo)

本教程講解如何防御最常見的安全威脅:SQL 注入、操縱 GET 和 POST 變量、緩沖區(qū)溢出攻擊、跨站點(diǎn)腳本攻擊、瀏覽器內(nèi)的數(shù)據(jù)操縱和遠(yuǎn)程表單提交。

前提條件

本教程是為至少有一年編程經(jīng)驗(yàn)的 PHP 開發(fā)人員編寫的。您應(yīng)該了解 PHP 的語法和約定;這里不解釋這些內(nèi)容。有使用其他語言(比如 Ruby、Python 和 Perl)的經(jīng)驗(yàn)的開發(fā)人員也能夠從本教程中受益,因?yàn)檫@里討論的許多規(guī)則也適用于其他語言和環(huán)境。

安全性快速簡介

Web 應(yīng)用程序最重要的部分是什么?根據(jù)回答問題的人不同,對這個(gè)問題的答案可能是五花八門。業(yè)務(wù)人員需要可靠性和可伸縮性。IT 支持團(tuán)隊(duì)需要健壯的可維護(hù)的代碼。最終用戶需要漂亮的用戶界面和執(zhí)行任務(wù)時(shí)的高性能。但是,如果回答 “安全性”,那么每個(gè)人都會同意這對 Web 應(yīng)用程序很重要。
但是,大多數(shù)討論到此就打住了。盡管安全性在項(xiàng)目的檢查表中,但是往往到了項(xiàng)目交付之前才開始考慮解決安全性問題。采用這種方式的 Web 應(yīng)用程序項(xiàng)目的數(shù)量多得驚人。開發(fā)人員工作幾個(gè)月,只在最后才添加安全特性,從而讓 Web 應(yīng)用程序能夠向公眾開放。
結(jié)果往往是一片混亂,甚至需要返工,因?yàn)榇a已經(jīng)經(jīng)過檢驗(yàn)、單元測試并集成為更大的框架,之后才在其中添加安全特性。添加安全性之后,主要組件可能會停止工作。安全性的集成使得原本順暢(但不安全)的過程增加額外負(fù)擔(dān)或步驟。
本教程提供一種將安全性集成到 PHP Web 應(yīng)用程序中的好方法。它討論幾個(gè)一般性安全主題,然后深入討論主要的安全漏洞以及如何堵住它們。在學(xué)完本教程之后,您會對安全性有更好的理解。
主題包括:
SQL 注入攻擊
操縱 GET 字符串
緩沖區(qū)溢出攻擊
跨站點(diǎn)腳本攻擊(XSS)
瀏覽器內(nèi)的數(shù)據(jù)操縱
遠(yuǎn)程表單提交

Web 安全性 101

在討論實(shí)現(xiàn)安全性的細(xì)節(jié)之前,最好從比較高的角度討論 Web 應(yīng)用程序安全性。本節(jié)介紹安全哲學(xué)的一些基本信條,無論正在創(chuàng)建何種 Web 應(yīng)用程序,都應(yīng)該牢記這些信條。這些思想的一部分來自 Chris Shiflett(他關(guān)于 PHP 安全性的書是無價(jià)的寶庫),一些來自 Simson Garfinkel(參見 參考資料),還有一些來自多年積累的知識。


規(guī)則 1:絕不要信任外部數(shù)據(jù)或輸入


關(guān)于 Web 應(yīng)用程序安全性,必須認(rèn)識到的第一件事是不應(yīng)該信任外部數(shù)據(jù)。外部數(shù)據(jù)(outside data) 包括不是由程序員在 PHP 代碼中直接輸入的任何數(shù)據(jù)。在采取措施確保安全之前,來自任何其他來源(比如 GET 變量、表單 POST、數(shù)據(jù)庫、配置文件、會話變量或 cookie)的任何數(shù)據(jù)都是不可信任的。
例如,下面的數(shù)據(jù)元素可以被認(rèn)為是安全的,因?yàn)樗鼈兪窃?PHP 中設(shè)置的。


清單 1. 安全無暇的代碼

      $myUsername = ‘tmyer’;
$arrayUsers = array(’tmyer’, ‘tom’, ‘tommy’);
define(”GREETING”, ‘hello there’ . $myUsername);
    

?
但是,下面的數(shù)據(jù)元素都是有瑕疵的。

?


清單 2. 不安全、有瑕疵的代碼

      $myUsername = $_POST['username']; //tainted!
$arrayUsers = array($myUsername, ‘tom’, ‘tommy’); //tainted!
define(”GREETING”, ‘hello there’ . $myUsername); //tainted!
    

?
為什么第一個(gè)變量 $myUsername 是有瑕疵的?因?yàn)樗苯觼碜员韱?POST。用戶可以在這個(gè)輸入域中輸入任何字符串,包括用來清除文件或運(yùn)行以前上傳的文件的惡意命令。您可能會問,“難道不能使用只接受字母 A-Z 的客戶端(JavaScript)表單檢驗(yàn)?zāi)_本來避免這種危險(xiǎn)嗎?”是的,這總是一個(gè)有好處的步驟,但是正如在后面會看到的,任何人都可以將任何表單下載 到自己的機(jī)器上,修改它,然后重新提交他們需要的任何內(nèi)容。

?


解決方案很簡單:必須對 $_POST['username'] 運(yùn)行清理代碼。如果不這么做,那么在使用 $myUsername 的任何其他時(shí)候(比如在數(shù)組或常量中),就可能污染這些對象。


對用戶輸入進(jìn)行清理的一個(gè)簡單方法是,使用正則表達(dá)式來處理它。在這個(gè)示例中,只希望接受字母。將字符串限制為特定數(shù)量的字符,或者要求所有字母都是小寫的,這可能也是個(gè)好主意。


清單 3. 使用戶輸入變得安全

      $myUsername = cleanInput($_POST['username']); //clean!
$arrayUsers = array($myUsername, ‘tom’, ‘tommy’); //clean!
define(”GREETING”, ‘hello there’ . $myUsername); //clean!
function cleanInput($input){
$clean = strtolower($input);
$clean = preg_replace(”/[^a-z]/”, “”, $clean);
$clean = substr($clean,0,12);
return $clean;
}
    

?

?

規(guī)則 2:禁用那些使安全性難以實(shí)施的 PHP 設(shè)置


已經(jīng)知道了不能信任用戶輸入,還應(yīng)該知道不應(yīng)該信任機(jī)器上配置 PHP 的方式。例如,要確保禁用 register_globals。如果啟用了 register_globals,就可能做一些粗心的事情,比如使用 $variable 替換同名的 GET 或 POST 字符串。通過禁用這個(gè)設(shè)置,PHP 強(qiáng)迫您在正確的名稱空間中引用正確的變量。要使用來自表單 POST 的變量,應(yīng)該引用 $_POST['variable']。這樣就不會將這個(gè)特定變量誤會成 cookie、會話或 GET 變量。


要檢查的第二個(gè)設(shè)置是錯誤報(bào)告級別。在開發(fā)期間,希望獲得盡可能多的錯誤報(bào)告,但是在交付項(xiàng)目時(shí),希望將錯誤記錄到日志文件中,而不是顯示在屏幕上。為什 么呢?因?yàn)閻阂獾暮诳蜁褂缅e誤報(bào)告信息(比如 SQL 錯誤)來猜測應(yīng)用程序正在做什么。這種偵察可以幫助黑客突破應(yīng)用程序。為了堵住這個(gè)漏洞,需要編輯 php.ini 文件,為 error_log 條目提供合適的目的地,并將 display_errors 設(shè)置為 Off。

規(guī)則 3:如果不能理解它,就不能保護(hù)它


一些開發(fā)人員使用奇怪的語法,或者將語句組織得很緊湊,形成簡短但是含義模糊的代碼。這種方式可能效率高,但是如果您不理解代碼正在做什么,那么就無法決定如何保護(hù)它。
例如,您喜歡下面兩段代碼中的哪一段?


清單 4. 使代碼容易得到保護(hù) ??? ?? ?? ?? ?? ?

      //obfuscated code
$input = (isset($_POST['username']) ? $_POST['username']:”);
//unobfuscated code
$input = ”;
if (isset($_POST['username'])){
$input = $_POST['username'];
}else{
$input = ”;
}
    

?

?

在第二個(gè)比較清晰的代碼段中,很容易看出 $input 是有瑕疵的,需要進(jìn)行清理,然后才能安全地處理。


規(guī)則 4:“縱深防御” 是新的法寶
本教程將用示例來說明如何保護(hù)在線表單,同時(shí)在處理表單的 PHP 代碼中采用必要的措施。同樣,即使使用 PHP regex 來確保 GET 變量完全是數(shù)字的,仍然可以采取措施確保 SQL 查詢使用轉(zhuǎn)義的用戶輸入。
縱深防御不只是一種好思想,它可以確保您不會陷入嚴(yán)重的麻煩。


既然已經(jīng)討論了基本規(guī)則,現(xiàn)在就來研究第一種威脅:SQL 注入攻擊。

防止 SQL 注入攻擊

在 SQL 注入攻擊 中,用戶通過操縱表單或 GET 查詢字符串,將信息添加到數(shù)據(jù)庫查詢中。例如,假設(shè)有一個(gè)簡單的登錄數(shù)據(jù)庫。這個(gè)數(shù)據(jù)庫中的每個(gè)記錄都有一個(gè)用戶名字段和一個(gè)密碼字段。構(gòu)建一個(gè)登錄表單,讓用戶能夠登錄。


清單 5. 簡單的登錄表單

      <html>
<head>
<title>Login</title>
</head>
<body>
<form action=”verify.php” method=”post”>
<p><label for=’user’>Username</label>
<input type=’text’ name=’user’ id=’user’/>
</p>
<p><label for=’pw’>Password</label>
<input type=’password’ name=’pw’ id=’pw’/>
</p>
<p><input type=’submit’ value=’login’/></p>
</form>
</body>
</html>
    

?
這個(gè)表單接受用戶輸入的用戶名和密碼,并將用戶輸入提交給名為 verify.php 的文件。在這個(gè)文件中,PHP 處理來自登錄表單的數(shù)據(jù),如下所示:

?


清單 6. 不安全的 PHP 表單處理代碼

      <?php
$okay = 0;
$username = $_POST['user'];
$pw = $_POST['pw'];
$sql = “select count(*) as ctr from users where
username=’”.$username.”‘ and password=’”. $pw.”‘ limit 1″;

$result = mysql_query($sql);
while ($data = mysql_fetch_object($result)){
if ($data->ctr == 1){
  //they’re okay to enter the application!
  $okay = 1;
}
}
if ($okay){
$_SESSION['loginokay'] = true;
header(”index.php”);
}else{
header(”login.php”);
}
?> 
    

?
這段代碼看起來沒問題,對嗎?世界各地成百(甚至成千)的 PHP/MySQL 站點(diǎn)都在使用這樣的代碼。它錯在哪里?好,記住 “不能信任用戶輸入”。這里沒有對來自用戶的任何信息進(jìn)行轉(zhuǎn)義,因此使應(yīng)用程序容易受到攻擊。具體來說,可能會出現(xiàn)任何類型的 SQL 注入攻擊。

?


例如,如果用戶輸入 foo 作為用戶名,輸入 ‘ or ‘1′=’1 作為密碼,那么實(shí)際上會將以下字符串傳遞給 PHP,然后將查詢傳遞給 MySQL:


$sql = “select count(*) as ctr??from users where username=’foo’ and password=” or ‘1′=’1′ limit 1″;


這個(gè)查詢總是返回計(jì)數(shù)值 1,因此 PHP 會允許進(jìn)行訪問。通過在密碼字符串的末尾注入某些惡意 SQL,黑客就能裝扮成合法的用戶。


解決這個(gè)問題的辦法是,將 PHP 的內(nèi)置 mysql_real_escape_string() 函數(shù)用作任何用戶輸入的包裝器。這個(gè)函數(shù)對字符串中的字符進(jìn)行轉(zhuǎn)義,使字符串不可能傳遞撇號等特殊字符并讓 MySQL 根據(jù)特殊字符進(jìn)行操作。

?

清單 7 展示了帶轉(zhuǎn)義處理的代碼。
清單 7. 安全的 PHP 表單處理代碼

      <?php
$okay = 0;
$username = $_POST['user'];
$pw = $_POST['pw'];
$sql = “select count(*) as ctr from users where
  username=’”.mysql_real_escape_string($username).”‘
  and password=’”. mysql_real_escape_string($pw).”‘ limit 1″;
  
$result = mysql_query($sql);
while ($data = mysql_fetch_object($result)){
if ($data->ctr == 1){
  //they’re okay to enter the application!
  $okay = 1;
}
}
if ($okay){
$_SESSION['loginokay'] = true;
header(”index.php”);
}else{
header(”login.php”);
}
?>
    


使用 mysql_real_escape_string() 作為用戶輸入的包裝器,就可以避免用戶輸入中的任何惡意 SQL 注入。如果用戶嘗試通過 SQL 注入傳遞畸形的密碼,那么會將以下查詢傳遞給數(shù)據(jù)庫:


select count(*) as ctr from users where \ username=’foo’ and password=’\’ or \’1\’=\’1′ limit 1″


數(shù)據(jù)庫中沒有任何東西與這樣的密碼匹配。僅僅采用一個(gè)簡單的步驟,就堵住了 Web 應(yīng)用程序中的一個(gè)大漏洞。這里得出的經(jīng)驗(yàn)是,總是應(yīng)該對 SQL 查詢的用戶輸入進(jìn)行轉(zhuǎn)義。


但是,還有幾個(gè)安全漏洞需要堵住。下一項(xiàng)是操縱 GET 變量。

防止用戶操縱 變量

在前一節(jié)中,防止了用戶使用畸形的密碼進(jìn)行登錄。如果您很聰明,應(yīng)該應(yīng)用您學(xué)到的方法,確保對 SQL 語句的所有用戶輸入進(jìn)行轉(zhuǎn)義。


但是,用戶現(xiàn)在已經(jīng)安全地登錄了。用戶擁有有效的密碼,并不意味著他將按照規(guī)則行事 —— 他有很多機(jī)會能夠造成損害。例如,應(yīng)用程序可能允許用戶查看特殊的內(nèi)容。所有鏈接指向 template.php?pid=33 或 template.php?pid=321 這樣的位置。URL 中問號后面的部分稱為查詢字符串。因?yàn)椴樵冏址苯臃旁?URL 中,所以也稱為 GET 查詢字符串。


在 PHP 中,如果禁用了 register_globals,那么可以用 $_GET['pid'] 訪問這個(gè)字符串。在 template.php 頁面中,可能會執(zhí)行與清單 8 相似的操作。


清單 8. 示例 template.php

      <?php
$pid = $_GET['pid'];
//we create an object of a fictional class Page
$obj = new Page;
$content = $obj->fetchPage($pid);
//and now we have a bunch of PHP that displays the page
//……
//……
?>
    

?
這里有什么錯嗎?首先,這里隱含地相信來自瀏覽器的 GET 變量 pid 是安全的。這會怎么樣呢?大多數(shù)用戶沒那么聰明,無法構(gòu)造出語義攻擊。但是,如果他們注意到瀏覽器的 URL 位置域中的 pid=33,就可能開始搗亂。如果他們輸入另一個(gè)數(shù)字,那么可能沒問題;但是如果輸入別的東西,比如輸入 SQL 命令或某個(gè)文件的名稱(比如 /etc/passwd),或者搞別的惡作劇,比如輸入長達(dá) 3,000 個(gè)字符的數(shù)值,那么會發(fā)生什么呢?
在這種情況下,要記住基本規(guī)則,不要信任用戶輸入。應(yīng)用程序開發(fā)人員知道 template.php 接受的個(gè)人標(biāo)識符(PID)應(yīng)該是數(shù)字,所以可以使用 PHP 的 is_numeric() 函數(shù)確保不接受非數(shù)字的 PID,如下所示:

?

?

清單 9. 使用 is_numeric() 來限制 GET 變量

      <?php
$pid = $_GET['pid'];
if (is_numeric($pid)){
//we create an object of a fictional class Page
$obj = new Page;
$content = $obj->fetchPage($pid);
//and now we have a bunch of PHP that displays the page
//……
//……
}else{
//didn’t pass the is_numeric() test, do something else!
}?>
    

?
這個(gè)方法似乎是有效的,但是以下這些輸入都能夠輕松地通過 is_numeric() 的檢查:
100 (有效)
100.1 (不應(yīng)該有小數(shù)位)
+0123.45e6 (科學(xué)計(jì)數(shù)法 —— 不好)
0xff33669f (十六進(jìn)制 —— 危險(xiǎn)!危險(xiǎn)!)
那么,有安全意識的 PHP 開發(fā)人員應(yīng)該怎么做呢?多年的經(jīng)驗(yàn)表明,最好的做法是使用正則表達(dá)式來確保整個(gè) GET 變量由數(shù)字組成,如下所示:

?


清單 10. 使用正則表達(dá)式限制 GET 變量

      <?php
$pid = $_GET['pid'];
<b>
if (strlen($pid)){
if (!ereg(”^[0-9]+$”,$pid)){
  //do something appropriate, like maybe logging \
  them out or sending them back to home page
}
}else{
//empty $pid, so send them back to the home page
}
</b>
//we create an object of a fictional class Page, which is now
//moderately protected from evil user input
$obj = new Page;
$content = $obj->fetchPage($pid);
//and now we have a bunch of PHP that displays the page
//……
//……
?>
    

?
需要做的只是使用 strlen() 檢查變量的長度是否非零;如果是,就使用一個(gè)全數(shù)字正則表達(dá)式來確保數(shù)據(jù)元素是有效的。如果 PID 包含字母、斜線、點(diǎn)號或任何與十六進(jìn)制相似的內(nèi)容,那么這個(gè)例程捕獲它并將頁面從用戶活動中屏蔽。如果看一下 Page 類幕后的情況,就會看到有安全意識的 PHP 開發(fā)人員已經(jīng)對用戶輸入 $pid 進(jìn)行了轉(zhuǎn)義,從而保護(hù)了 fetchPage() 方法,如下所示:

?


清單 11. 對 fetchPage() 方法進(jìn)行轉(zhuǎn)義

      <?php
class Page{
  function fetchPage($pid){
  $sql = “select pid,title,desc,kw,content,\
  status from page where pid=’
  ”.mysql_real_escape_string($pid).”‘”;
  //etc, etc….

}
}
?>
    

?
您可能會問,“既然已經(jīng)確保 PID 是數(shù)字,那么為什么還要進(jìn)行轉(zhuǎn)義?” 因?yàn)椴恢涝诙嗌俨煌纳舷挛暮颓闆r中會使用 fetchPage() 方法。必須在調(diào)用這個(gè)方法的所有地方進(jìn)行保護(hù),而方法中的轉(zhuǎn)義體現(xiàn)了縱深防御的意義。

?


如果用戶嘗試輸入非常長的數(shù)值,比如長達(dá) 1000 個(gè)字符,試圖發(fā)起緩沖區(qū)溢出攻擊,那么會發(fā)生什么呢?下一節(jié)更詳細(xì)地討論這個(gè)問題,但是目前可以添加另一個(gè)檢查,確保輸入的 PID 具有正確的長度。您知道數(shù)據(jù)庫的 pid 字段的最大長度是 5 位,所以可以添加下面的檢查。


清單 12. 使用正則表達(dá)式和長度檢查來限制 GET 變量

      <?php
$pid = $_GET['pid'];
if (strlen($pid)){
if (!ereg(”^[0-9]+$”,$pid) && strlen($pid) > 5){
  //do something appropriate, like maybe logging \
  them out or sending them back to home page
}
}else{
//empty $pid, so send them back to the home page
}
//we create an object of a fictional class Page, which is now
//even more protected from evil user input
$obj = new Page;
$content = $obj->fetchPage($pid);
//and now we have a bunch of PHP that displays the page
//……
//……
?> 
    

?
現(xiàn)在,任何人都無法在數(shù)據(jù)庫應(yīng)用程序中塞進(jìn)一個(gè) 5,000 位的數(shù)值 —— 至少在涉及 GET 字符串的地方不會有這種情況。想像一下黑客在試圖突破您的應(yīng)用程序而遭到挫折時(shí)咬牙切齒的樣子吧!而且因?yàn)殛P(guān)閉了錯誤報(bào)告,黑客更難進(jìn)行偵察。

緩沖區(qū)溢出攻擊

緩沖區(qū)溢出攻擊 試圖使 PHP 應(yīng)用程序中(或者更精確地說,在 Apache 或底層操作系統(tǒng)中)的內(nèi)存分配緩沖區(qū)發(fā)生溢出。請記住,您可能是使用 PHP 這樣的高級語言來編寫 Web 應(yīng)用程序,但是最終還是要調(diào)用 C(在 Apache 的情況下)。與大多數(shù)低級語言一樣,C 對于內(nèi)存分配有嚴(yán)格的規(guī)則。

?


緩沖區(qū)溢出攻擊向緩沖區(qū)發(fā)送大量數(shù)據(jù),使部分?jǐn)?shù)據(jù)溢出到相鄰的內(nèi)存緩沖區(qū),從而破壞緩沖區(qū)或者重寫邏輯。這樣就能夠造成拒絕服務(wù)、破壞數(shù)據(jù)或者在遠(yuǎn)程服務(wù)器上執(zhí)行惡意代碼。


防止緩沖區(qū)溢出攻擊的惟一方法是檢查所有用戶輸入的長度。例如,如果有一個(gè)表單元素要求輸入用戶的名字,那么在這個(gè)域上添加值為 40 的 maxlength 屬性,并在后端使用 substr() 進(jìn)行檢查。清單 13 給出表單和 PHP 代碼的簡短示例。


清單 13. 檢查用戶輸入的長度

      <?php
if ($_POST['submit'] == “go”){
$name = substr($_POST['name'],0,40);
//continue processing….
}
?>
<form action=”<?php echo \
$_SERVER['PHP_SELF'];?>” method=”post”>
<p><label for=”name”>Name</label>
<input type=”text” name=\
“name” id=”name” size=”20″ maxlength=”40″/></p>
<p><input type=”submit” name=”submit” value=”go”/></p>
</form>
    

?
為什么既提供 maxlength 屬性,又在后端進(jìn)行 substr() 檢查?因?yàn)榭v深防御總是好的。瀏覽器防止用戶輸入 PHP 或 MySQL 不能安全地處理的超長字符串(想像一下有人試圖輸入長達(dá) 1,000 個(gè)字符的名稱),而后端 PHP 檢查會確保沒有人遠(yuǎn)程地或者在瀏覽器中操縱表單數(shù)據(jù)。

?


正如您看到的,這種方式與前一節(jié)中使用 strlen() 檢查 GET 變量 pid 的長度相似。在這個(gè)示例中,忽略長度超過 5 位的任何輸入值,但是也可以很容易地將值截短到適當(dāng)?shù)拈L度,如下所示:


清單 14. 改變輸入的 GET 變量的長度

      <?php
$pid = $_GET['pid'];
if (strlen($pid)){
if (!ereg(”^[0-9]+$”,$pid)){
  //if non numeric $pid, send them back to home page
}
}else{
//empty $pid, so send them back to the home page
}
//we have a numeric pid, but it may be too long, so let’s check
if (strlen($pid)>5){
  $pid = substr($pid,0,5);
}
//we create an object of a fictional class Page, which is now
//even more protected from evil user input
$obj = new Page;
$content = $obj->fetchPage($pid);
//and now we have a bunch of PHP that displays the page
//……
//……
?>
    


注意,緩沖區(qū)溢出攻擊并不限于長的數(shù)字串或字母串。也可能會看到長的十六進(jìn)制字符串(往往看起來像 \xA3 或 \xFF)。記住,任何緩沖區(qū)溢出攻擊的目的都是淹沒特定的緩沖區(qū),并將惡意代碼或指令放到下一個(gè)緩沖區(qū)中,從而破壞數(shù)據(jù)或執(zhí)行惡意代碼。對付十六進(jìn)制緩 沖區(qū)溢出最簡單的方法也是不允許輸入超過特定的長度。


如果您處理的是允許在數(shù)據(jù)庫中輸入較長條目的表單文本區(qū),那么無法在客戶端輕松地限制數(shù)據(jù)的長度。在數(shù)據(jù)到達(dá) PHP 之后,可以使用正則表達(dá)式清除任何像十六進(jìn)制的字符串。


清單 15. 防止十六進(jìn)制字符串

      <?php
if ($_POST['submit'] == “go”){
$name = substr($_POST['name'],0,40);
//clean out any potential hexadecimal characters
$name = cleanHex($name);
//continue processing….
}
function cleanHex($input){
$clean = preg_replace(”![\][xX]([A-Fa-f0-9]{1,3})!”, “”,$input);
return $clean;
}
?>
<form action=”<?php echo $_SERVER['PHP_SELF'];?>” method=”post”>
<p><label for=”name”>Name</label>
<input type=”text” name=”name” id=”name” size=”20″ maxlength=”40″/></p>
<p><input type=”submit” name=”submit” value=”go”/></p>
</form>
    

?
您可能會發(fā)現(xiàn)這一系列操作有點(diǎn)兒太嚴(yán)格了。畢竟,十六進(jìn)制串有合法的用途,比如輸出外語中的字符。如何部署十六進(jìn)制 regex 由您自己決定。比較好的策略是,只有在一行中包含過多十六進(jìn)制串時(shí),或者字符串的字符超過特定數(shù)量(比如 128 或 255)時(shí),才刪除十六進(jìn)制串。

跨站點(diǎn)腳本攻擊

在跨站點(diǎn)腳本(XSS)攻擊中,往往有一個(gè)惡意用戶在表單中(或通過其他用戶輸入方式)輸入信息,這些輸入將惡意的客戶端標(biāo)記插入過程或數(shù)據(jù)庫中。例如, 假設(shè)站點(diǎn)上有一個(gè)簡單的來客登記簿程序,讓訪問者能夠留下姓名、電子郵件地址和簡短的消息。惡意用戶可以利用這個(gè)機(jī)會插入簡短消息之外的東西,比如對于其 他用戶不合適的圖片或?qū)⒂脩糁囟ㄏ虻搅硪粋€(gè)站點(diǎn)的 JavaScript,或者竊取 cookie 信息。


幸運(yùn)的是,PHP 提供了 strip_tags() 函數(shù),這個(gè)函數(shù)可以清除任何包圍在 HTML 標(biāo)記中的內(nèi)容。strip_tags() 函數(shù)還允許提供允許標(biāo)記的列表,比如 <b> 或 <i>。


清單 16 給出一個(gè)示例,這個(gè)示例是在前一個(gè)示例的基礎(chǔ)上構(gòu)建的。


清單 16. 從用戶輸入中清除 HTML 標(biāo)記

      <?php
if ($_POST['submit'] == “go”){
//strip_tags
$name = strip_tags($_POST['name']);
$name = substr($name,0,40);
//clean out any potential hexadecimal characters
$name = cleanHex($name);
//continue processing….
}
function cleanHex($input){
$clean = preg_replace\
(”![\][xX]([A-Fa-f0-9]{1,3})!”, “”,$input);
return $clean;
}
?>
<form action=\
“<?php echo $_SERVER['PHP_SELF'];?>” method=”post”>
<p><label for=”name”>Name</label>
<input type=\
“text” name=”name” id=”name” size=”20″ maxlength=”40″/></p>
<p><input type=”submit” name=”submit” value=”go”/></p>
</form>
    

?
從安全的角度來看,對公共用戶輸入使用 strip_tags() 是必要的。如果表單在受保護(hù)區(qū)域(比如內(nèi)容管理系統(tǒng))中,而且您相信用戶會正確地執(zhí)行他們的任務(wù)(比如為 Web 站點(diǎn)創(chuàng)建 HTML 內(nèi)容),那么使用 strip_tags() 可能是不必要的,會影響工作效率。


還有一個(gè)問題:如果要接受用戶輸入,比如對貼子的評論或來客登記項(xiàng),并需要將這個(gè)輸入向其他用戶顯示,那么一定要將響應(yīng)放在 PHP 的 htmlspecialchars() 函數(shù)中。這個(gè)函數(shù)將與符號、< 和 > 符號轉(zhuǎn)換為 HTML 實(shí)體。例如,與符號(&)變成 &。這樣的話,即使惡意內(nèi)容躲開了前端 strip_tags() 的處理,也會在后端被 htmlspecialchars() 處理掉。

瀏覽器內(nèi)的數(shù)據(jù)操縱

有一類瀏覽器插件允許用戶篡改頁面上的頭部元素和表單元素。使用 Tamper Data(一個(gè) Mozilla 插件),可以很容易地操縱包含許多隱藏文本字段的簡單表單,從而向 PHP 和 MySQL 發(fā)送指令。


用戶在點(diǎn)擊表單上的 Submit 之前,他可以啟動 Tamper Data。在提交表單時(shí),他會看到表單數(shù)據(jù)字段的列表。Tamper Data 允許用戶篡改這些數(shù)據(jù),然后瀏覽器完成表單提交。


讓我們回到前面建立的示例。已經(jīng)檢查了字符串長度、清除了 HTML 標(biāo)記并刪除了十六進(jìn)制字符。但是,添加了一些隱藏的文本字段,如下所示:


清單 17. 隱藏變量

      <?php
if ($_POST['submit'] == “go”){
//strip_tags
$name = strip_tags($_POST['name']);
$name = substr($name,0,40);
//clean out any potential hexadecimal characters
$name = cleanHex($name);
//continue processing….
}
function cleanHex($input){
$clean = \
preg_replace(”![\][xX]([A-Fa-f0-9]{1,3})!”, “”,$input);
return $clean;
}
?>
<form action=\
”<?php echo $_SERVER['PHP_SELF'];?>” method=”post”>
<p><label for=\”name”>Name</label>
<input type=\
“text” name=”name” id=”name” size=”20″ maxlength=”40″/></p>
<input type=”hidden” name=”table” value=”users”/>
<input type=”hidden” name=”action” value=”create”/>
<input type=”hidden” name=”status” value=”live”/>
<p><input type=”submit” name=”submit” value=”go”/></p>
</form> 
    

?
注意,隱藏變量之一暴露了表名:users。還會看到一個(gè)值為 create 的 action 字段。只要有基本的 SQL 經(jīng)驗(yàn),就能夠看出這些命令可能控制著中間件中的一個(gè) SQL 引擎。想搞大破壞的人只需改變表名或提供另一個(gè)選項(xiàng),比如 delete。


圖 1 說明了 Tamper Data 能夠提供的破壞范圍。注意,Tamper Data 不但允許用戶訪問表單數(shù)據(jù)元素,還允許訪問 HTTP 頭和 cookie。

圖 1. Tamper Data 窗口
確保 PHP 應(yīng)用程序的安全

要防御這種工具,最簡單的方法是假設(shè)任何用戶都可能使用 Tamper Data(或類似的工具)。只提供系統(tǒng)處理表單所需的最少量的信息,并把表單提交給一些專用的邏輯。例如,注冊表單應(yīng)該只提交給注冊邏輯。


如果已經(jīng)建立了一個(gè)通用表單處理函數(shù),有許多頁面都使用這個(gè)通用邏輯,那該怎么辦?如果使用隱藏變量來控制流向,那該怎么辦?例如,可能在隱藏表單變量中指定寫哪個(gè)數(shù)據(jù)庫表或使用哪個(gè)文件存儲庫。有 4 種選擇:
不改變?nèi)魏螙|西,暗自祈禱系統(tǒng)上沒有任何惡意用戶。
重寫功能,使用更安全的專用表單處理函數(shù),避免使用隱藏表單變量。
使用 md5() 或其他加密機(jī)制對隱藏表單變量中的表名或其他敏感信息進(jìn)行加密。在 PHP 端不要忘記對它們進(jìn)行解密。


通過使用縮寫或昵稱讓值的含義模糊,在 PHP 表單處理函數(shù)中再對這些值進(jìn)行轉(zhuǎn)換。例如,如果要引用 users 表,可以用 u 或任意字符串(比如 u8y90×0jkL)來引用它。


后兩個(gè)選項(xiàng)并不完美,但是與讓用戶輕松地猜出中間件邏輯或數(shù)據(jù)模型相比,它們要好得多了。
現(xiàn)在還剩下什么問題呢?遠(yuǎn)程表單提交。

遠(yuǎn)程表單提交

Web 的好處是可以分享信息和服務(wù)。壞處也是可以分享信息和服務(wù),因?yàn)橛行┤俗鍪潞翢o顧忌。
以表單為例。任何人都能夠訪問一個(gè) Web 站點(diǎn),并使用瀏覽器上的 File > Save As 建立表單的本地副本。然后,他可以修改 action 參數(shù)來指向一個(gè)完全限定的 URL(不指向 formHandler.php,而是指向 http://www.yoursite.com/formHandler.php ,因?yàn)楸韱卧谶@個(gè)站點(diǎn)上),做他希望的任何修改,點(diǎn)擊 Submit,服務(wù)器會把這個(gè)表單數(shù)據(jù)作為合法通信流接收。


首先可能考慮檢查 $_SERVER['HTTP_REFERER'],從而判斷請求是否來自自己的服務(wù)器,這種方法可以擋住大多數(shù)惡意用戶,但是擋不住最高明的黑客。這些人足夠聰明,能夠篡改頭部中的引用者信息,使表單的遠(yuǎn)程副本看起來像是從您的服務(wù)器提交的。


處理遠(yuǎn)程表單提交更好的方式是,根據(jù)一個(gè)惟一的字符串或時(shí)間戳生成一個(gè)令牌,并將這個(gè)令牌放在會話變量和表單中。提交表單之后,檢查兩個(gè)令牌是否匹配。如果不匹配,就知道有人試圖從表單的遠(yuǎn)程副本發(fā)送數(shù)據(jù)。


要創(chuàng)建隨機(jī)的令牌,可以使用 PHP 內(nèi)置的 md5()、uniqid() 和 rand() 函數(shù),如下所示:


清單 18. 防御遠(yuǎn)程表單提交

      <?php
session_start();
if ($_POST['submit'] == “go”){
//check token
if ($_POST['token'] == $_SESSION['token']){
  //strip_tags
  $name = strip_tags($_POST['name']);
  $name = substr($name,0,40);
  //clean out any potential hexadecimal characters
  $name = cleanHex($name);
  //continue processing….
}else{
  //stop all processing! remote form posting attempt!
}
}
$token = md5(uniqid(rand(), true));
$_SESSION['token']= $token;
function cleanHex($input){
$clean = preg_replace(”![\][xX]([A-Fa-f0-9]{1,3})!”, “”,$input);
return $clean;
}
?>
<form action=”<?php echo $_SERVER['PHP_SELF'];?>” method=”post”>
<p><label for=”name”>Name</label>
<input type=”text” name=”name” id=”name” size=”20″ maxlength=”40″/></p>
<input type=”hidden” name=”token” value=”<?php echo $token;?>”/>
<p><input type=”submit” name=”submit” value=”go”/></p>
</form>
    

?
這種技術(shù)是有效的,這是因?yàn)樵?PHP 中會話數(shù)據(jù)無法在服務(wù)器之間遷移。即使有人獲得了您的 PHP 源代碼,將它轉(zhuǎn)移到自己的服務(wù)器上,并向您的服務(wù)器提交信息,您的服務(wù)器接收的也只是空的或畸形的會話令牌和原來提供的表單令牌。它們不匹配,遠(yuǎn)程表單提交就失敗了。

結(jié)束語

本教程討論了許多問題:
使用 mysql_real_escape_string() 防止 SQL 注入問題。
使用正則表達(dá)式和 strlen() 來確保 GET 數(shù)據(jù)未被篡改。
使用正則表達(dá)式和 strlen() 來確保用戶提交的數(shù)據(jù)不會使內(nèi)存緩沖區(qū)溢出。
使用 strip_tags() 和 htmlspecialchars() 防止用戶提交可能有害的 HTML 標(biāo)記。
避免系統(tǒng)被 Tamper Data 這樣的工具突破。
使用惟一的令牌防止用戶向服務(wù)器遠(yuǎn)程提交表單。
本教程沒有涉及更高級的主題,比如文件注入、HTTP 頭欺騙和其他漏洞。但是,您學(xué)到的知識可以幫助您馬上增加足夠的安全性,使當(dāng)前項(xiàng)目更安全。

?

確保 PHP 應(yīng)用程序的安全


更多文章、技術(shù)交流、商務(wù)合作、聯(lián)系博主

微信掃碼或搜索:z360901061

微信掃一掃加我為好友

QQ號聯(lián)系: 360901061

您的支持是博主寫作最大的動力,如果您喜歡我的文章,感覺我的文章對您有幫助,請用微信掃描下面二維碼支持博主2元、5元、10元、20元等您想捐的金額吧,狠狠點(diǎn)擊下面給點(diǎn)支持吧,站長非常感激您!手機(jī)微信長按不能支付解決辦法:請將微信支付二維碼保存到相冊,切換到微信,然后點(diǎn)擊微信右上角掃一掃功能,選擇支付二維碼完成支付。

【本文對您有幫助就好】

您的支持是博主寫作最大的動力,如果您喜歡我的文章,感覺我的文章對您有幫助,請用微信掃描上面二維碼支持博主2元、5元、10元、自定義金額等您想捐的金額吧,站長會非常 感謝您的哦!!!

發(fā)表我的評論
最新評論 總共0條評論
主站蜘蛛池模板: 金溪县| 铜梁县| 怀仁县| 韩城市| 五大连池市| 平罗县| 平谷区| 巨鹿县| 洪雅县| 宁德市| 南皮县| 绥江县| 罗江县| 庆阳市| 丹阳市| 桐庐县| 洛隆县| 棋牌| 论坛| 平塘县| 济南市| 万安县| 永胜县| 安平县| 佛冈县| 清水河县| 通山县| 祁东县| 永德县| 漳平市| 汤阴县| 临清市| 贵州省| 拜城县| 五台县| 洛隆县| 静海县| 永修县| 民和| 鄱阳县| 庆元县|