2009年11月14日星期六

去除PHP文件中UTF8的BOM

[php]
if (isset($_GET['dir'])) {
//config the basedir
$basedir = $_GET['dir'];
} else {
$basedir = '.';
}
$auto = 1;
checkdir($basedir);
function checkdir($basedir){
  if ($dh = opendir($basedir)) {
    while (($file = readdir($dh)) !== false) {
      if ($file != '.' && $file != '..'){
        if (!is_dir($basedir."/".$file)) {
echo "filename: $basedir/$file ".checkBOM("$basedir/$file") . " <br />";
        } else {
$dirname = $basedir . "/" . $file;
checkdir($dirname);
        }
      }
    }
closedir($dh);
  }
}
function checkBOM ($filename) {
  global $auto;
  $contents = file_get_contents($filename);
  $charset[1] = substr($contents, 0, 1);
  $charset[2] = substr($contents, 1, 1);
  $charset[3] = substr($contents, 2, 1);
  if (ord($charset[1]) == 239 && ord($charset[2]) == 187 && ord($charset[3]) == 191) {
    if ($auto == 1) {
      $rest = substr($contents, 3);
      rewrite ($filename, $rest);
      return ("<font color=red>BOM found, automatically removed.</font>");
    } else {
      return ("<font color=red>BOM found. </font>");
    }
  }
  else return ("BOM Not Found.");
}
function rewrite ($filename, $data) {
  $filenum = fopen($filename, "w");
  flock($filenum, LOCK_EX);
  fwrite($filenum, $data);
  fclose($filenum);
}
[/php]

附:BOM 解释
BOM: Byte Order Mark
UTF-8 BOM又叫UTF-8 签名, 其实UTF-8 的BOM对UFT-8没有作用, 是为了支持UTF-16, UTF-32才加上的BOM, BOM签名的意思就是告诉编辑器当前文件采用何种编码,方便编辑器识别, 但是BOM虽然在编辑器中不显示, 但是会产生输出, 就像多了一个空行。

没有评论 :

发表评论