php批量移除UTF-8代码中的BOM

by 清泉 30. 五月 2011 14:19
 在保存一个以UTF-8编码的文件时,会在文件开始的地方插入三个不可见的字符(0xEF 0xBB 0xBF,即BOM)。它是一串隐藏的字符,用于让记事本等编辑器识别这个文件是否以UTF-8编码。对于一般的文件,这样并不会产生什么麻烦。但对于PHP文件来说,BOM的签名是个大麻烦。受COOKIE送出机制的限制,在这些文件开头已经有BOM的文件中,COOKIE无法送出(因为在COOKIE送出前PHP已经送出了文件头),所以登入和登出功能失效。一切依赖COOKIE、SESSION实现的功能全部无效。会造成使用PHP网页脚本,不能登入或者不能登出,页顶出现一条空白,页顶出现错误警告,其它不正常的情况。

一不小心让 ultraedit 写入了bom(因为我在别的机器上编辑过文件,他的ultraedit.ini没设置过),所以搞得authimage显示不出来,忙了好几天。当然最根本就是在ultraedit.ini中修改一下设置为:
程式碼:
Write UTF-8 BOM=0
Write UTF-8 BOM NF=0
同时写了一个小程序,用来自动移除文件头中的boms,放到根目录中执行一次就行了。 微笑
程式碼:
<?php
if (isset($_GET['dir'])){ //config the basedir
$basedir=$_GET['dir'];
}else{
$basedir '.';


$auto 1

checkdir($basedir);

function 
checkdir($basedir){
if ($dh opendir($basedir)) {
while (($file readdir($dh)) !== false) {
if ($file != '.' && $file != '..'){
if (!is_dir($basedir."/".$file)) {
echo "filename: $basedir/$file ".checkBOM("$basedir/$file")." <br>";
}else{
$dirname $basedir."/".$file;
checkdir($dirname);
}
}
}
closedir($dh);
}
}

function 
checkBOM ($filename) {
global $auto;
$contents file_get_contents($filename);
$charset[1] = substr($contents01); 
$charset[2] = substr($contents11); 
$charset[3] = substr($contents21); 
if (ord($charset[1]) == 239 && ord($charset[2]) == 187 && ord($charset[3]) == 191) {
if ($auto == 1) {
$rest substr($contents3);
rewrite ($filename$rest);
return ("<font color=red>BOM found, automatically removed.</font>");
} else {
return ("<font color=red>BOM found.</font>");
}

else return ("BOM Not Found.");
}

function 
rewrite ($filename$data) {
$filenum fopen($filename"w");
flock($filenumLOCK_EX);
fwrite($filenum$data);
fclose($filenum);
}
?>

Tags:

添加评论



(将显示你的Gravatar头像)  

biuquote
微笑得意调皮害羞酷大笑惊讶发呆喜欢可怜尴尬闭嘴噘嘴皱眉伤心抓狂呕吐坏笑漫骂发怒
Loading



Supidea.com 晨飞的梦 @ All Rights Reserved. Powered by BlogYi.NET ver:1.8.0.0. 苏ICP备09011404号

关于博主

kamau
抱着美好的理想背井离乡,这酸甜苦辣只能默默忍受。既然选择了路,就得风雨兼程……

Calendar

<<  二月 2012  >>
303112345
6789101112
13141516171819
20212223242526
2728291234
567891011

在日历中查看文章

最近的评论

Comment RSS

声明

      本博所发一切破解相关附件只作学习研究交流之用,严禁用于商业用途,请在下载24小时内删除。
      本博所有网友评论不代表本博立场,版权归其作者所有。

© Copyright 2009