分类目录归档:玩技术

将UNICODE编码后的中文进行解码

//将UNICODE编码后的内容进行解码
function unicode_decode($name)
{
    //转换编码,将Unicode编码转换成可以浏览的utf-8编码
    $pattern = '/([\w]+)|(\\\u([\w]{4}))/i';
    preg_match_all($pattern, $name, $matches);
    if (!empty($matches))
    {
        $name = '';
        for ($j = 0; $j < count($matches[0]); $j++)
        {
            $str = $matches[0][$j];
            if (strpos($str, '\\u') === 0)
            {
                $code = base_convert(substr($str, 2, 2), 16, 10);
                $code2 = base_convert(substr($str, 4), 16, 10);
                $c = chr($code).chr($code2);
                $c = iconv('UCS-2', 'UTF-8', $c);
                $name .= $c;
            }
            else
            {
                $name .= $str;
            }
        }
    }
    return $name;
}

百度新站收录观察

我的一个繁体中文小站历经几周的筹备,在9月10日上线,在这近半月的时间里,谷歌倒是收录了2800余个页面,但百度在9月10日上线那天收录了首页,在这半个月里便一直没有动静,根据以往经验,百度对新站的观察周期似乎延长了不少。不过在观察周期内,网页收录没有增加也并不意味着百度蜘蛛就没有动静,我猜测这段期间,百度蜘蛛仍是正常的进行爬取,索引结果只是藏着掖着没有放出来而已,所以不要急,坚持做站,总有来流量的那天。

某繁体中文新站

  • 2013/9/10 首次收录首页
  • 2013/9/20 首页快照更新
  • 2013/10/21 谷歌开始来过百流量

某二级域名新站Y:

  • 2013/9/28 周六 终于收录了首页
  • 2013/10/17 周四 site语法 终于看到了131个结果,快照均为9月28日,经过三轮大更新(每周四大更新)终于放出内页了!
  • 2013/10/23 周三 site语法 又只剩下首页了
  • 2013/10/24 周四 site语法 又出现了131个结果
  • 2013/11/23 周六 site语法 出现了152个结果

某二级域名新站G:

  • 2013/10/26 周六 上线当天即收录了首页

近期观察还发现百度对二级目录的考察时间也变长了。

 

IIS7.5/PHPv5.3.24 DiscuzX2.5上传文件出现Upload Error: 500的解决方法

添加了临时目录,重启IIS服务器后终于解决了。

;;;;;;;;;;;;;;;;
; File Uploads ;
;;;;;;;;;;;;;;;;

; Whether to allow HTTP file uploads.
; http://php.net/file-uploads
file_uploads = On

; Temporary directory for HTTP uploaded files (will use system default if not
; specified).
; http://php.net/upload-tmp-dir
upload_tmp_dir =C:\phpfileuploadtmp

; Maximum allowed size for uploaded files.
; http://php.net/upload-max-filesize
upload_max_filesize = 24M

; Maximum number of files that can be uploaded via a single request
max_file_uploads = 20

php Unicode 转换 ASCII


<?php 
$str = '我';

/* 将'我' 转换成'25105' 或'&#25105;' */ 
// 使用iconv 
$unicode_html = base_convert(bin2hex(iconv('UTF-8', 'UCS-4', $str)), 16, 10); // 25105

//使用mb_convert_encoding 
$unicode_html = base_convert(bin2hex(mb_convert_encoding($str, 'ucs-4', 'utf-8')), 16, 10); // 25105

// 补上&#xxxxx; 
$unicode_html = '&#' . base_convert(bin2hex(iconv("utf-8", "ucs-4", $str)), 16, 10) . ';'; // &#25105;

// 将&#25105 转回'我' 
$str = mb_convert_encoding($unicode_html, 'UTF-8', 'HTML-ENTITIES'); // '我', $unicode_html = '&#25105' 
?>