1. 二宝博客首页
  2. 服务器

Rewrite编码问题解决

Seo方面对于中文地址或则文件名,在Google好像比重要大一些,今天正好看到andy的文章.转下,以后也许会用.

.htaccess文件

RewriteRule ^(.*).html$ index.php?id=$1

对于一个网址http://www.21andy.com/我是谁.html 我们将会遇到以下4种情况

  1. http://www.21andy.com/我是谁.html (这里的”我是谁”是GB2312编码)
    IE打开,接收到的id是utf8编码的”我是谁”
    FireFox打开,接收不到id值,并且Apache会出现403错误。
    这里需要着重说明一下,因为FireFox会将”我是谁”自动urlencode,如果你的页面链接中”我是谁”的编码是gb2312就会出错。
  2. http://www.21andy.com/我是谁.html (这里的”我是谁”是UTF8编码)
    IE和FireFox打开,都可以接收到id值
  3. http://www.21andy.com/%CE%D2%CA%C7%CB%AD.html (这里是urlencode后的”我是谁”GB2312编码)
    IE和FireFox打开,都接收不到id值,并且Apache会出现403错误。
  4. http://www.21andy.com/%E6%88%91%E6%98%AF%E8%B0%81.html (这里是urlencode后的”我是谁”UTF8编码)
    IE和FireFox打开,都可以接收到id值

说明:

“我是谁”的UTF8编码urlencode后为 %E6%88%91%E6%98%AF%E8%B0%81
“我是谁”的GB2312编码urlencode后为 %CE%D2%CA%C7%CB%AD

结论:

  1. Rewrite只接收UTF8
  2. IE和FireFox对中文URL的编码不同,要注意.
    这也是为什么上面的例子接收不到id值,并且出403错误.
  3. 为了避免这种情况出现,页面中的链接最好是UTF8编码的,如果是GB2312,一定会有问题.
  4. 最好的习惯是UTF8编码并urlencode,也就是上文的例4.

]]>

原创文章,作者:keyboard,如若转载,请注明出处:https://www.708034.com/2008/05/rewrite%e7%bc%96%e7%a0%81%e9%97%ae%e9%a2%98%e8%a7%a3%e5%86%b3/

发表评论

电子邮件地址不会被公开。 必填项已用*标注