登录  
 加关注
   显示下一条  |  关闭
温馨提示!由于新浪微博认证机制调整,您的新浪微博帐号绑定已过期,请重新绑定!立即重新绑定新浪微博》  |  关闭

云之南

风声,雨声,读书声,声声入耳;家事,国事,天下事,事事关心

 
 
 

日志

 
 
关于我

专业背景:计算机科学 研究方向与兴趣: JavaEE-Web软件开发, 生物信息学, 数据挖掘与机器学习, 智能信息系统 目前工作: 基因组, 转录组, NGS高通量数据分析, 生物数据挖掘, 植物系统发育和比较进化基因组学

Linux系统字符集的选择  

2010-03-12 11:07:12|  分类: linux&shell |  标签: |举报 |字号 订阅

  下载LOFTER 我的照片书  |
http://www.cnitblog.com/lywaml/archive/2005/05/22/190.aspx

网上各个中文Linux社区有相当多关于此的讨论,大多数使用者为了获得完善的中文显示效果,以及为了保持和Windows的兼容(主要是指已挂载的Windows分区的正确显示),通常会选择gb2312或者gb18030作为系统默认字符。

但是,使用Unicode编码是当前计算机操作系统的趋势。作为一个计算机的多位字符表示系统,Unicode 支持世界上所有语言的编码和转换。Unicode 并不只是一个编程工具,它还是一个政治的、经济的工具。没有结合世界的语言支持的应用程序通常只能被那些能读写 ASCII 所支持语言的个人使用。这使得建立在 ASCII 基础之上的计算机技术脱离了世界上大部分人。Unicode 允许程序使用世界上任何一种字符集,因此它支持所有语言。Linux 承担了对 Unicode 很大程度上的支持。Unicode 支持被嵌入到内核和代码开发库中。

事实上,使用Unicode也能使我们更容易实现对英语以外的其他语言的支持。并且能够实现更高程度上的兼容性。

强烈建议中文的Linux使用者以Unicode(UTF-8)作为系统的默认字符集。


下面是Redhat Enterprise Linux AS 4.0发行注记中关于系统本地化设置的说明:

########################################################
对中文,日文和韩文的 UTF-8 支持

当系统从 红帽企业 Linux 3 升级到 红帽企业 Linux 4 时,系统的本地化设置被保留了。因为在默认的情况下,红帽企业 Linux 4 支持中文,日文和韩文的 UTF-8 码,Red Hat 建议您通过编辑如下的文件来使用 UTF-8 码:

/etc/sysconfig/i18n

通过以下的改变来修改系统的本地化设置:

  • ja_JP.eucJP 变为 ja_JP.UTF-8

  • ko_KR.eucKR 变为 ko_KR.UTF-8

  • zh_CN.GB18030 变为 zh_CN.UTF-8

  • zh_TW.Big5 变为 zh_TW.UTF-8

使用在 ~/.i18n 中的本地化设置的用户应该在默认的情况下升级到使用 UTF-8 码。

iconv 工具可以被用来把使用原始编码(例如 eucJP, eucKR, Big5, or GB18030)的文件转换成为UTF-8 编码:

iconv -f <native encoding> -t UTF-8 <filename> -o <newfilename>
######################################################


以下是的我的Redhat Enterprise Linux AS 4中/etc/sysconfig/i18n的内容:

######################################################
LANG="zh_CN.UTF-8"
SUPPORTED="zh_CN.UTF-8:zh_CN:zh:zh_TW.UTF-8:zh_TW:zh:en_US.UTF-8:en_US:en"
SYSFONT="latarcyrheb-sun16"
######################################################

SuSE Linux Profeesional 9.3默认也使用UTF-8作为系统字符集。








如何修改LINUX的默认字符集为GBK

在.bash_profile里(根据不同shell,文件不同)写入:  
  LANG=zh_CN.GBK  
  export   LANG  
   
  可以通过下面命令查看当前编码方式:  
  h@debian-server:~/$   locale   -a  
  C  
  en_US  
  en_US.iso88591  
  en_US.iso885915  
  en_US.utf8  
  POSIX  
  zh_CN  
  zh_CN.gb18030  
  zh_CN.gb2312  
  zh_CN.gbk  
  zh_CN.utf8  
  h@debian-server:~$   locale   charmap  
  GBK  
 
  评论这张
 
阅读(4532)| 评论(0)

历史上的今天

评论

<#--最新日志,群博日志--> <#--推荐日志--> <#--引用记录--> <#--博主推荐--> <#--随机阅读--> <#--首页推荐--> <#--历史上的今天--> <#--被推荐日志--> <#--上一篇,下一篇--> <#-- 热度 --> <#-- 网易新闻广告 --> <#--右边模块结构--> <#--评论模块结构--> <#--引用模块结构--> <#--博主发起的投票-->
 
 
 
 
 
 
 
 
 
 
 
 
 
 

页脚

网易公司版权所有 ©1997-2018