• 首页
当前位置:首页 > 新闻 > 访谈

语言文字信息管理司司长李宇明谈信息时代的语言文字工作

2005-10-10

  [李宇明]:非常感谢各位网友关注“信息时代的语言文字工作”这一话题。大家提出的每一个问题,我都看作是对我司工作的支持,也都看作是一道考题。我将尽力回答诸位的提问,但不一定都能答得对、答得贴切。

  [网 友]:听说教育部成立了全国语言文字标准化技术委员会,这是一个怎样的工作机构?工作职责是什么?

  [李宇明]:《中华人民共和国国家通用语言文字法》的实施和我国加入世贸组织,对语言文字标准化工作提出了更高要求。语言文字标准化工作有其自身的复杂性和特殊性,涉及多民族、多语种、多学科,关系到社会生活的方方面面,工作量大、政策性强、难点多,要做好语言文字标准化工作,需要一支高水平的专业队伍和专门的工作机构。为此,教育部、国家语委于2004年组建了全国语言文字标准化技术委员会(简称“语标委”)。

  语标委下设汉语语音拼音、汉语语汇、汉语语法语篇、汉字、少数民族语言文字和外语应用等6个分技术委员会,分别挂靠在中国社会科学院语言研究所、南开大学、北京大学、教育部语言文字应用研究所、中央民族大学和北京外国语大学。语标委的工作职责主要是:研究提出语言文字规范标准计划建议,开展语言文字规范标准研制、复审及宣传咨询工作。各分会先后组建队伍、建章立制、制订规划、明确任务。目前,各分会正在按照章程规定组织开展标准研制审定以及语言生活热点问题研究工作。语标委各分会的成立,标志着语言文字标准化建设迈入了一个新阶段。

  [网 友]:我们知道教育部语信司在2002年对一批科研项目给予了支持。由于种种原因,我们的项目没有能够参与申请,请问现在还可以向你们提出立项申请并获得资助吗?

  [李宇明]:如你所了解的,国家语委科研办设在教育部语信司,我司承担着国家语委语言文字应用研究“十五”科研项目的管理工作。2002年,按照“项目公开、公平竞争、择优立项”的原则,我司通过向社会公布项目指南,受理项目申请,专家函评、会议评审和立项等几个阶段,在当时共确定立项项目97项,其中资助项目70项,委托项目11项,自筹或建议自筹项目16项。之后,因为经费等方面的原因,我司没有再向社会大范围地受理语言文字应用研究项目的立项申请,但对于社会急需的语言文字规范标准研制项目,对于已经有很好基础的面向中文信息处理的语言文字应用研究项目等,也及时地给予了支持。如中科大讯飞信息科技有限公司承担的“智能语音技术在普通话辅助学习中的应用研究”、中国民族语文翻译局承担的“少数民族人名汉字音译转写规范”、中国社会科学院民族学与人类学研究所承担的“中国语言状况报告(2006)”等项目。

  国家语委正在制订“十一五”发展规划。在这一规划的指导下,国家语委会向社会公布“十一五”科研项目指南,到时大家可以根据指南申报项目。进入教育部主页 http://www.moe.gov.cn/ ,再进入“语言信息”栏目后可下载项目申请书。

  [网 友]:请问你司对项目结项有什么具体规定?

  [李宇明]:为了保证项目取得高质量的研究成果,我司参考通行办法,结合语言文字工作实际,专门制定了《语言文字应用研究“十五”科研项目结项鉴定方法》。根据该《方法》,项目研究工作已经完成或接近完成的,须填写《国家语委科研项目结项鉴定申请书》及其他相关材料,报送我司,申请对项目进行结项鉴定。具体要求见《语言文字应用研究“十五”科研项目结项鉴定方法》(进入教育部主页 http://www.moe.gov.cn/ ,再进入“语言信息”栏目,可下载)。

  [网 友]:当前在某些领域确实急需国家出台有关语言文字规范标准,但相当多的人(包括一些语言文字专家)不愿意国家把语言文字捣腾来捣腾去,甚至还有抵触情绪,国家一发布这方面标准就批评或反对,这也是一二十年来,国家语委的很多工作不被大众理解的原因之一(“异形词”就是这样)。语言文字标准由于都是软标准,公布了不执行也不能给予处罚或者强制执行。今后在语言文字规范标准的制定上如何更好地做到“从百姓中来,到百姓中去”,以便更好地得到大家的理解和支持?在标准的执行上,有无更好的措施,比如说在学校教育特别是基础教育方面如何让大家做到热爱母语、自觉遵行规范?

  [李宇明]:近年来人们语言文字标准化的意识已有较大提高,但在语言文字标准制定的认识上确实存在研究者与应用者间的矛盾。一方面语言文字应用领域急切需要语言文字规范标准,另一方面,标准制定很不容易,再加之语言文字规范标准往往涉及社会的方方面面,每个语言文字应用者都可以对语言文字规范标准进行评判,规范标准发布后有争议是难免的。为了做好这方面的工作,国家语委制定了严格的制定审定程序(详见《国家语委语言文字规范标准管理办法》),以保证标准的科学性和权威性。广泛征求意见是实现“从百姓中来,到百姓中去”的好途径,《管理办法》对此做了严格规定。

  语言文字标准确实大多是软标准,其作用重在引导,不过,当有些标准被列入法规时,就需要强制执行。其实,其他领域的标准也多是推荐性标准,这就需要进一步提高标准化意识,形成自觉遵循标准的习惯。为了帮助人们正确理解和方便使用标准,需逐步加强语言文字标准的宣传、咨询与培训工作。教育领域是语言文字标准的重要应用领域,我们将与基础教育部门紧密合作,努力做好语言文字标准的宣传贯彻工作。

  [网 友]:计算机字符集是越大越好吗?

  [李宇明]:我不是计算机专家,对这个问题很难回答得中肯。我觉得,不能抽象地来说计算机字符集是大了好还是小了好。当年,计算机存储能力和运算速度受到限制,计算机字符集当然不能过大。今天就技术角度来说,几十万、上百万字的字符集都构不成大的技术障碍。关键的问题是适用。不同行业、不同个人对计算机字符集的要求是不相同的,应当根据用途来决定字符集的大小及类型。大有大的用处,小有小的用处。

  上个世纪80年代,GB2312中只有6763个汉字,字数是少了点。后来有了20902个汉字的字库,对于一般人来说已经差不多了。最新国际标准中的编码汉字超过7万,再加上已经进入国际标准的藏文、维吾尔文、朝鲜文、彝文、蒙文、傣文等民族文字,已能够满足现代语言生活的基本需求。

  目前语信司正在支持建设“中华字符集”,它是承载中华文化的文字与符号的总和,非常非常庞大,一般用户用不上它。建设它的目的,是为中华文化在虚拟空间保存、弘扬打基础。如果您要了解“中华字符集”的详细情况,可参见拙文《搭建中华字符集大平台》(《中文信息学报》2003年第2期)。

  [河北大学]:当前特别是今后,语言文字规范标准的制定,恐怕主要是针对人机界面的交流,这种需要也非常急迫。对计算机来说,标准越明确具体细致,就越便于操作。然而,对计算机来说,标准制定以后,修改较为困难,很多错误只能将错就错地错下去。毋庸置疑,语言文字一定是不断发展变化的,标准也需与时俱进,那么如何处理针对计算机标准的不便修订和语言文字标准需要不断修订的矛盾呢?

  [李宇明]:从语言文字应用对象角度,语言文字标准可分为面向计算机的语言文字标准(也称信息处理标准)和面向人的语言文字标准两类,在信息时代面向计算机的语言文字标准的确更急切更紧要,但面向人的语言文字标准是面向计算机的语言文字标准制定的基础。

  语言文字本身在不断发展变化,人们对语言文字的认识在不断发展变化,社会对语言文字规范标准的需求也在不断地发展变化,这就决定了语言文字的规范标准要与时俱进。在过去,计算机的软硬件更新换代较慢,更新的成本也较高,因此会出现你所说的“标准制定以后,修改较为困难”的现象。而今,计算机的软硬件更新换代步伐加快,个人用的计算机更新的成本也不算特别昂贵。因此,你所说的现象应该有所改观。

  [任 文]:汉字笔顺规范须更加规范 根据国家公布的笔顺规范规则(《现代汉语规范字典》附录[汉字笔顺规则],语文出版社,2004年1月)来考察《现在汉语通用字表》及GBK公布的汉字笔顺,可以看出,许多地方相互矛盾,自乱阵脚,在制定各个汉字笔顺规范时,专家只强调别人遵守规范,而自己却随心所欲,一点都不严肃,好象规范是要别人去遵守,与自己无关。比如,根据“从左到右,从上到下”的规则,“万”字的笔顺应为“一,丿、乙”,但公布的笔顺却是“一、乙、丿”;比如,根据“正上、左上的点,必须先写,右上、里边的点,必须后写”的补充规则,“丹”的笔顺应为“丿、乙、一、丶”,而公布的笔顺却是“丿、乙、丶、一”。可以说,汉字笔顺规范的制定者,在制定汉字笔顺时,缺乏系统观、全局观,连基本的规则都没统一。希望有关部门有错必纠,知错必改,不要知错犯错,有错不该,一错到底,误人误己。

  [李宇明]:非常感谢任文网友,这么关心国家的语言文字事业,并且有这么多的研究心得。这些问题学术含量高,我难以在此一一回答。但我会把这些意见或建议转给有关人士。

  [丹 崖]:现在的中国人姓名的汉语拼音拼法十分混乱,比如“李宇明”的拼音拼写,有人认为《汉语拼音方案》要修改成 LI Yu-Ming,是吗?标准的应当是Li Yuming,而现在有LI Yu-Ming ,有Li Yu-ming, 有LI YuMing,现在的文后参考文献标准新公布的又用LI Yuming。到底应该如何?

  [李宇明]:在现实语言生活中,中国人名的汉语拼音拼写确实比较混乱。在你所列举的拼式中,规范的拼式是:Li Yuming。不过,还有一种变通的方式(注意,是变通方式!),即LI Yu-ming(姓氏字母全部大写,双名中间加连字符)。这种变通方式是由负责建设我国大规模、集成化的学术期刊全文数据库《中国学术期刊(光盘版)》的清华大学光盘国家工程研究中心提出,并经国家语委认可的。这个变通形式主要用于文献著作者著录,目的是增加检索信息,减少著作者的重码率,方便文献检索:(1)避免姓与名被颠来倒去造成姓氏音节不明确;(2)连字符把两个音节分开以增加检索信息的提取。

  [网 友]:现在小学语文教材里的(红澄澄)应该是读红chengcheng还是应该读(红dengdeng)呢?请予解答。

  [李宇明]:我查了几部词典,都未见“红澄澄”这个词语,也许应当是“黄澄澄”吧。“澄”有两读:一读chéng,如“澄澈”“把问题澄清”;一读dèng,如“把煎好的中药澄一澄”“把浑水澄清”。《现代汉语词典》把“黄澄澄”的读音注为huángdēngdēng(“澄澄”读阴平),是变调之后的读音。

  “黄澄澄”这类词语,是形容词的生动形式,格式为ABB。B的本调不管是什么,在进入ABB这种形容词的生动形式之后,BB一般都要读阴平。而书面语色彩较重的ABB式“搞特殊化”不变调,如“红艳艳、圆滚滚、金闪闪、赤裸裸、平展展”中的“艳、滚、闪、裸、展”都读本调。

  [任 文]:汉字部首应制定规范标准目前,为了解决汉字信息处理问题,汉字制定了各种标准,惟独汉字部首(或称偏旁)缺乏规范标准,由于各本字典收入汉字的字量不同,部首的选取数目不同,对于同一个汉字,在不同字典中部首归类不同,检索方法不统一,给使用者查找汉字带来麻烦.我因长期搞汉字编码,需要找到一种解决汉语拼音输入方法无法解决不认识的汉字的输入问题的有效检索法,经过长期的研究并论证,认为不管汉字有多少(据说有10万吧),都可以将汉字归类为130个部首(或称偏旁)检索.我这里提供一个检索方法,希望能成为各种字典的检索标准,也希望教育部尽快制定落实汉字通用汉字的部首规范标准.三条说明:1、一个汉字,只能有一个部首,即一个汉字,只能归类一部,不能既属于A部又输入B部。2、最好废除“部首”概念,通称“偏旁”,分五旁:左旁,右旁,上旁,下旁,外旁。与中小学语文教育统一起来(在学校,老师总是教某字是XX旁,不称XX部)。3、规定每个偏旁的读音规范。

  [李宇明]:汉字部首标准化问题很重要。1983年,中国文字改革委员会和国家出版局联合制定了《汉字统一部首表(草案)》,把汉字部首规范为201个(见《语言文字规范手册》1997年重排本,语文出版社)。为进一步解决这一问题,2002年国家语委在国家语言文字应用“十五”科研项目中又设立了“汉字部首规范”的项目。您的建议,我会及时转给课题组参考。

  [网 友]:随着信息化时代的到来,少数民族地区的语言文字应该如何保存下去?

  [李宇明]:这是一个大课题。全世界有6000多种语言,有人预测,每两个星期就有一种语言消亡。语言是人类的宝贵财富,语言的多样性同生物多样性一样不容忽视。面对人类语言大规模衰退、濒危与消亡,世界许多国家都在行动,尽力保护、抢救濒危语言。我国在这方面也采取了许多重要措施。但是语言保护是相当困难的事情,需要政府积极支持,需要语言学家创造性地工作,更需要本族人民的语言觉悟。最为关键的是:1.要树立“语言资源”的观念;2.要采取一切措施让后代学习;3.在保护和抢救语言的过程中,要注意利用现代化的信息手段。

  [网 友]:李司长您好!作为一名入学才一个多月的应用语言学一年级研究生来说,有关语言学的任何消息都足以引起兴趣,比如法国兴起“汉语学习热”,美国通过推广汉语学习政策等等,这些消息让我很兴奋。眼见那么多外国人到中国谋发展,我想如果我们学成后能出去应用学到的专业汉语知识,把汉语知识和国家文化推向世界各国时必将更具优势,能起更大的推动作用。那么,您是怎么看待这个问题的?您对我们有什么特殊的要求和期望吗?谢谢!

  [李宇明]:汉语作为深入了解中国和中国走向世界的桥梁,正在受到世界上越来越多的国家政府、教育机构和有识之士的高度重视。目前,世界上已经有100多个国家、上千万人口在学习汉语,越来越多的国家在中小学的教学当中增加了汉语课程,汉语已经成为世界人民欢迎的一种语言。“中国教育和科研计算机网”有教育部副部长章新胜的《加强汉语传播,促进多文化发展》一文,可供你进一步了解这方面的情况。

  作为应用语言学专业的研究生,你有为汉语教学与传播事业做贡献的志愿,我很赞佩。我希望你在导师的指导下,出色完成学业。在学有余力的情况下,多关注世界汉语教学方面的信息,研究汉语的国际传播问题。我很喜欢司马迁说的“通天人之际,达古今之变,成一家之言”。把这句话送给你,祝你事业有成。

  [网 友]:我想查询1997年全国语言文字工作会议的相关情况。

  [李宇明]:1998年第2期《语文建设》为“全国语言文字工作会议专辑”,从中可以了解相关情况。

  [网 友]:现在通过拼音或字形输入法,已经能够很方便的往计算机上输入汉字,请问,国家在汉字输入研究和开发方面有些哪些具体规划和措施;什么时候能够实现语音输入的普及,方便更多不很熟悉电脑的人来使用电脑进行汉字输入。

  [李宇明]:“万码奔腾”的局面曾令业内人士深感担忧。随着计算机语言处理由字词处理向语言理解的深度发展,当前提高键盘输入的质量,已不仅仅取决于编码的本身,而主要取决于与语言理解有关的各种资源库的建设,如深度开发的各种语料库、各种电子辞典、以及语法典的编纂等。用这些资源支持键盘输入,才能使键盘输入出现跨越式的发展。

  语音输入和输出的应用前景十分广阔,甚至比键盘输入的应用前景还要广阔。但它的实现,依赖于计算机的语音处理能力。一方面要加大技术攻关的力度,另一方面也要提倡大家说普通话,以减少计算机语音处理的难度。

  [任 文]:规范汉字应该淘汰鼋与鼍因“?w”简化成“黾”,“??,?x”也沾光,类推简化成了“鼍,鼋”,但两者不但笔画仍然繁多,而且在四号字体以下分不清哪个是简化字,哪个是繁体字,分辨率太差了。“??”与“?x”当初就不该简化,应该用表意及表音准确的“?D”与“??”取代它们。现在在制定《规范汉字表》时应该考虑淘汰它们的时候了。

  [李宇明]:我会把这些意见和建议转给有关人士。

  [任 文]:关于两个汉字的规范化问题1、解除“姜”与“?K”的简繁体关系,但是不能把“?K”做简化字使用,应启用“?w”做简化字,因“?w”表音、表义准确,从“姜”过度到“?w”更具备认同感,不会增加用字心理负担。2、“脉”属于多音字,读mo4音时应启用“??”代替“脉”,“??”指眼神,比“脉”表义更明确,从“脉”到“??”具备认同感,不会增加用字心理负担,“脉”统读mai4。

  [李宇明]:感谢任文网友。我将向有关人士转达你的意见。

  [网 友]:请问现在的拼音是否有变动,O怎么发音啊,我听到有光盘上念OU,是否正确,如果正确,那“播”的发音是不是也变了?我们那时是念“喔”。

  [李宇明]:你这个问题提得很好,这也正是我们国家语委关注并想着手解决的问题。汉语拼音在字母表中应当读字母名称音,比如字母“a、b、c、d”分别读“a、bê、cê、dê”;在教学中读“呼读音”,如b、p、m、f、d、t、n、l读成bo、po、mo、fo、de、te、ne、le;在具体拼式中读字母的“音值音”,如b、p、m、f读[p]、[p‘]、[m]、[f]。以上三种读法,“o”都应该读“喔”。

  在现实语言生活中,也有把汉语拼音字母用英文字母的发音读的。把“o”读成“ou”大约就是这一现象。怎么看待这一现象,既是学术问题,也是社会问题。国家语委已经立项专门研究字母词的读音问题,其中会牵涉到你说的这种现象。

  [任 文]:《规范汉字表》应对汉字彻底规范目前,规范汉字表的制定者态度不够端正,缺乏科学、认真的责任感和系统观。《规范汉字表》只注重考查汉字的字形、字义的规范化,对汉字字音的规范化考虑欠缺,落叶知秋,通过对张书岩的〈《规范汉字表》对异体字的确定〉可见一斑。这种规范化,只能自乱阵脚,非但外国人搞不懂,有时连中国人都糊涂。在《规范汉字表中》1、柏(??)、秘(?z)为正异体关系,因两字是多音字,我认为应都做规范字处理:柏(bo2):用于地名用字,如“柏林”,?啵?bai3):植物名,?嗍鳎?废除“柏树”写法。秘(mi4):保持现有音、义不便。?z(bi4):地名用字,如“秘鲁”2、嗥(?s)、?w(??)为正异体关系,我认为都应做异体字处理,形成如下关系:a、嚎(嗥、?s):猛兽叫,用“嚎”,鸟叫、风啸,用“号”。b、克(?w?。?:读ke4,指挨批评、挨教训,至于“?w(kei1)架”一词属方言,做方言音用,不能被大众认可和接受,不能随意进入汉语普通话系统。3、韭(??)、肴(?P)、帚(??)为正异体关系,因前者表意能力和认知能力差,不能认为其笔画少就认为是简化字,常容易被后者搞混淆,我认为应调整其正异关系如下:a、??(韭)b、?P(肴),“?P”类推简化偏旁。c、??(帚)4、??(??)、鲇(?T)两字为正异体关系,我认为应调整其关系如下:a、?希??睿?b、?T(鲇):后者的表音能力和认知能力比前者差,前者见字可识音。5、刨(?E)为正异体关系,因是多音字,我认为都应做规范字使用,分工如下:刨(pao2):表“挖掘”?E(bao4):指木工工具或加工金属使表面光滑的机械工具:6、《规范汉字表》将下列汉字由正异体关系改变为繁简关系,我认为不妥,容易误到中小学生及文化程度低下的人群:1、厕(??)、厮(?P)、厦(?B)、厢(??)上述字的关系,容易误到他人联想为凡“厂”字旁的字都可以写成“广”,“广”字旁的字都可以写成“厂”,两者是简繁体关系,都是规范字。厦(?B)在《一异表》中属正异体关系,在《规范表》中属简繁体关系,因其属于多音字,我认为两者处理的关系都不妥,都应作为规范字使用,用法如下:a、厦(xia4):地名用字,《普通话审音表》规定“厦门”读xia4,那遇到其他地名如“塘厦、松厦、岗厦”等,该怎么读?是xia4?还是sha4?b、?B(sha4):指高大的建筑物。2、凑(??)、减(?p)、净(?Q)、决(?Q)、况(?r)、凉(?觯┥鲜鲎值墓叵担?容易误到他人联想为凡“冫”字旁的字都可以写成“氵”,“氵”字旁的字都可以写成“冫”,两者是简繁体关系,都是规范字。3、猫(??)、猪(?i)上述字的关系,容易误到他人联想为凡凡“犭、豸、豕”的字,三者偏旁可以互换,都是简繁体关系,都是规范字。7、《规范字表》认为:??(??)“??”的主要意义是用于“??𥹷”(即馓子,此‘??’读fú),又通“稃”。而“稃”指谷壳,即粗糠;又泛指草本植物子实外面包着的硬壳。而“麸”指麸子,是小麦磨面后剩下的麦皮碎屑。糠和麸子是不同的东西,所以稃(??)、麸也应是意义不同的字,不存在异体关系。今以“稃”为正字,“??”在谷糠的意义上是“稃”的异体我觉得好笑,认为张书岩在强词夺理,“稃”指谷壳,即粗糠,是没错,但随着今天科技的进步,大米都是精加工,那经过精加工后的谷皮碎屑,该用那个字?是”稃“?还是”麸”?“稃”可以包括五谷杂粮及一切草籽的皮屑(不管是粗皮硬壳还是碎屑),难道小麦不属于五谷之类?“麸”指麸子,是小麦磨面后剩下的麦皮碎屑,那大麦及玉米磨面后剩下的碎皮屑该用哪个字?就因为《简化字表》把“??”简化为“麸”,就该承认它的正统地位?8、《规范字表》认为:黏(粘)“黏”曾处理为“粘”的异体字。“粘”有zhān、nián二音,“黏”仅同“粘”nián。《印刷通用汉字字形表》收入“黏”,《通用字表》恢复“黏”字,承担“粘”读nián时的意义(姓氏义除外)。我认为,《通用字表》让“黏”字从新上台(或上岗),《规范字表》应该好不客气地再一次让它下台,做如下处理:粘为正体,统读nian2(或nian1),①用于粘液、粘贴、粘合、粘住……,②用于姓氏,取消zhan1音,以免与沾(zhan1)在用词上混淆。因“沾”有“附着、吸附”之义。再说,“黏”的笔画繁多,不适宜做规范简化字使用,如果应要照顾一些文字专家的感情,不妨把它作为“粘”的繁体字使用。

  [李宇明]:《规范汉字表》尚在研制中。据我了解,课题组的态度是严肃认真的,工作是十分负责的。当然,对某些字处理得是否恰当,那是另外的问题。我已经把您的意见转课题组参考。

  [吉林人]:现在计算机应用十分广泛,对于计算机进行普通话水平测试好象已经成为可能,教育部对这种机器进行测试方式和内容有什么打算?
  
  [李宇明]:普通话水平测试是一项牵涉面广的大型语言测试,目前全国每年有200多万人参加,所以采用现代化技术,提高测试的效率,节约社会成本是普通话水平测试面临的紧迫课题。为此,国家语委科研办在国家语言文字应用“十五”科研规划项目中设立了“汉语普通话水平测试研究”课题,其中一个重要子课题就是“计算机辅助普通话水平测试研究”。为了加速推动智能语音技术在普通话学习和评测中的应用,国家语委科研办又补充立项,委托中国科技大学讯飞信息科技有限公司承担“智能语音技术在普通话辅助学习中的应用”课题。2005年9月,教育部语信司在合肥召开了该课题中期成果汇报及技术研讨会。会议期间现场实时进行的人机对比测试结果表明,计算机在音节层面的评判精度已达到了较高水平,计算机辅助测试的探索,显示出令人乐观的前景。当然,目前计算机语音处理还存在一些技术难题,如对于较大韵律单位的评测尚不够精确,距离完全实现计算机自动测评尚有一定距离。普通话培训测试的现代化和语言的信息化问题,是国家语委的职责,我们已对各地语委和测试实施机构提出要求,以期在较短时间内迅速提高测试软件的质量和水平。

  [网 友]:请您介绍一下我国民族语文信息化的现状好吗?

  [李宇明]:我国的民族语言文字信息化工作始于20世纪80年代,二十多年来取得了长足发展。制定了蒙、藏、维(哈、柯)、朝、彝、傣文编码字符集、键盘、字模等国家标准;在国际标准的最新版本中,在基本多文种平面中正式收入了我国提交的蒙、藏、维(哈、柯)、彝、傣文编码字符集;有些软件已实现Windows系统上的运行;已开发出几种电子出版系统、办公自动化系统;各类数据库不断问世;一些文种的网站或网页初步建成;语音及文字识别、机器辅助翻译等也有了一定进展。但是总体来看,民族语言文字的规范化标准化、信息化工作还不能适应当前形势的要求。具有自主知识产权的民族语言文字信息处理的核心技术比较少,缺乏较好的多文种统一的操作系统平台,软件之间兼容性差;高水平的语料库和相关数据库不多;民族文字网站的技术含量还不高;在管理上,缺乏统一规划和强有力的引导,资金投入分散,且在软件开发上存在着严重的低水平、重复开发现象。

  要使民族语言文字信息化适应新形势,迈出新步伐,必须加强规范标准的制定,建设多文种统一的平台,重视资源库建设。目前教育部语信司正在加强这方面的工作。

  [网 友]:据说有一些少数民族的年轻人已经不会使用本民族的语言,请问如何看待国家推广通用语言文字和使用民族语言文字的关系问题?

  [李宇明]:《中华人民共和国宪法》和《中华人民共和国民族区域自治法》对少数民族的语言权利有着明确的规定,总的精神可以概括成两个方面,一个方面是各少数民族都有使用本民族语言文字的自由,第二个方面是国家推广普通话、推行规范汉字。具体到每个少数民族的群众,他们可以有多样的选择,既可以只使用本民族的语言文字,也可以使用全国通用的语言文字,也可以本民族的语言文字和全国通用的语言文字共同使用。

  根据改革开放以来出现的一些新情况,国家在少数民族语言文字方面的政策导向基本原则是:“自愿选择,分类指导,努力构建和谐的民汉双语环境”。要鼓励少数民族青少年掌握好自己的母语,并兼通汉语。同时,也要鼓励汉族干部、青少年学习少数民族语言。各民族相互学习,相互尊重,共同发展。

  [网 友]:能介绍一下语言资源监测与研究中心的情况吗?

  [李宇明]:我司近两年积极建设国家语言资源监测与研究中心,陆续成立了平面媒体、有声媒体、网络媒体、教育教材和海外华人社区5个监测与研究中心。这5个中心分别设在北京语言大学、中国传媒大学、华中师范大学、厦门大学和暨南大学。成立中心的目的是借助现代化信息处理手段,对现代汉语进行动态定量分析和统计,对语言生活中出现的新变异、新现象进行监测、分析与研究,定期向社会发布,为国家语言文字方针、政策制定提供参考,为社会正确使用祖国语言文字提供咨询服务,积极有效地促进社会语言生活健康发展。

  [网 友]:国家语委已经立项的项目目前进展情况如何?

  [李宇明]:语言文字应用“十五”科研项目自2002年正式启动以来,在各课题组成员和项目承担单位的共同努力下,进展顺利。目前,包括重大项目“现代汉语语料库建设和深加工”,重点项目“汉语语料库建设规范研究”“中国少数民族文字字符总集”,规范标准类项目“ISO10646国际音标扩充集和中国语言国际音标集研制”等一批项目已经完成结项鉴定。新疆民语委承担的“维、哈语人名汉字音译转写规范”项目已在新疆自治区内推广试行,对维、哈人名汉字音译转写中存在的混乱和随意的现象起到了规范作用。语言文字应用“十五”科研重大项目“规范汉字表”研制已基本完成学术阶段工作,并出版了《汉字规范问题研究系列丛书》(丛书包括四册:《异体字研究》《简化字研究》《汉字字形研究》《汉字规范百家谈》)。

  通过语言文字应用“十五”科研工作,一大批热心于语言文字应用研究、关心语言文字工作的学者得到资助。特别是很多年青学者参加了项目研制,对于他们的学术成长和语言文字应用研究事业的发展起了一定作用。

  [网 友]:语信司前段时间进行了民族语文项目的申报,我们错过了机会,现在还能再申报项目吗?

  [李宇明]:仍可以继续申报。申报民族语言文字标准化信息化项目稍有不同的是,要经过当地民族语言文字管理部门的同意并签署意见。这是为了更好地发挥各地民族语言文字管理部门的作用。

  [网 友]:两岸四地使用的现行汉字存在简繁两种体系,在计算机信息交换中同文不同码,内地用国标(GB)码,港澳台用Big5码,两岸四地的网络交流常受乱码之扰,简繁转换错误百出,就连一封简单的电子邮件都不能顺利传递,在网上交流共享中华文明更是困难重重。这类问题应尽快想办法解决,不知贵司对此是否有考虑?

  [李宇明]:语言文字问题是语言沟通和文化认同的大问题,有时也成为重要的政治问题。两岸四地在语言文字交流中确实存在不少问题,由于历史形成的原因使用简繁两种体系,同文不同码,造成语言交流上的许多困难,特别是网络交流很不畅通。这些问题已严重妨碍了两岸四地的语言交际和信息化进程。海峡两岸和香港、澳门的有识之士,已越来越认识到问题的严重性以及研究解决这些问题的必要性和迫切性。作为国家语言文字主管部门的教育部和国家语委,一直很关注两岸四地的语言生活问题。如与香港、澳门联合建立普通话培训测试机构,支持两地的推广普通话工作;在“十五”期间专门立项研制《规范汉字表》等标准,这些标准充分考虑到了两岸四地的文字生活;倡导创建两岸四地中文数字化合作论坛(CDF),致力于推动汉字的国际标准化,实现两岸信息交换中的“文同码”,目前该论坛已成功举办两届。下一步拟组织两岸四地文字学界和信息处理界的专家学者合作研制汉字简繁对照表,研发智能化的简繁自动转换系统,努力实现两岸四地在信息领域中的顺利沟通。此外,国家科学技术名词审定委员会对海峡两岸科技名词的沟通也做了大量工作,出版了海峡两岸药学、航海科技、船舶工程、昆虫学、大气科学等领域的科技术语对照丛书。

  [大学教师]:听说语信司最近成立了文字研究中心,请问成立文字中心的目的和任务是什么?是否还会再成立新的研究中心?

  [李宇明]:2005年上半年,我司与北京师范大学共建了“中国文字整理与规范研究中心”,与北京大学共建了“中国文字字体设计与研究中心”。成立中心的目的是为了建立长效工作机制,更好地落实语言文字信息管理工作的思路,做好中国文字的标准化、信息化工作。中国文字的标准化、信息化是当前语言文字标准化、信息化的基础和重点。

  两个中心的工作任务是:开展中国文字(包括古今的汉字和少数民族文字)的收集整理以及相关规范标准研究(如《汉字整理表》研制、IRG工作跟踪、中华大字符集工程创建);字体设计研究与字库制作,新字体的示范、宣传与推广等工作。其意义主要有:(1)搭建服务于教育和国家信息化的语言文字坚实平台,争取汉语和少数民族语言文字在虚拟空间的地位,推动中国文字典籍数字化,建立国家数字化图书馆和数字博物馆,向世界展示中华文明。(2)服务于人民群众的语言文字生活,满足社会对语言文字规范标准的基本需求,进一步提高语言文字信息处理技术及其应用水平,促进社会语言生活健康和谐。(3)不断提高中国文字的信息处理(如文字编码、计算机字体设计等)技术和字形规范化水平。(4)通过中心的共建和运作,积聚全国的科研力量,积淀学术成果,探索并形成共建共享、多方共赢、竞争开放、服务全国,重成果、重实效、重积累的新型科研管理运作模式。(5)带动与语言文字相关的信息技术产业、印刷出版和相关文化产业的发展,促进中国文字学、中国文化学等相关学科的建设和人才培养,进一步弘扬悠久灿烂的中华文化。

  研究中心是根据工作需要建立的,目前按计划文字研究中心就建两个。这两个中心虽然设在这两所大学,但是要动员全国的力量参与学术研究和有关工作。

  [关彦庆]:尊敬的李宇明司长:您好,我叫关彦庆,是吉林省通化师范学院中文系的教师,国家级普通话水平测试员,曾经认真地拜读您的《儿童语言的理解与发生》《理论语言学教程》《现代汉语量范畴研究》等语言学著作,以及相关的语言学和语言规划方面的学术论文。您的学术思想透射出非常强烈的科学精神、民族情结和时代标记。有机会向您提问非常高兴,我的问题是:(1)信息化与规范化密切相关,规范化是实现信息化的前提。如何提高基层组织和个人的规范意识?使规范工作逐步走向自觉?(2)语言规划是一件与国家发展密切相关的长期的工作,语言地位规划与语言本体规划的关系应该怎样理解?(3)目前国家、教育部关于语言规划方面工作的政策、法规已经基本完善,但是在基层落实起来还会遇到各种各样的具体问题,这说明语言文字信息化工作还有很多具体的科研课题,我们应该在哪些方面选择科研切入点更有价值?(4)当前外语教育单一化格局是否会影响我国实施的语言规划长远工程?(5)语言文字是信息的载体,语文教育与国家语言文字信息化的关系如何?

  [李宇明]:谢谢关彦庆老师花那么多时间读我的文章,并说了那么多的“溢美之辞”。你提的这些问题我也非常感兴趣,每个问题也许都能写一篇大论文,或是一部著作。我在这里试着作些简略回答。

  (1)关于如何提高基层组织和个人的规范意识、使规范工作逐步走向自觉,我认为首先要让人们了解信息社会的特点和语言文字在信息社会中的重要地位与作用;其次要说明信息社会对语言文字规范化标准化的要求。宣传、说明这些内容时要把信息社会与前信息社会进行比较。

  (2)语言地位规划与语言本体规划相比较而言,前者是宏观的,后者是微观的;前者具开拓性,后者是巩固性的;语言地位规划为本体规划创造了条件、确定了基调,本体规划又为地位规划强本固体。有的专家指出,我国上世纪五十到七十年代是以地位规划为主,即实行语言平等,保障民族语言权利,选择推广民族共同语,实行文字改革,加强现代汉语规范化等;从上世纪七十年代末到现今是以本体规划为主,也就是加强语言文字规范化标准化工作,研制发布一系列规范标准,普及普通话,强化语言文字信息处理管理工作等。语言本体规划的强化、深入又为语言地位规划的提高发展奠定了基础。

  (3)科研工作是语言文字规范化标准化发展提高的基础性条件。在语言文字规范标准基本成套的情况下,科研工作的切入点最好从社会语文生活的实践中选取。社会语文生活是检验语言文字规范的最好场所,规范有哪些部分是符合实际的、有哪些内容是偏离实际的、有哪些空白是亟待填补的、有哪些问题是必须引起高度重视的,都要在社会语言文字的生活实践中寻找答案。

  (4)关于“外语教育单一化的格局”,大约是讲外语教育的语种问题。世界上有几千种语言,具有较高交际价值的也有几十种、上百种。外语教育语种过于单一,不利于我国与世界的交往。我觉得语种教育规划应当考虑两个方面:第一,有利于向世界学习与交流;第二,向来中国工作、学习乃至居住的外国人提供语言服务。

  (5)语言文字信息化是当前语言文字工作的重要内容。语文教育关乎国民的基本素质。语文教育是宣传国家语言文字规范化、落实语言文字规范化标准的基本阵地。从小养成重视语言文字规范化的思想意识和知识技能,是语文教育的重要任务和内容。这样一种思想意识和知识技能也是让国民适应信息时代的基本条件之一。

  [山东省语办]:请您把“后工业社会”、“知识社会”、“信息社会”的概念比较一下好吗?

  [李宇明]:工业社会可以分成三种类型:前工业社会、工业社会和后工业社会。后工业社会是工业社会进一步发展的产物。后工业社会的关键变量是信息和知识,而不是物质能源和资源,主要经济部门是以加工和服务为主导的第三、第四甚至第五产业。“知识社会”和“信息社会”所指的社会类型跟“后工业社会”差不多,只是着眼点和切入点不同而已。

  [任 文]:我对异形词的不同辩解 教育部国家语委发布了<第一批异形词整理表>,对其中的部分异形词,我存在不同辩解:(1)侈靡-侈糜/靡费-糜费/奢靡-奢靡:我认为应该用"糜",因浪费是与食物(米)有关.(2)喘嘘虚-喘吁吁:我建议用"嘘",因"吁"是多音字,从读音规范化角度将,主张其读"yu",消灭多音字.(3)门槛-门坎:我主张用"坎","坎"就是"坎坷","阻隔"的意思,门坎除了有木头做的,还有石头做的,水泥做的,用"槛"表达的方式片面.再说,"槛"属多音字,从文字规范化角度讲,应消灭其一字多音.(4)模仿-摹仿/模拟-摹拟:我认为两者都规范,它们表达的含义不同.模仿:是指仿照或仿制别人的形状,神态,动作,它比强调与原物比例一致.一般不用于绘画,描帖.摹仿:是一种临描,是将透明物覆盖在其它物体上把其形状描绘下来,主要指绘画或描帖,其大小比例与原物基本一致.(5)杀一儆百-杀一警百:我主张用后者,因前者是偏僻字,主张减少汉字用量,就如"烂熳"写成"烂漫"一样.(6)收服-收伏/压服-压伏:我认为两者都规范,它们表达的含义不同.收服/压服:是指让他人俯首称臣,不敢再冒犯你.主要用于对人.收伏压伏:是指用力量降伏了对方,把它拘谨,压制在一个地方,使它不再出来危害人类和自然.主要用于对妖魔鬼怪和猛兽和邪恶.而妖魔鬼怪和猛兽和邪恶势力是不会对你俯首称臣,心服口服的,它一有逃跑的机会就会出来危害社会的.(7)服罪-伏罪:我认为应该用后者,犯罪分子,谁也不会心服口服的认为法律对他的宣判及制裁是公正的,欣然接受。法律是强制性的对邪恶的压伏,强迫其接受罪罚。(8)神采-神彩:两者含义不同神采:指人的精神状态神彩:指神话色彩.(9)玩意-玩艺:我认为前者错误,应为"玩艺",本指演杂技和魔术用的道具,也即"东西",你是什么"玩艺"指你是什么东西,而"玩意"没有此意.是错用字.(10)贤惠-贤慧:我认为用"贤慧",指贤淑聪慧,一般指已婚妇女既具有贤德,又心灵手巧,聪明能干,而"惠"是指实惠,拿家的老婆不实惠呀?实惠不一定聪明,比如娶了个百万富翁的女儿,虽然她傻呆呆的,但却带来官运财运亨通,几实惠呀!从"秀外慧中-秀外惠中",也可知该用"慧","秀外慧中"就是指外貌美丽,内心贤慧.(11)淫雨-霪雨:我主张用后者,表意更明确.(12)战栗-颤栗:我主张用后者,表示抖动,发抖,战(zhan4):指害怕,用于心惊胆战.颤(chan4):指微微振动,强调因血压,温度偏离正常值而引起的发抖.战栗,打战,冷战,寒战都应写成"颤".心惊会打抖,但打抖不一定引起心惊.(13)指手画脚-指手划脚:我认为用后者,后者是指用手指指点点,用脚比比划划,而前者容易使人误解为"指着手,去画脚",把手画成脚.(14)装潢-装璜:我主张用后者取代前者.装潢:原指装表字画.但现在凡一切装饰工程都叫装璜,装潢是用材料把外表装扮得美丽辉煌,镶金嵌玉.显然"潢"字不能准确表意了,而"璜"(王/玉旁)表意准确.(15)肢解-支解:两者用意不同都应规范使用肢解;指对人和动物进行手足切割,分离支解:是对某样东西进行拆分,破坏.(16)周济-?Q救:我主张用后者,后者表意更准确,前者脱离了表意作用.如果说"?Q救"可以写成"周济",那么"佐证"就可以写成"左证","辗转"就可以写成"展转".(17)淫雨-霪雨:我主张用后者,后者表意准确.(18)秉承-禀承:我认为两者都规范,它们的用意不同.秉承:指接受并执行上级的指示或命令.禀承;指在性格,特征上继承.是遗传基因,遗传信息的延续.如他禀承了他父亲刚直不阿的人格.(19)瓷器-磁器:我认为两者都规范瓷器:指皿具磁器:指磁性器具。(20)轰动-哄动:我认为两者表达意义不同.轰动:只要知消息,信息的传播引起人们的震惊,关注和议论.但社会秩序不一定混乱.哄动:指场面的喧闹,秩序的骚乱,多用于会场.(21)盘踞-盘据:我认为两者用法有差别盘踞:一般指毒蛇,猛兽栖息在某地.但它们不一定占领该地的资源,其他动物也可以栖息.盘据:是占据,是一种武装割据.是对领土,资源,人口的占领.多用于土匪,兵匪,黑势力.

  [李宇明]:我已把你的意见转《第一批异形词整理表》课题组。

  [李宇明]:最后,我再一次感谢各位网友的提问,期望诸位能多关心多支持我司的工作。在回答网友这些问题时,我的同事和一些专家帮助查阅资料、研究问题,在此也一并感谢。

版权所有:中华人民共和国教育部 中文域名:教育部.政务

京ICP备10028400号-1 京公网安备11010202007625号 网站标识码:bm05000001