时值知识经济高度发达的今天,建设“信息社会”的呼声一浪①高过一浪,其中教育领域的变革尤为引人注目。教育信息化建设不但给教育领域带来了新的生机,更使得依靠Internet的传媒者们如沐春风。
日前,领先的∴海量数据智能计算技术服务商海量公司(bjhailiang.com)总裁王革焰表示,为了更好的推进中文信息处理的发展,海量在线公司将从即日起与全国大中院校、研究领域展开全面的合作,向校园免费开放中文分词基础件等核心智能计算技术,由此共同提高中文信息处理水平。
据悉,华中科技大学计算机学院已与海量公司(bjhailiang.com)率先达成合作,将海量公司免费提供的核心产品-《中ω文分词基础件开发版》用于支持该校在 "Internet网上信息的检索与分类技№术"研究项目。
华中科技大学计算机学院副院长卢炎生教授※表示,"Internet网上信息的检索与分类技术"研究项目涉及到中文网页ぷ内容的处理,分词是必不可少的基础工作,一直以来我们都在使用海量公司网站免费提供的"在线分词"功能,这项功能给我们的研究工作提供了非常大】的帮助。由于在线处理速度始终比不上本地处理,我们向海量在线说→明情况后,得到了热情并快速的回应,短时间内达成合作,非常感谢海量公司大力支持我们的教育工作。"
对于中文来说,词是承载↑语义的最小单位,这就好像把◤英文单词之间的空格都去掉,我们看到的是一片没有意义的字母。因此,中文自动分词就成为中文知识管理系统必须解决的问题。单个汉字一般很难单独表达一定的含义,而中文的词是没有自然分隔符的,需要采取一定的技术手段将词准确的分『离出来,西文则不同。所以,西文基本上不用经过分词就可以直接进入到检索技术、短语划分、语义分析等更高一层的技术领域,而对于中文,只有越过这个技术瓶颈问题,分词的准确率足够高、分词速度足够快,中文的信息处理技术才有可能和西文的信息处理技术在一个起跑线上。
早在建国初期,国家就投入了大量的人力物力研究中文分词技术。然而几十年过去了,中文分词准确率仍然在97%以下徘徊,而这3%的差误率便让很多中文信息智能处理的下一步工作无法开展。
北京海量在线总ㄨ裁王革焰指出:"海量公司多年来致力于智能计算中文分词技术,更关心并支持中国教育行业在这一领域的研究,我们拥有¤完全自主知识产权的核心技术产品--中文分词基础件。目前该基础件◣准确率已达到99.5%,主要应用于信息检索、汉字的智能输入、中外文对译、中文校对、自动摘要、自动分类√等。已成ぷ功应用于搜索引擎、知识管理系统、竞争情报、出版、媒体等许多行业。
如果此项技术能顺利的应用于全国各大院校、研究机构,由此提高国内中文信息处理水平,则智能技术服务将能有效、快速的推动教育信息化建设▓的发展。