来源:《电子世界》2019年第12期 作者:方玉萍;万荣;方达;
选择字号

中文分词中歧义字段处理的研究

分享到: 分享到QQ空间

<正>歧义字段是中文分词中的难点,它往往会消弱分词的精准率和召回率。而遗传算法是基于"优胜劣汰"的方式寻优的,用来处理歧义字段在中文分词系统正符合其思路。实验结果得出,在分词中的召回率和综合率都高出传统的歧义消除方法。中文分词指的是将一个中文串切分成一个个单独的词,而分词就是按照某种规则或方法重新组合成词的过程。中文行文中没有固定的格式划分分界符,所以它不像西方文字那样可以通过空格来界定一个词或字符,这势必就给中文分词研究造成很大困(本文共计2页)       [继续阅读本文]

下载本文订阅本刊

相关文章推荐

电子世界杂志2019年第12期
电子世界
主办:中国电子学会
出版:电子世界杂志编辑部
出版周期:半月
出版地:北京市

本期目录