永发信息网

如何實現漢語拼寫檢查?

答案:1  悬赏:80  手机版
解决时间 2021-01-03 05:13
如何實現漢語拼寫檢查?
最佳答案

中文文本常用的自动校对的校对策略:①机器自动查错和人工确认纠错相结合;②词法、语法、语义多层次查错、纠错策略;③规则方法和语料库统计方法相结合;④ 面向查错的“粗分析”方法它们的校对技术深度·般有以下三个层次 l:① 简单上下文匹配:在查出的错误字词前后一定范围内匹配,用词库和后补信息或文本特征来判别;② 词切分 下文匹配:对文本中的句子自动切分,用词库和后补字信息来纠正错误字:⑧ 自然语言理解E下文匹配:用词、语法、语义等知识,逐句对文本进行分析、理解,由此选择正确的代替字例如,方正金山校对软件主要是在现代汉语语法规则制导下,利用模糊分词及多遍扫描技术,将 个句子分为若干词或词组,对照系统提供的通用词库、专业词库及用户自定义词库进行校对。清华大学利用汉字二元同现概率的大规模汉语语料文本的统计分析,互信息、同现信息等结果进行分词、词性标注、词性排歧,用语料库知识指导文本校对;基于语料库统计的MARKOV语言模型,利用上下文相关信息指导文本校对。杭州大学基于N联字的汉字识别后处理研究,以及北京师范大学基于句法结构和特征信息的词法、甸法语义校对系统的实现 等都取得了很大的进展,对文本自动校对极具指导意义和创造性启示 『“I[15】 [当前,有不少优秀的校对软件如“黑马文字校对”、“方正金山中文校对”、“三欧”、“文捷”、“人工智能校对通”以及台湾的“啄木鸟”等系统已走向市场,实现了商品化,可实现对语句不通、丢字多字、打字错误、错别字、重句、英文单词拼写错误、不规范标点、年月日错误、数字及章节错误的自动校对 校对速度可达50万字/4,时。但以上系统基本上是基于“词组”校对的辅助校对系统,存在以下不足之处 :1.虽然系统能够查出许多字、词错误来,但表现出同样错误症状的一些字、词错误却不能被发现。如:“报纸杂志以挥舆论监督功能”一句不能发现错误。2.校对能力基于词法层次上,对涉及句法、语义的许多错误无法发现。如:“他们不能新闻记者有关材料”一句不能发现错误。3.误判率较高。如:“有记者共约300人”误判“共约”为“公约”。4.对许多错字串未给出建议信息,即使给出也离正确的字、词相差甚远。5.没有提出校对软件查错的召回率(recaL L ratio)、查准率(accurate ratio)和误判率(err()r
我要举报
如以上问答信息为低俗、色情、不良、暴力、侵权、涉及违法等信息,可以点下面链接进行举报!
大家都在看
我觉得男朋友不爱我,但他不承认。
有一个校长为40厘米的零件他的上下的两个面之
多项式-x-y减去-x+3y的差是________.
如何将照片复制到爱国者数码相框里去
一手摸火线,另一手悬空,穿着拖鞋着地,着在
南京长江大桥下层铁路桥全长6?772m,一列长22
下列各句中,划线的成语使用恰当的一句是A.三
巫山县车管所地址有知道的么?有点事想过去!
法国本国对巴黎公社的评价是什么?
新津所有银行有哪些?
乾字的行书怎么写
极品飞车9自动换挡和手动换挡哪个好用
子系中山狼,得志便猖狂。形容什么?
单选题Theteacherhasagoodwayofmaking
江门江海区哪里可以学钢琴?
推荐资讯
上海儿童医学中心徐敏门诊星期几啊!
牛地埔社区居委会办公地址在什么地方?我要处
女生读职校选什么专业好啊?
完形填空LisaReidlosthersight(视力)becaus
临潼哪里好玩的地方
怎么利用人脸对齐 过滤错误检测
whoare的缩写
稀奇的意思是什么?
南阳市区联通光纤宽带最高多少M 包年多少钱
2011中秋发短信送祝福,若每条短信0.1元,则
单选题我国全方位对外开放的格局是A.经济特区
三星s8plus联网管理在哪里
正方形一边上任一点到这个正方形两条对角线的
阴历怎么看 ?