阅读下面文字,完成文后问题。 语音人机对话的基础就是要使机器能听懂人的话,并且能把答案以语音形式说出来,也就是要机器“能听”、“会说”。能听就是对语音的识别和理解,会说就是语音的合成。 语音的识别可以分为判音和判字两部分。判音就是把人讲话发的每一个音判断出来,标出每一个音的符号。只要把每个音的样板存入计算机里,机器听到人讲话之后把每个音和样板比较就可以知道发的是哪个音了。但实际上机器要判断听到的音和哪些标准音相应并不容易。只针对一个人发音的识别系统,相对来说比较容易实现。随便什么人讲话的识别系统,或叫非特定人识别系统做起来就要难得多。由于字与字之间的发音互相影响,有“协同发音”的现象,所以一个字一个字或一个词一个词地念时,识别就比较容易,这叫孤立音节或词的识别。而连续语音的识别就很不容易。…… 在判字方面……汉字一字一音,一共只有1300个不同的音,但常用的汉字至少有10000多个,平均有10个字是同音的。汉语中同音词也很多,如g#ng sh
一词同音的就有宫室、攻势、公式、工事等。正确判定g#ng sh
这个音之后,要选择是哪个词就不好办,4个词都可能是对的。要判断只好看上下文……目前,人们根据语法、语义、语境、语用、概念及知识来判断应该选用哪一个词或字。应用最多的是统计方法,也就是把大量文字材料输入计算机,由计算机统计两个词前后连接的概率,三个词顺序连接的概率。识别出音来之后,选择概率最高的几个词。这种方法有两个缺点:一是有些地方无能为力,如修筑宫室和修筑工事单看哪个概率高就不一定对;二是若用不同的语料统计结果就不同,如用一个类型文字的统计结果对另一类型文字进行判断就往往会出错。美国最近把多年的《华尔街日报》输入计算机进行统计,这结果用于《华尔街日报》文章朗读的识别有很好的效果,但不能用于小说或其它文字的识别。我们现在正在建立一种概念层次网络,利用概念和知识库来判词,可以纠错,有较好的效果。但________,语言是活的,仍在不断发展,任何规律和统计都不能概括全部的语音现象,因此最后还要靠人的干预。不过有了好的理解系统就基本上可以由计算机来自动处理。①对第三段“这结果用于《华尔街日报》文章朗读的识别有很好的效果”一句中的“结果”一词,理解正确的一项是[ ]A.指用计算机统计出这些文件材料中两个词前后连接的概率和三个词顺序连接的概率的做法B.指人在朗读《华尔街日报》的文章后,把每个音和样板比较而得出的结果C.指计算机对于这些文字材料中两个词前后连接的概率、三个词顺序连接的概率所做出的统计D.指计算机利用概念和知识库来判词,为这些文字材料纠错而取得的较好效果②第三段横线上应填入的短语是[ ]A.语由人生。B.语言现象是活的。C.语言千差万别。D.统计方法仍在不断改善。③下列各项中,不属于汉语判音、判字困难原因的一项是[ ]A.汉字有“协同发音”现象。B.汉语中有大量的同音词。C.判字使用最多的方法是统计方法,但它不适合对汉字的判断。D.不同类型的文字,统计结果不同。④下面图表是应用统计方法判定的过程,依次填入空白处最恰当的一项是[ ]A.语音、计算机、样板、互相比较、判字。B.文字材料、计算机、有关概率、判音、选择概率最高的词。C.人、有关概率、判音、选择概率最高的词、人的干预。D.文字材料、计算机、判音、制成样板、选择概率最高的词。
语音人机对话的基础就是要使机器能听懂人的话,并且能把答案以语...阅读答案
答案:2 悬赏:80 手机版
解决时间 2021-01-04 07:36
- 提问者网友:鐵馬踏冰河
- 2021-01-03 21:17
最佳答案
- 五星知识达人网友:舊物识亽
- 2021-01-03 22:15
答案:C;A;C;B解析:①C;②A;③C;④B
全部回答
- 1楼网友:夜余生
- 2021-01-03 22:50
这个问题我还想问问老师呢
我要举报
如以上问答信息为低俗、色情、不良、暴力、侵权、涉及违法等信息,可以点下面链接进行举报!
大家都在看
推荐资讯
正方形一边上任一点到这个正方形两条对角线的 |
阴历怎么看 ? |