永发信息网

MLE,MAP,EM 和 point estimation 之间的关系是怎样的

答案:2  悬赏:10  手机版
解决时间 2021-03-09 19:33
MLE,MAP,EM 和 point estimation 之间的关系是怎样的
最佳答案
和点估计相对应的是区间估计,这个一般入门的统计教材里都会讲。直观说,点估计一般就是要找概率密度曲线上值最大的那个点,区间估计则要寻找该曲线上满足某种条件的一个曲线段。最大似然和最大后验是最常用的两种点估计方法。以最简单的扔硬币游戏为例,一枚硬币扔了五次,有一次是正面。用最大似然估计,就是以这五次结果为依据,判断这枚硬币每次落地时正面朝上的概率(期望值)是多少时,最有可能得到四次反面一次正面的结果。不难计算得到期望概率0.2。用五次试验结果来估计硬币落地时正面朝上的概率显然不够可靠。这时候先验知识可以发挥一些作用。如果你的先验知识告诉你,这枚硬币是制币局制造,而制币局流出的硬币正面朝上的概率一般是0.5,这时候就需要在先验概率0.5和最大似然估计0.2之间取个折中值,这个折中值称为后验概率。这时候剩下的问题就是先验知识和最大似然估计结果各应起多大作用了。如果你对制币局的工艺非常有信心,觉得先验知识的可靠程度最起码相当于做过一千次虚拟试验,那么后验概率是(0.2 * 5 + 0.5 * 1000)/(5 + 1000) = 0.4985,如果你对制币局技术信心不足,觉得先验知识的可靠程度也就相当于做过五次试验,那么后验概率是(0.2 * 5 + 0.5 * 5)/(5 + 5) = 0.35. 这种在先验概率和最大似然结果之间做折中的方法称为后验估计方法。这是用贝耶斯观点对最大后验方法的阐述,其实也可以用用经典统计学派的偏差方差的折中来解释。EM方法是在有缺失值时进行估计的一种方法,这是一个迭代方法,每个迭代有求期望(E)和最大化(M)两个步骤。其中M可以是MLE或者MAP。一般需要先为缺失值赋值(E步骤初始化),然后重复下面的步骤:1)用MLE或MAP构造模型(M步骤);2) 用所得模型估计缺失值,为缺失值重新赋值(E步骤);仍然以扔硬币为例,假设投了五次硬币,记录到结果中有两正一反,还有两次的数据没有记录下来,不妨自己用上述步骤演算一下硬币正面朝上的概率。需要注意,为缺失值赋值可以有两种策略,一种是按某种概率赋随机值,采用这种方法得到所谓hard EM,另一种用概率的期望值来为缺失变量赋值,这是通常所谓的EM。另外,上例中,为两个缺失记录赋随机值,以期望为0.8的0-1分布为他们赋值,还是以期望为0.2的0-1分布为他们赋值,得到的结果会不同。而赋值方法的这种差别,实际上体现了不同的先验信息。所以即便在M步骤中采用MLE,EM方法也融入了非常多的先验信息。上面的例子中只有一个随机变量,而LDA中则有多个随机变量,考虑的是某些随机变量完全没有观测值的情况(也就是Latent变量),由于模型非常复杂,LDA最初提出时采用了变分方法得到一个简单的模型,EM被应用在简化后的模型上。从学习角度说,以PLSA为例来理解EM会更容易一点。另外,kmeans聚类方法实际上是典型的hard EM,而soft kmeans则是通常的EM,这个在[1]中的讨论最直观易懂。
全部回答
搜一下:MLE,MAP,EM 和 point estimation 之间的关系是怎样的
我要举报
如以上问答信息为低俗、色情、不良、暴力、侵权、涉及违法等信息,可以点下面链接进行举报!
大家都在看
衣相绻什么意思
一个射手座男生,最近经常和我斗嘴大概挺长一
南充锅魁秘方能够外传麽?
帮忙给张姓女孩起个比较好的名字!
重修没过,今年大三了怎么办
婚介所如何收费
招行一卡通补办手续费多少,我不想换卡号可以
偏头痛的部位A.在头之两侧,并连及耳B.在巅顶
流星蝴蝶剑,最后叶翔,孟星魂,小蝶,高老大
吾麦尔牛肉面我想知道这个在什么地方
为什么指数分布适用于产品的机械可靠性
超级大乐透有规律吗
求这幅图的高清图
诱变育种与杂交育种的不同之处是①能大幅度改
999黄金貔貅手链多少钱
推荐资讯
沈阳华赢化工有限公司在什么地方啊,我要过去
蜀汉+东吴,疆域有曹魏大吗﹖
八年级的小华经常光顾网吧,沉溺于网络游戏中
现实中白敬亭性格是怎么样的
kettle怎么改数据库字段值
电热水器不出热水,只有冷水。
凹透镜是什么
魔锅坊麻辣香锅连锁地址有知道的么?有点事想
吸烟能导致人的寿命减少,据美国科学家最新研
五月天2013可口可乐广告曲
臭碱硫化钠在电镀废液处理中有什么作用
如果有一天我悄然离去,请把我埋在在那春天里
正方形一边上任一点到这个正方形两条对角线的
阴历怎么看 ?