查全率
【词语拼音】chá quán lǜ
【词语繁体】查全率
【词语结构】ABC式词语
【词语字数】三字词语
【词语解释】
查全率(recall rate)是评估检索成效的一项指标,又称召回率。在资讯检索系统中,系统找出相关资料的笔数与文件库中应有的相关资料总笔数的比值,称为查全率。例如:假设在某一次检索需求中,相关文件的总篇数应该有50笔,而在系统回传的100笔结果中,只有20笔相关文件,则此次检索的查全率为20/50=0.4或是40%。查全率可以用来了解系统找回所有相关资料的能力,或是系统遗漏相关资料的情形。根据上述定义,在大多数的情况下,查全率都不易获得。针对某次检索需求,想知道系统中应有的相关文件总笔数,必须将检索系统中所有的文件,每一篇都经人工判断过才能得知。检索系统中的文件动辄上万篇,甚至上百万篇,一篇篇判断下去,成本非常惊人。因此,在求取系统的查全率时,常以便宜措施,来近似系统中应该有的相关文件总篇数。最常用的方式,是针对同一个查询需求,以M种不同的检索技术或系统,分别找出前N篇文件,取得最多M*N篇文件做相关判断。这种作法的合理性,是假设:不被任何检索技术与系统找出来的文件,都认为其与该次检索需求不相关,因而不用再进行人工判断。与原先的作法相较,只判断这M*N篇文件,可以大幅降低求取查全率的成本。跟查全率非常相关的概念是查准率,其为系统找出相关资料的笔数与系统传回资料笔数的比值。在衡量系统检索成效时,查全率与查准率是一起并用的,单独检视其中一项指标并无意义。例如,假设资料库内有文件10,000篇,就某一个检索主题,其中应有的相关文件有100篇,若系统仅查询出1笔资料,且此资料是相关的,则其查准率为100%,但此时系统漏掉了99篇相关文件。同理,若系统将资料库里所有的文件都当作查询结果回覆使用者,则必然涵盖其中的100篇相关文件,因而其查全率为100%,但此时系统查出9,900篇不相关的资料,浪费使用者检视结果的时间。查全率的取得成本虽高,因有上述的理由,仍是进行严谨的检索成效比较时,不可或缺的指标。查全率与查准率一起并用的方式有数种,详见查准率辞条。在某些资讯检索的任务中,相关文件应有的总笔数,可能非常稀少,只有一笔、二笔。例如,在问答系统(question answering systems)中,询问「孙中山卒于何年?」,系统传回的回答,应该只有公元1925或是1925年是相关的,其他皆非。此时,系统的查全率,很容易出现只有0或是1的极端数值,不利于系统的成效比较。因此
全率查准率汇率查询汇率速查全身检查安全检查全数检查全面调查查询大全全面清查完全利率全分辨率全员效率注意率调查收听率调查全面检查法安全检查工安全检查表安全检查站安全检查员资产安全率查查全纯截曲率经营安全率安全边际率实时汇率查询率率民航安全检查全国违章查询全国经济普查全国公交查询食品安全调查安全事故调查蒙查查你查查酒查查易查查仓库安全检查我查查藜查查完全概率空间全额累进税率全流通市盈率全要素生产率查查天气督查检查查姆查姆查克查克查摩查星查铺查理梦梦查查支支查查查查胡胡斜率效率草草率率条码查查看外星蒙查查辐射查查看查查波亚斯浮查详查查甫勘查排查查浦存查验查查截查铺查牙查追查帐查视查秽查儿山查查监测查驳查查控查果讥查督查查数查梧查化查深查蜜巡查查照查哨查抄趷查查获查检查验