在各行各業(yè)的分析文章中,有時候我們會看到置信度與置信區(qū)間的概念。在這篇文章中我們詳細介紹一下什么是置信度與置信區(qū)間。 在實際生活或者工作中,由于受到技術以及隨機因素的影響,人們無法得到一個絕對準確的物理量,比如測量一個物體的長度,無論測量工具的精度有多么高,測量人如何仔細,最終的測量值與物體的真實長度相比,總存在一定的誤差。所以人們只能對物理量真實值做出估計,一種方法是給出一個估計值;一種方法是給出一個區(qū)間,也就是真實值可能落在這個區(qū)間中,這個估計出的區(qū)間就稱為置信區(qū)間。既然估算出一個區(qū)間,那么可信度有多高呢?這里的可信度也稱為置信度。如果置信度為95%,等同于說真實值有 95% 的把握落在了這個置信區(qū)間內。 我們再給出一個生活中的例子,比如在超市中購買的袋裝食品,其份量是否達到廠家所聲稱的量,是多了,還是少了?由于生產線在加工食品時,受到隨機因素的影響,因此輸出的袋裝食品的份量不可能全部與標準量完全一致,總有少量偏差,或者多一些,或者少一些。這時廠家可以給出一個商品質量的置信區(qū)間,以及置信度。 那么該如何給出置信區(qū)間和置信度呢?這需要使用概率論與數(shù)理統(tǒng)計的知識。 比如對某一個物理量在不變的條件下重復測量n次,假設得到的測量值分別是x1,x2,x3,……xn,從《概率論與數(shù)理統(tǒng)計- 大數(shù)定律》一文中我們可以知道這n個測量值的算術平均值可以作為該物理量的真值的估計,而且誤差很小。這是一種估計的方法。 下面我們給出另一種估計方法,即區(qū)間估計法。從《概率論與數(shù)理統(tǒng)計- 中心極限定律》一文中我們還知道,在自然界中,一些現(xiàn)象受到許多相互獨立的隨機因素的影響,如果每個因素所產生的影響都很微小時,總的影響可以看作是服從正態(tài)分布的。當我們在不變的條件下對一個物理量進行測量時,由于外界隨機影響因素(溫度,人為判斷等)干擾都非常小,所以每一次的測量值都遵循正態(tài)分布。所以n次測量值x1,x2,x3,……xn實際上就是來自正態(tài)總體N(μ,σ2)的n個樣本(μ實際上也是物理量的真值)。 我們知道樣本值構成的統(tǒng)計量服從一定的分布,這里的同樣也服從正態(tài)分布,也即: 如果а = 0.05,也就是置信度為1-а=0.95,則: 查標準正態(tài)分布表可得: 也即: 對于①式,我們可以直觀地理解為:在95%的概率下,與期望值μ的距離在區(qū)間內。 由①可以進一步得出: 也就是說,如果統(tǒng)計量已知,那么預估的期望值μ在95%的概率下落在以下區(qū)間: 具體可以這樣理解,假設重復m次測得(每次測得n個測量值,并計算算術平均值),相應地生成m個如②所示的區(qū)間,那么大約有95%的區(qū)間包含了期望值μ,而大約有5%的區(qū)間沒有包含。 綜上所述,我們可以這樣描述,對于任意一個,由它構成的②區(qū)間,包含期望值μ的概率為95%,或者說期望值μ落在這個區(qū)間的可信度(也就是置信度)為95%,這個區(qū)間就是置信區(qū)間。 從②所示的區(qū)間,我們還不難看出,當置信度越低,區(qū)間的寬度越小,置信度越高,區(qū)間寬度越大。區(qū)間的寬度越小,說明對真實值估計地越精準,但置信度(可信度)也越小,也就是說把握越小。 |
|
來自: ZZvvh2vjnmrpl4 > 《待分類》