小男孩‘自慰网亚洲一区二区,亚洲一级在线播放毛片,亚洲中文字幕av每天更新,黄aⅴ永久免费无码,91成人午夜在线精品,色网站免费在线观看,亚洲欧洲wwwww在线观看

分享

參數(shù)估計-區(qū)間估計

 一知半解檢測員 2024-10-31

參數(shù)估計(Parameter Estimation)是統(tǒng)計推斷的一種,指根據(jù)從總體中抽取的隨機(jī)樣本來估計總體分布中未知參數(shù)的過程。它主要處理兩個問題:一是求出未知參數(shù)的估計量;二是在一定信度(可靠程度)下指出所求的估計量的精度。信度一般用概率表示,如可信程度為95%;精度則用估計量與被估參數(shù)之間的接近程度或誤差來度量。

區(qū)間估計(Interval Estimation)是參數(shù)估計的一種形式,它在點估計的基礎(chǔ)上,進(jìn)一步給出總體參數(shù)估計的一個區(qū)間范圍。這個區(qū)間通常由樣本統(tǒng)計量加減估計誤差得到,用于表達(dá)估計值的不確定性。

圖片

區(qū)間估計的核心概念是置信區(qū)間和置信水平。置信區(qū)間是指按一定的概率或可信度(置信水平)用一個區(qū)間來估計總體參數(shù)所在的范圍。例如,我們可以說某藥品所含雜質(zhì)的比率在95%的置信水平下位于1%~2%之間。這里的“95%”就是置信水平,“1%~2%”則是置信區(qū)間。

圖片

在正態(tài)分布當(dāng)中,均值上下1.65個標(biāo)準(zhǔn)差可以覆蓋90%的樣本,均值上下1.96個標(biāo)準(zhǔn)差可以覆蓋95%的樣本,均值上下2.58個標(biāo)準(zhǔn)差可以覆蓋99%的樣本。也即

  • 當(dāng)時,
  • 當(dāng)時,
  • 當(dāng)時,

的值通??梢酝ㄟ^查表獲得。

總體服從正態(tài)分布的情況下,樣本的均值。因此對于總體均值的估計的95%的置信水平下的區(qū)間估計為

總體正態(tài)分布,方差不可知的情況下,小樣本數(shù)據(jù)樣本均值的區(qū)間估計使用T統(tǒng)計量:

但是在總體正態(tài)分布,方差不可知的情況下,大樣本數(shù)據(jù)(樣本量大于30)可以近似認(rèn)為樣本均值。區(qū)間估計為因為大樣本的情況下T分布非常接近正態(tài)分布。其統(tǒng)計誤差可以忽略。圖片

例子:估計某產(chǎn)品重量的置信區(qū)間

假設(shè)一家生產(chǎn)公司想要了解其生產(chǎn)的某種產(chǎn)品的平均重量(以克為單位),但由于成本和實際操作的考慮,無法對所有產(chǎn)品進(jìn)行稱重。因此,公司決定從生產(chǎn)線上隨機(jī)抽取100個產(chǎn)品作為樣本,并測量這些產(chǎn)品的重量。樣本的平均重量為150克,樣本標(biāo)準(zhǔn)差為10克?,F(xiàn)在,公司想要估計總體平均重量的95%置信區(qū)間。

  • 步驟一:確定統(tǒng)計量和分布

在這個例子中,樣本均值(X?)是已知的,為150克。樣本標(biāo)準(zhǔn)差(s)為10克,但總體標(biāo)準(zhǔn)差(σ)未知。由于樣本量(n=100)相對較大(通常認(rèn)為n≥30即為大樣本),我們可以使用正態(tài)分布來近似樣本均值的抽樣分布,即使總體標(biāo)準(zhǔn)差未知,我們也可以利用樣本標(biāo)準(zhǔn)差來估計。

  • 步驟二:選擇置信水平

公司選擇了95%的置信水平,這意味著我們希望總體平均重量落在所估計的區(qū)間內(nèi)的概率為95%。

  • 步驟三:計算臨界值

對于95%的置信水平,我們需要找到正態(tài)分布中對應(yīng)于0.025和0.975的分位數(shù)(即Z值)。這些分位數(shù)分別是-1.96和1.96(這是從標(biāo)準(zhǔn)正態(tài)分布表中得到的近似值)。

  • 步驟四:計算置信區(qū)間

將已知的數(shù)值代入?yún)^(qū)間估計的公式中:

因此,我們可以說,在95%的置信水平下,該產(chǎn)品的總體平均重量位于148.04克到151.96克之間。

圖片

python 實現(xiàn)

import numpy as np
import matplotlib.pyplot as plt
from scipy.stats import norm

# 假設(shè)的總體參數(shù)
mu_true = 149  # 真實的總體均值
sigma_true = 11  # 真實的總體標(biāo)準(zhǔn)差

# 置信區(qū)間計算所需的參數(shù)
mu_sample = 150  # 樣本均值(假設(shè))
sigma_sample = 10  # 樣本標(biāo)準(zhǔn)差(假設(shè))
n = 100  # 樣本量
alpha = 0.05  # 顯著性水平

# 計算置信區(qū)間的臨界Z值(這里我們假設(shè)使用Z分布,實際上當(dāng)總體標(biāo)準(zhǔn)差未知時應(yīng)使用T分布)
# 但為了簡化,我們假設(shè)樣本量足夠大,可以使用Z分布近似
z_crit = norm.ppf(1 - alpha / 2)

# 計算置信區(qū)間的上下界
lower_bound = mu_sample - z_crit * (sigma_sample / np.sqrt(n))
upper_bound = mu_sample   z_crit * (sigma_sample / np.sqrt(n))

# 繪制正態(tài)分布曲線
x = np.linspace(mu_true - 4*sigma_true, mu_true   4*sigma_true, 1000)
y = norm.pdf(x, mu_true, sigma_true)

plt.figure(figsize=(10, 6))
plt.plot(x, y, 'b-', label='Normal Distribution (True)')
# 標(biāo)記樣本均值
plt.axvline(x=mu_sample,c = 'orange',label='bar{x}')

# 標(biāo)記置信區(qū)間
plt.axvline(x=lower_bound, color='r', linestyle='--')
plt.axvline(x=upper_bound, color='r', linestyle='--')

# 填充置信區(qū)間區(qū)域
plt.fill_between(x, y, where=(x >= lower_bound) & (x <= upper_bound),
                 color='green', alpha=0.3, interpolate=True, label='95% Confidence Interval')

plt.title('Normal Distribution with 95% Confidence Interval')
plt.xlabel('Value')
plt.ylabel('Probability Density')
plt.legend()
plt.show()

注意

  • 在實際應(yīng)用中,如果樣本量不是特別大且總體標(biāo)準(zhǔn)差未知,應(yīng)使用T分布而不是正態(tài)分布來計算置信區(qū)間。
  • 置信區(qū)間的寬度取決于樣本量、樣本標(biāo)準(zhǔn)差和置信水平。樣本量越大、樣本標(biāo)準(zhǔn)差越小、置信水平越低,置信區(qū)間越窄;反之則越寬。
  • 置信區(qū)間是一個估計范圍,它并不能保證總體參數(shù)一定落在這個范圍內(nèi),但我們可以根據(jù)置信水平來量化這種不確定性的程度。

    本站是提供個人知識管理的網(wǎng)絡(luò)存儲空間,所有內(nèi)容均由用戶發(fā)布,不代表本站觀點。請注意甄別內(nèi)容中的聯(lián)系方式、誘導(dǎo)購買等信息,謹(jǐn)防詐騙。如發(fā)現(xiàn)有害或侵權(quán)內(nèi)容,請點擊一鍵舉報。
    轉(zhuǎn)藏 分享 獻(xiàn)花(0

    0條評論

    發(fā)表

    請遵守用戶 評論公約

    類似文章 更多