2013.11.08 心理及教育統計(六) 機率
機率
隨機變數:
note:觀念部分,須清楚知道,單純的抽樣分配,樣本數提升的時候會使其分配趨近於母群體的樣式,而其平均數抽樣分布才會趨近常態分配。
note2:注意到四分位差的意思,乃Q1與Q3之差值,且須注意此標記的取得方式,若為奇數則取中間數,若為偶數則為該位置的平均,因此當分數調整與此平均位數相關的時候,仍會影響到四分位距的大小。
隨機變數:
- 定義:一個隨機實驗,其中對應樣本點(實數值)的函數符合某種機率結構。
- 無論投擲一個或者兩個色子,即使知道點數對應的理論機率多高,投擲之前我們都無法知道到底會投出幾點,因此:
- 此兩種擲骰子的活動,稱為隨機實驗。
- 可能出現的點數,即為這個實驗的實數值、實驗結果。
- 表達:
- 以大寫英文代表隨機變數,並以集合方式描述可能出現的實數值。
- eg. X={1,2,3,4,5,6}。
- 以小寫英文代表某次實驗的真實結果。
- eg. x=6。
- 以函數f(x)代表特定實驗中,某個實數值對應到的機率。
- eg. f(6)=1/6。
- 以函數F(x)代表隨機變數累加的機率函數。
- eg. F(X=3)=P(X≦3)=f(1)+f(2)+f(3)=3/6。
- 種類:
- 變項數量:一元、二元、多元隨機變數。
- 依照變數類型:
- 間斷隨機變數:隨機變數的實數值為有限,或者為無限但可數的,則視為間斷隨機變數,如次數、個數。
- 其f(x)又稱為機率質量函數(probability mass function)。
- 其定義範圍在0≦f(x)≦1,且各長條總合為1。
- 連續隨機變數:隨機變數的實數值為無限且不可數的,稱為隨機變數,通常以區間方式表現,如營業收入、路段的長度、絕對溫度。
- 其f(x)又稱為機率密度函數(probability density function)。
- 其定義範圍為f(x)≧0,且曲線下面積總和為1。
- P.s) 其背後的機率分配,也依循其分類,有間斷分配與連續分配的分別。
白努力試驗(Bernoulli trails):
- 定義:只有兩種可能發生的試驗,如成功/失敗、有/無。
二項分配(binomial distribution):觀測N個獨立的白努力試驗,每次成功的機率設定為p,又以X代表總成功次數,可得一個機率函數。
- 函數: P(X)=CN取X*(p)^X*(1-p)^(N-P)
超幾何分配(hypergeometric distribution):一個有限的母體,總數為N,其中包含m個特定(成功)元素,今以抽出不放回的方式抽取n個樣本,定義X成功個數,則X的機率分配為超幾何分配。
常態分配(normal distribution):統計中常用的分配,呈現鐘形且對稱。
卡方分配(chi-squire)
所有可能的事件,唯一隨機變數的實數值,則事件發生的機率就可用該隨機變數的機率函數來求得,此正式透過查表而得知p-value的意義。
而定義alpha之決策標準,搭配p-value觀測事件發生的機率,作為傳統假設檢定的基礎。
Excel:
- 儲存格格式會依據資料格式進行處理。
- 增益集的分析工具,可做簡單的統計處理。
- $的應用方式(check it)。
R: 為一種程式語言兼數學統計軟體。
- 免費且自由應用。
- 可針對程式語言進行修改。
- 可套用到多種作業系統。
- 可與其他程式語言結合。
- 強大繪圖功能。
P.s) 樣本數越大時,抽樣分配的結果越靠近母群分配,而樣本平均數之抽樣分配趨近常態,且變異數將受樣本大小分割。
SPSS:
- 可套用多種作業系統。
- 豐富統計程式套件。
- 輕鬆繪製統計圖表。
- 點選操作介面(亦可輸入語法)。
note:觀念部分,須清楚知道,單純的抽樣分配,樣本數提升的時候會使其分配趨近於母群體的樣式,而其平均數抽樣分布才會趨近常態分配。
note2:注意到四分位差的意思,乃Q1與Q3之差值,且須注意此標記的取得方式,若為奇數則取中間數,若為偶數則為該位置的平均,因此當分數調整與此平均位數相關的時候,仍會影響到四分位距的大小。
留言
張貼留言