2013.09.13 心理及教育統計(一)
統計基本概念介紹
l 描述統計:最初為政府單位發展,收集人民相關資料而來,如抽樣調查百姓人口、收入、幸福指數等,或國民健康局統計國民健康資訊、吸菸飲酒比例等,進行描述並且說明訊息。
è利用計算與繪圖等方式,將複雜資料整理清楚、摘要並濃縮,使眾人得以理解資料傳達之資訊,換言之,對資料之解釋。(從表格、繪圖、數值看資料)
l 推論統計:提及母體(population)以及樣本(sample),基於母群體數量過大,無法逐一計算時,自母群中抽取樣本,並且研究樣本特性,進而推論母群體之特色,從中亦討論統計誤差,此稱為推論統計。
良好的樣本解釋(或曰推論),需抽取有代表性的樣本:
note:而此代表性,與隨機抽樣相關。
note:而此代表性,與隨機抽樣相關。
n 簡易隨機取樣(simple random sampling):將所有個體編號,並且使用亂數表或者電腦抽樣方式,為最簡易的抽取方式,然欲檢測內容可能因母群體特質影響,造成抽樣結果代表性不佳。
n 分層隨機取樣(stratified random sampling):某些議題與母群體特質相關,如國小孩童英文能力與居住地區有關時,或者議題與人口社經地位(至少可分低、中、高),此時可使用分層隨機取樣。P.s 此條目Strata翻譯為層。
è當某個議題與其變項有關係時,需依照其變相分層,再依簡易隨機取樣方式,將各層母群體抽取至樣本。(換言之,這是一個有目的性的抽樣)
n 系統抽樣:將母群體依照特定特質排列,於決定起始值後, 依所需樣本數決定特定間隔並抽取樣本,換言之,需先有順序,而後依照抽取人數決定間隔而抽之。
n 聚落抽樣:相較於前三者於執行上之經濟考量,因而使用聚落抽樣,可能結合前面三者的操作模式,差別在於抽取時非以單一個體,而以團體作為單位,如班級、家庭、學校等,其可能再往下進行更細部的抽樣,因此又可以稱為multisampling,如先抽學校後抽班級,但重點在於最後抽取仍為團體,而非個體。
è隨機取樣(random sampling):理想狀態下抽取之樣本具有代表性,換言之,其結果可用以推論母群體參數之樣本,此與外效度相關。
l 參數(母數)與統計量(估計值):參數代表母群體之特質,常用希臘文作為符號代表;統計量代表樣本之特質,常用英文符號作為代表。理論而言,參數是未知數,因而需要使用統計量而估計之。
l 資料(Data)的來源:
n 問卷調查(survey):
n 觀察法(observation):
n 晤談法(interview):
n 實驗法:
u 獨變項(independent variable):又稱為自變項,為可調控操弄之因子,相當於因。
u 依變項(dependent variable):又稱為應變項,因應自變項而變化之因子,相當於果。
l 外效度與內效度:
n 外效度:樣本結論可推論回母群的程度,代表樣本抽取需取得有代表性的抽樣,因此與隨機選取的程度有關。「外」,代表以樣本推論樣本以外之對象(此指母群)。
n 內效度:測量的結果是否取得欲取得之特質,與隨機分派有關。不佳的例子,為樣本族群特質偏頗,如過老、過多男性,因此測量結果未必是原本所欲取得之。
l 變項(variable)與常數(constant):
n 變項(變數、變因):因應不同人有不同結果,如身高、年齡,為欲觀察之特質,即為變項。
u 獨變項與依變項:依變項因應獨變項而產生改變,近似於因果關係。
u 連續變項與間斷變項:連續變項如身高、體重,相鄰兩數字有意義(存在),且數值之間可切為更細之量尺,並且數值所包含者為一個範圍,如160cm實質上為159.5~160.5;間斷變項為兩數值不可再細切者,如班級人數、跳繩次數等。
u Stevens(1951):將變項依特質分為四種。
l 名義變項(nominal variable):號碼代表不同事物與個體,數值存用於區別個體。
l 次序變項(ordinal variable):數值只有排列順序意義,如名次、等第、天干地支等,數值不僅可區分個體,亦可呈現優劣(順序大小)。
l 等距變項(internal variable):數值不僅代表個體,且其差距可以相互比較(計算),如160~161cm是差1cm,而182~183cm是差1cm,如溫度。
l 比率變項(ratio variable):又稱為等比變項,數值之比率有其意義,並且有絕對零點的存在,如長度、重量。
è絕對零點:沒有就是沒有,例如長度、重量。
n 質的變項(categorical variable):間斷;名義、次序。
n 量的變項(quantitative variable):連續;等距、比率。
n 常數:固定不變值。
l 母數統計法(parametric statistics)與無母數統計法(nonparametric statistic):皆為推論統計之方法。
n 母數統計法(Z,t,F test):處理等距或比率變項的方法,統計學家發展此技術時,假定資料有其分配狀態,如常態分配(以平均數與變異數描述之),而分配方式有其特定的參數以描述此分配狀態。
n 無母數統計法:通常處理名義或次序變化,不假定資料的分配方式,因而也不需要參數去描述之。
l 簡單公式:為Σ之計算特質,原則如下。
Σx1+x2+x3+….+xn=Σx 可縮編
Σa.x=a Σx 常數可提出
Σ(a+b)= Σa+Σb 加減項目可分開加總
Σ(a+b)2=Σ(a2+2ab+b2)= Σa2+2Σab+Σb2 平方項目可先展開後拆解
Σa.x=a Σx 常數可提出
Σ(a+b)= Σa+Σb 加減項目可分開加總
Σ(a+b)2=Σ(a2+2ab+b2)= Σa2+2Σab+Σb2 平方項目可先展開後拆解
Σ(ab)≠Σa.
Σb 相乘後加總之項目,不等同加總後相乘
(Σx)2≠Σa2 加總後平方之項目,不等同平方後加總
(Σx)2≠Σa2 加總後平方之項目,不等同平方後加總
l 討論:IQ屬於哪一種變項?
實質上,IQ應該為次序變項,但是為求方便,常常假設其為等距變項進行操作,如全班IQ平均,因此這是較為特殊之處。
(再次強調,次序代表差異值無法比較,換言之無法計算,等距代表其可比較,因而可以計算、平均等。)
留言
張貼留言