2009年12月1日 星期二

調查研究法之 問卷法 + 信度 + 效度 ...

專家說:要當研究生,還是得把他懂了~逃避不是辦法

壹.問卷法應用範圍

問卷可用於各類領域,從社會學、心理學、商學等,需了解大多數普遍意見時,即需採用此方法,在設計領域對於量化研究也採行此法為主,對於行銷過程從產品開發至市場現況調查等之應用,簡述如下:
1.產品開發過程,決定產品概念、市場定位、品質水準、產品樣式等
2.市場測試過程了解產品接受度、廣告促銷效果與其他廠牌競爭結果,評價市場
3.導入市場後,了解產品流向、產品接受度、市場定位等
4.了解競爭:產品壽命、市場定位等

貳.問卷設計與調查之步驟

1.決定所需要的資訊
2.決定主題
3.根據所需資料發展個別的問句
4.決定問卷題目順序(ordering)
5.擬定問卷初稿
6.進行打字編排
7.針對問卷內容檢討和修正
8.前測(pretest)
9.進行初步統計分析
10.確定問卷文稿
11.發佈問卷實施調查
12.進行統計分析

參.問卷法之優點與缺點

優點:
可以實施有限度之調查,獲得代表特定對象之意見及觀點,讓事情得以找到方向或得到多數者的論點,以對假設提出論證或驗證相關研究。
缺點:
1.社會學者認為仿效自然學者的作法也是不錯,但需考慮是否一定捨去質性研究的採樣獨特性及對個案研究的重現。
2.類似問項混淆產生感染問題:當一個問題未完全限制他所在的場合時,就會產生感染性問題可能產生特別誤差。也就是問項設計不當時,會影響相關題問的回答,通常相近似問題但問項不一時,最容易造成回答者不知所措,自判產生誤導回答。
3.因果關係不見得能從「果」來推出「原因」:失敗的主因之一是決策者認為把造成問題的原因修正轉回,就可以把發生的問題回歸當初未發生狀態,太過輕信調查結果的用途。

肆.問卷設計注意事項

當我們在擬出問卷每一問句時,自己要反問自己下列問題?
1.這個問句的必要性:有無必要?若沒有它可以嗎?
2.這個問句範圍的適切性:是否含有太多的主題?
例如,「白蘭洗衣粉洗淨力強又不會傷害皮膚」,這一個問句涵蓋兩個主題 (洗淨力強、不傷皮膚)就應避免,即每一個題目只問一個主題。
統計分析需要的是數據型的資訊。這種型式的資訊稱之為 data set (資料組)。強而有力的統計分析需要可靠的資料,而可靠的資料則是要具備一定的方法與步驟來蒐集。

伍.問卷衡量尺度

名目尺度( Nominal scale )
的資料有時有稱作「類別資料」、「名義資料」,是指為了歸類或辨識而指定的數值。名目尺度的數值大小並無意義,僅在「類別」上有意義。譬如在登錄資料時,會令1代表男性,2代表女性,這樣的設定無好壞或大小之別,並非表示2>1。籃球員背號23與背號15也只是用來區別球員的身分而已。
PS.無法計算,數值不具備意義,排不出大小順序。
EX.性別、職業、地區、學號、血型、種類、科目 …
順序尺度( Ordinal scale )
可算是名目尺度中的一個特例,但是它可以表示不同個體間的等級或順序的數值,但無法進行加減運算。順序尺度高於名目尺度的衡量水準,不僅可分類,而且可以排等級順序。
PS.變數值具有等級大小順序,但順序尺度不能計算。
EX.學歷、職位、地位…
區間尺度( Interval scale )
等距尺度可以衡量所測事物的差異程度。例如攝氏60度只能說比攝氏30度高出30度,卻不能說是熱2倍。因其一旦轉換成華氏溫度,2倍就不成立了。又如調查滿意度時分成「非常不滿意」、「不滿意」、「普通」、「滿意」、「非常滿意」五個等級,我們可以定義分數是1、2、3、4、5,但也可定義為-2、-1、0、1、2,所以不論哪種給分定義,「非常滿意」、「滿意」間的差距與「非常不滿意」、「不滿意」間的差距是一樣的。
PS.區間尺度可計算(加減),有「絕對零點」。
EX. 溫度、時間、滿意度…
比例尺度( Ratio scale )
又稱等比尺度比率尺度,不僅可衡量所測事物間順序、差距,也可測比例,是等距尺度中的特例,也是衡量尺度的最高等級,如所得、銷售額等。等比尺度可衡量不同程度間的差異及比率,例如營業額1000萬元比500萬元多500萬元,也是2倍。和等距尺度最大的不同,是具有「絕對原點」,而非「任意原點」,「0」就是「沒有」的意義…
PS.比例尺度可計算(加減乘除…),但沒有「絕對零點」。
EX.如收入為0就是代表沒有收入,溫度為0不是沒有溫度。

態度衡量尺度
態度衡量尺度用來了解受訪者對於問題認知之態度,包括忠誠度、滿意度、贊成度與認同度,主要組成包括:認知要素、感情要素與行動要素。

陸.問卷內容與量表

Likert量表
是對某一概念(構念),所設計的數個項目,測量每位受訪者對此概念的態度反應(同意程度)。每一個反應都給一個數值,以代表受訪者對該項目的贊同程度,將每位受訪者在這些項目的得分加 ,即受訪者對概念的態度。
Q:名目尺度、順序尺度、區間尺度、比例尺度
PS.前測樣本以問題總數3~5倍,且不小於30份為基本量
形容詞檢核表(checklist)
檢核表可說是簡化的Likert量尺的測量格式,針對某一個測量的對象或特質,研究者列出一組關鍵的形容詞,並要求受測者針對各形容詞的重要性進行評估。
PS.執行問卷測量時,同構面問題應盡量分散(避免連鎖反應)以確保受測者針對問題單一思考。
Thurstone量表
是由一組測量相同特質的題目所組成,但是每一個題目具有不同的強度,受測者回答題目時,即可獲得一個強度分數,當一組題目被評估完畢後 ,所有被勾選為同意的題目的強度分數的中位數,即代表該量表的分數。
Guttman量表
與Thurstone量表類似,由一組具有不同強度的題目組成。受測者對於某特定事件有一定的看法,題目由淺至深排列。
歐斯格語意差別量表 (Osgood)
語意差別表的主要目的在區辨二個極端的概念,針對某一個評定對象,要求受測者在一組極端對立的配對形容詞,進行評定
PS.屬名目尺度(卡方檢定)
強迫選擇量表(forced-choice scale)
強迫選擇量表是利用二個立場相反的描述句,其中一句代表正面的立場,另一句代表反面的立場,要求受測者自二者中挑選出較接近自己想法的題目,然後將正面的題項勾選數加總得到該量表的總分。

柒.測量評量準則

評量測量工具好壞的四個準則:
效度 (validity):量表是否能測量出我們所要的特性。指問卷內容的好壞與否
信度 (reliablity) :測量結果是否具備穩定性、一致性。指施測過程的正確與否
敏感度(sensitivity) :是否能顯示出來事物的變化。指不可抗力之影響程度(突發性是否可呈現)
實用度(parcticality):是否具備經濟性、便利性、可解釋性。指研究預算(時間、金錢…)之控制能力

捌.研究設計常談的效度:內部效度、外部效度(屬於研究方法的問題 )

內部效度:指從實驗(研究)結果所得到的關係是否代表真正的關係。
PS.研究者是否使用對的研究方法?
外部效度:指從所獲得的結論是否能推論到一般化的結論。
PS.推論是否具備全面性?斷章取義?
EX. 探討夏天的飲料銷售量?探討研究手機色彩.造型偏好?


玖.測量工具的效度(何謂效度):內容效度、效標關聯效度、建構效度

內容效度
是指「內容適切性」即量表內容是否涵蓋所要衡量的構念。內容效度:可分為抽樣效度及表面效度兩種,兩者都沒有統計方法來應用,都仰賴專家主觀判斷。
內容效度之表面效度(Face)
是指量表項目和形式上,給人的主觀印象 (仰賴專家主觀判斷)。
PS.字裡行間.字型.色彩等整體美感?問項數量與內容多寡? …
內容效度之抽樣效度(Sampling)
量表中單一構面所包含的項目是否能代表該構面的構念。內容效度的高低,端賴項目(Item)取樣代表性之大小而定。
EX.服務問題=服務生+櫃檯接待+廚房出菜速度+…

效標關聯(預測)效度
又稱實用效度或實證效度。意指這種效度應建立在實證資料之上,效標關聯效度並不涉及構念問題。效標關聯效度:同時效度、預測效度
PS.效標=預測準確性之關聯度
效標關聯效度之同時效度:目的為預測當時(或現在)可能發生之狀況。
EX1.從A的服裝的打扮…預測房間的佈置?
EX2.從視覺設計.色彩學.造形設計的分數…預測編排能力
效標關聯效度之預測效度:目的為預測未來可能發生之狀況。
EX1.從A今天口袋裡的錢…預測未來家財?
EX2.從第一~三屆的錄取成績…預測第四屆的學生成績

建構效度
建構效度之區別效度:是指來自不同構面的這些項目,彼此之間的相關要低(差異大)。
EX.服裝.服務.裝潢.氣氛.菜色?
EX.氣氛.服務.菜色
建構效度之收斂效度:是指來自相同構念的這些項目,彼此之間的相關要高。
EX.服裝生的服裝是否影響您的食慾。氣氛問題?服務問題?菜色問題?
PS.一個問題不能存在兩種以上之構面

拾.測量誤差

量表會有信度(Reliability)與效度(validity)問題發生,主要是量表本身有測量誤差存在(Measurement Error)
系統性誤差(測量工具本身) :只要使用測量工具就會產生,屬於效度問題。
隨機性誤差(測量過程與結果) :每一次以不同方式來影響測量工具的使用,屬於信度問題。
管理誤差

效度的另一種分類方式:
測量效度:反應真實的程度越高效度越高。
設計效度:研究設計中,變數關係是否如預期的不受外來影響。
分析效度:進行統計分析後,所發現的結果是否如預期的結果。
推論效度:研究結果一般化的能力。

拾壹.何謂信度 (reliablity)

信度是指一個測量工具包含「變數誤差」的程度。信度是指測量資料的可靠性,是指一個測量工具在測量某持久性心理特質的「一致性」或「穩定性」。測量工具的信度有很多種但都是以「相關分析」的 r 值大小當作信度的高低。

常見信度的分類:等值性、穩定性、一致性

等值性:針對不同樣本具等值
複本信度:不同研究者用同一量表,對不同一批的樣本施測,結果的一致性。
折半係數:將一量表中「項目內容相似」。折成兩半(單數題、偶數題) ,求這兩個「各半」測驗總分的相關。
PS. 又稱為複本法

穩定性:針對相同樣本呈現穩定
是對同一批樣本前後兩期測兩次,若兩者的相關愈高,則表示該測量的穩定係數越高。
PS. 在不同的環境.不同的時間…對同一批人施測

一致性:「內部一致性」
旨在檢驗量表單獨項目(item)與總分是否一致。一般常用Cronbach’s α(alpha)運算檢測內部一致性

一致性(範例)
為評估A的學習成效,在期末筆者特別製作了一份問卷調查表讓學生填寫,引導學生做一學期來的課程回顧…
本研究將回收之有效問卷樣本編碼後輸入電腦…
以統計套裝軟體SPSS加以編製成表…
並以下列統計方法進行分析的工作:
(1)以Cronbach α來進行問卷的信度,檢證本研究的問卷是否有必要調整
(2)次以變異數(anova)分析老師及學生對A教學滿意度和開發B智慧N個構面的差異
(3)用相關分析(correlation)理解兩個構面彼此間的關連。

拾貳.調查進行的方式

1.郵寄問卷
優點:進行方便,只需將設定的對象從特有管道找出後,即可進行
缺點:回收率低約在15%~30%間,影響調查結果的信效度
2.電話訪問
優點:進行方便,易找到相關人員
缺點:限於使用方式無法對問題進行深入探討
3.個別訪談
優點:可深入問題討論
缺點:進行速度慢,無法大量取樣
4.群體派發
優點:可將原先設計好的題目,於適當時間找尋目標群同時派發收取,效率高、對象精準
缺點:對回答者態度是否正確,有時會應付回答造成問卷的信度低,或同質性太高,無法找出各行相關不同意見
5.電腦網路調查
優點:最省時省事快速的方法
缺點:無法掌握回答者身份是否為相關族群,回收率一般也相當低,設計一份完善的問卷實在不是容易的事,並不是隨便寫寫問卷即可找出答案,如無照步驟一步步進行,可能會花較多時間而毫無結果,或非預期效果。設計人員需具備多方面的知識,和一定的技巧及經驗才足以順利進行,及後來的分析才能有所收穫

拾參.統計方式

(一)資料的形式及表現圖表
1.常用統計量:百分點、指數、眾數、中位數、平均數、斜度和峰度等
2.常用統計表:簡單次數表、分組次數表等
3.當用統計圖:直方圖和餅狀圖、態度對比圖、趨勢圖和散布圖等。
(二)統計技術類別
1.顯著性檢驗:常用抽樣分析、顯著性檢驗等
2.實用的多元統計分析法:多元線性回歸分析、因素分析、多維圖示分析、結合分析等


拾肆.資料來源

1.設計研究方法,作者:管倖生,出版社:全華科技。
2.研究方法,作者:張紹勳,出版社:滄海書局。
3.量化研究與統計分析,作者:邱皓政,出版社:五南圖書。
4.SPSS與研究方法,作者:榮泰生,出版社:五南圖書。

沒有留言: