當人們談論心理測試時,他們經常會問這個測試是否有效。 這到底是什麼意思? 有效性是衡量測試如何衡量其聲稱衡量標準的指標。
心理評估是實驗研究和臨床治療的重要組成部分。 創建心理測試時最大的擔憂之一是它是否實際衡量我們認為正在測量的內容。
例如,可以設計一個測試來衡量一個穩定的人格特質 ,而是測量由情境或環境條件產生的短暫情緒。 有效的測試可確保結果準確反映正在進行評估的維度。
那麼測試有效性意味著什麼?
有效性是指測試衡量它聲稱衡量的程度。 對測試結果進行準確應用和解釋至關重要。
有效性不是由單一的統計數據決定的,而是由一系列研究來證明測試與其打算測量的行為之間的關係。 有三種類型的有效性:
1.內容有效性
當測試具有內容有效性時,測試中的項目代表測試應涵蓋的可能項目的整個範圍。 個別測試問題可能來自大量涉及廣泛主題的項目。
在某些情況下,一項測試可以衡量一個難以定義的特徵,專家法官可能會評估每個項目的相關性。 由於每位法官都是根據他們的意見進行評級,因此兩位獨立評委會分別評估這項測試。 最終測試將包括兩位評委強烈關注的項目。
2.標準相關的有效性
當測試已經證明其有效性預測建構的標准或指標時(例如,雇主根據面試,教育和經驗等正常招聘程序僱用新員工時),測試就具有與標準相關的有效性。 這種方法表明,在測試中表現良好的人在工作上表現良好,而在測試中得分低的人在工作上表現不佳。
有兩種不同類型的標準有效性:
- 當標準測量與測試分數同時獲得時,會發生並發有效性 。 這表明測試分數根據標準精確估計個人當前狀態的程度。 例如,在測量抑鬱程度的測試中,如果測試受試者經歷的當前抑鬱程度,則該測試將被認為具有同時有效性。
- 預測效度發生在測試後一次獲得標準測量值時。 具有預測效度的測試的例子是職業或能力傾向測試 ,這有助於確定誰可能在某些科目或職業中成功或失敗。
3.構建有效性
如果一個測試證明了測驗分數與理論特質的預測之間的聯繫,那麼它就具有結構有效性。
智力測驗是應具有結構有效性的測量工具的一個例子。 有效的智力測驗應該能夠準確地測量智力結構,而不是其他特徵,如記憶力或教育水平。
從本質上講,內容有效性考察測試是否覆蓋構成被測量構造的全部行為。 這裡的程序是確定執行諸如打字,設計或體能等工作的必要任務。 為了證明選擇程序的內容有效性,選擇中所表現的行為應該是工作行為的代表性樣本 。
表面效度
另一種很少使用的方法是因為它不是非常複雜的,而是面部效度。 它僅基於度量的外觀以及它應該測量的內容,而不是測試實際測量的內容。
面子有效性是最基本的有效性措施之一。 從本質上講,研究人員通過查看測試是否可以測量目標變量來簡單地從面值角度考慮測試的有效性。 例如,在衡量快樂程度時,如果測試看起來真正衡量幸福程度,那麼就會說測試具有面部效度。
顯然,面部有效性僅意味著測試看起來像是有效的。 這並不意味著測試已經被證明可行。 但是,如果此時此措施似乎有效,研究人員可能會進一步調查以確定測試是否有效,並且應該在將來使用。
從本質上講,面部效度是測試似乎是衡量應該測量的內容。 它涉及以面值作為測試。
據調查詢問他們計劃投票的政治候選人將被稱為具有較高的面部效度。 測試的目的非常明確,即使對不熟悉心理測量學的人也是如此。
一個複雜的測試被用作看著各種價值觀,特徵和行為的心理學實驗的一部分,可能被認為是低表面效度。 測試的確切目的並不是很清楚,特別是參與者。
顯然,雖然面部效度可能是確定測試是否似乎衡量其聲稱要測量的一個好工具,但單獨面對效度並不意味著測試實際上是有效的。 有時候測試看起來像是在測量一件事,而實際上它完全在測量其他東西。