心理測量學的可靠性與一致性

當我們呼喚某人或某些可靠的東西時,我們的意思是說他們是一貫可靠的。 可靠性也是良好心理測試的重要組成部分。 畢竟,如果測試不一致並且每次都會產生不同的結果,那麼測試就不會很有價值。 心理學家如何定義可靠性? 它對心理測試有什麼影響?

可靠性是指措施的一致性。 如果我們重複獲得相同的結果,則測試被認為是可靠的。 例如,如果一項測試旨在衡量一種特質(如內向性 ),那麼每次對某個主體進行測試時,結果應該大致相同。 不幸的是,精確計算可靠性是不可能的,但它可以通過許多不同的方式進行估算。

測試 - 重新測試可靠性

重測信度是衡量心理測試或評估一致性的指標。 這種可靠性用於確定測試在一段時間內的一致性。 測試重測信度最適用於隨時間變化穩定的情況,如智能

通過在兩個不同時間點進行兩次測試來測量重測信度。 這種類型的可靠性假定質量或構造不會發生變化。

在大多數情況下,測試之間的時間很短,可靠性會更高。

測試重測法只是可以用來確定測量可靠性的方法之一。 可以使用的其他技術包括評估者間可靠性,內部一致性和並行形式可靠性。

重要的是要指出,重測信度只是指測試的一致性,而不一定是測試結果的有效性

評估者之間的可靠性

這種可靠性的評估方式是由兩名或兩名以上的獨立評委進行測試。 然後比較分數以確定評估者估計的一致性。

測試評分者間可靠性的一種方法是讓每個評估者為每個測試項目分配一個評分。 例如,每個評估者都可以從1到10的等級上評分項目。接下來,您將計算兩個評分之間的相關性,以確定評分者間信度的等級。

測試評分者間可靠性的另一種方法是讓評估者確定每個觀察屬於哪個類別,然後計算評估者之間的一致性百分比。 因此,如果評估者同意10次中的8次,則該測試具有80%的評分者間可靠性率。

並行形式的可靠性

通過比較使用相同內容創建的兩個不同測試來衡量並行形式的可靠性。 這是通過創建一個大量的測試項目來衡量相同的質量,然後隨機將項目分成兩個單獨的測試來完成的。 然後這兩個測試應該同時對相同的對象進行管理。

內部一致性可靠性

這種形式的可靠性用於判斷同一測試中各項目結果的一致性。 基本上,您正在比較測量相同構造的測試項目以確定測試內部一致性。 當您看到與另一個測試問題看起來非常相似的問題時,可能表明這兩個問題正用於衡量可靠性。 因為這兩個問題是相似的,並且旨在衡量同一事物,考生應該同時回答這兩個問題,這將表明該考試具有內部一致性。

可能影響可靠性的因素

有很多不同的因素會影響衡量標準的可靠性。

首先也許最明顯的是,被測量的事物是相當穩定和一致的。 如果測量的變量是定期變化的,那麼測試結果將不一致。

測試情況的各個方面也會影響可靠性。 例如,如果測試是在非常熱的房間中進行的,那麼受訪者可能會分心並且無法盡其所能地完成測試。 這可能會影響措施的可靠性。 其他諸如疲勞,壓力,疾病,動機,差勁指令和環境干擾等因素也會影響可靠性。

可靠性與有效性

重要的是要注意,僅僅因為測試具有可靠性,並不意味著它有效。 有效性是指測試是否真正衡量其聲稱要衡量的內容。 將可靠性視為精度和有效性的度量,以此作為衡量準確性的指標。 在某些情況下,測試可能是可靠的,但無效。 例如,假設求職者正在進行測試以確定他們是否擁有特定的人格特質 。 雖然測試可能會產生一致的結果,但實際上它可能並沒有衡量它聲稱要衡量的特質。