p-value


“p-value” hay “giá trị p” là mức ý nghĩa, tương tự mức ý nghĩa (tương đương với độ tin cậy 95% huyền thoại), nhưng lại là mức ý nghĩa nhỏ nhất mà tại đó kiểm định có ý nghĩa. Tức là?

Xét một kiểm định về tính cân bằng của đồng xu:

Tung một đồng xu 50 lần thì có 35 lần xuất hiện mặt ngửa. Vậy có kết luận được đồng xu đó là không cân bằng hay không?

Gọi p là xác suất xuất hiện mặt ngửa nếu đồng xu được tung vô hạn lần ( là tỉ lệ xuất hiện mặt ngửa trong n lần tung), ta có giả thuyết chính và giả thuyết đảo hư sau:

Gọi X là số lần xuất hiện mặt ngửa trong 50 lần tung đồng xu thì X sẽ là biến ngẫu nhiên rời rạc có phân phối nhị phân.

1. Trước hết giải bài toán với mức ý nghĩa

Sử dụng phân phối nhị phân:

Số lần xuất hiện mặt ngửa t ít nhất sao cho được tính bằng công thức

t <- qbinom(1-0.05,50,0.5)
t
## [1] 31

31 < 35 nên chúng ta bác bỏ với độ tin cậy 95% (mức ý nghĩa 0.05).

Sử dụng phân phối chuẩn:

Một tính chất của tỉ lệ xuất hiện mặt ngửa trong mẫu n phần tử là:

Ở đây ta có:

Ta đã biết nên t được tính bằng công thức

t <- 50*(1.96*sqrt(1/50*0.5*(1-0.5)) + 0.5)
t
## [1] 32

31.9 < 35 nên chúng ta đưa ra kết luận giống như trên.

2. Tìm p-value

Với ta tính được t = 31 và t = 31.9 theo 2 phương pháp. Vậy với t = 35 thì tương ứng sẽ là? p-value.

Nói cách khác, ở đây .

Sử dụng mô phỏng:

Chúng ta sẽ thực hiện 100.000 mô phỏng tung 50 lần một đồng xu với xác suất xuất hiện mặt ngửa 0.5 rồi tính trung bình tỉ lệ xuất hiện của mặt ngửa từ 35 lần trở lên trong 100.000 mô phỏng đó.

nreps <- 100000
bin <- rbinom(nreps,50,0.5)
sum(bin>=35) / nreps
## [1] 0.0036

Sử dụng công thức:

Tính trên R như sau

s <- 0
for (i in 35:50) s <- s + choose(50,i)*0.5^50
s
## [1] 0.0033

Để tính thay cho công thức dài ở trên, R có hàm pbinom() để tính xác suất tích lũy, tính như sau

1 - pbinom(34,50,0.5)
## [1] 0.0033

Tại sao trong công thức pbinom(34,50,0.5) ta lại dùng 34 chứ không phải 35?

Sử dụng phép xấp xỉ phân phối chuẩn:

Ta tính Z, rồi tính 1 - pnorm(Z)

z <- (35/50 - 0.5)/sqrt(1/50*0.5*(1-0.5))
z
## [1] 2.8
1 - pnorm(z)
## [1] 0.0023