Hôm nay, nhóm MBA Bách Khoa xin giới thiệu đến các bạn một hệ số cực kì quan trọng trong kiểm định thống kê, đó là hệ số sig. Trong phân tích SPSS hoặc trong các phần mềm như Stata, hệ số này còn được gọi là hệ số p value.
Đang xem: Ý nghĩa của mức ý nghĩa
Bạn đang xem: Significance Level Là Gì – Ý Nghĩa Thống Kê (Statistical Significance) Là Gì

Nghĩa là hệ số sig. và hệ số p value chỉ là hai cách gọi khác nhau của cùng một khái niệm.
p-value là viết tắt của probability, còn sig. là viết tắt của significance level.
Thường trong các kiểm định, người ta muốn biết cấp độ ý nghĩa của một kết quả. Bài viết này sẽ giải thích các phần chính sau đây:
- Quy trình kiểm định giả thiết thống kê test of significance.
- Ý nghĩa của trị số p value, ý nghĩa của hệ số sig.
- Giả thiết là gì?
- Giả thiết vô hiệu (null hypothesis) là gì?
- Giả thuyết khác (alternative hypothesis) là gì?
- Sai lầm loại I và loại II.
- Ví dụ về sai lầm loại 1 và 2.
- Mức ý nghĩa là gì?
Quy trình kiểm định giả thiết thống kê test of significance
Bước 1: Phát biểu giả thiết vô hiệu (null hypothesis H0). Nhà nghiên cứu cần phải đặt ra một giả thuyết đảo (null hypothesis), tức là một giả thuyết mà người nghiên cứu cho là sai.
Bước 2: Đặt ra giả thuyết phụ (alternative hypothesis), tức là một giả thuyết mà người nghiên cứu cho là đúng và muốn chứng minh bằng số liệu.
Xem thêm : NganHangAZ.com
Bước 3: Tiến hành kiểm tra thông qua các phương pháp thống kê để xác định giả thuyết nào là khả dĩ. Xác suất của kết quả này thường được đo bằng trị số p value.
Bước 4: Dựa vào kết quả của bước 3, quyết định chấp nhận hoặc loại bỏ giả thuyết đảo. Thông thường, nếu giá trị xác suất nhỏ hơn 5%, người nghiên cứu sẽ loại bỏ giả thuyết đảo. Ngược lại, nếu giá trị xác suất lớn hơn 5%, người nghiên cứu chỉ có thể kết luận rằng chưa có đủ bằng chứng để bác bỏ giả thuyết đảo.
Bước 5: Nếu giả thuyết đảo bị loại bỏ, người nghiên cứu chấp nhận giả thuyết phụ. Theo quy ước trong khoa học, mọi giá trị p-value nhỏ hơn 0.05 được coi là “significant” hay “có ý nghĩa thống kê”.
Ý nghĩa của trị số p value và hệ số sig.
Trị số p value và hệ số sig. đều có ý nghĩa là xác suất của dữ liệu xảy ra trong trường hợp giả thiết vô hiệu H0 là đúng. Tức là nó cho biết phần trăm dữ liệu trong bộ số liệu thỏa mãn một điều kiện nào đó. Ví dụ, nếu p = 2%, có 2% dữ liệu trong bộ số liệu thỏa mãn một điều kiện cụ thể.
Không nên hiểu rằng xác suất của giả thiết vô hiệu H0 là 2%, hay P(H0) = 2%, mà nên hiểu là xác suất của dữ liệu xảy ra trong trường hợp giả thiết vô hiệu H0 là đúng.
Nhìn chung, trị số p value được dùng để chứng minh nghịch đảo hay phủ định một giả thiết. Nếu giả thiết vô hiệu H0 là đúng, thì dữ liệu không thể xảy ra. Nhưng nếu dữ liệu xảy ra thì giả thiết vô hiệu H0 là không đúng.
Định nghĩa giả thiết
Giả thiết là một giả sử hoặc phát biểu về các tham số của tổng thể. Nó có thể đúng hoặc sai.
Giả thiết vô hiệu (null hypothesis H0) là gì?
Xem thêm : Nhà ngộp là gì? Lưu ý cần biết trước khi đầu tư nhà đất ngộp
H0 là một phát biểu liên quan đến tham số của tổng thể. Giả thiết vô hiệu là giả thiết ngược lại với giả thiết chính. Thông thường, người ta muốn loại bỏ giả thiết vô hiệu. Ví dụ: H0: Không có sự khác biệt giữa hai nhóm, không có mối tương quan giữa X và Y. H0 thường được giả định là đúng trong quá trình kiểm định giả thuyết. Người nghiên cứu sẽ cố gắng tìm cách chứng minh rằng H0 là sai. Ví dụ, một tuyên bố của nhà sản xuất thường bị nghi ngờ và được đặt trong phát biểu của H0.
Giả thuyết khác (alternative hypothesis Ha) là gì?
Ha là phát biểu ngược lại của H0. Ha được chấp nhận là đúng nếu H0 bị loại bỏ. Người nghiên cứu mong muốn ủng hộ Ha và hoài nghi H0. Nhiệm vụ của kiểm định giả thuyết là quyết định xem có bác bỏ H0 hay không bác bỏ H0.
Sai lầm loại I và loại II
Sai lầm loại I là sai lầm khi bác bỏ H0 khi H0 đúng. Sai lầm loại II là sai lầm khi không bác bỏ H0 khi H0 sai. Cụ thể, với bất kỳ quy trình kiểm định nào, có thể có ba kết quả: (1) quyết định đúng (nghĩa là, chấp nhận H0 đúng và bác bỏ H0 sai), (2) loại bỏ một giả thuyết đúng, (3) chấp nhận một giả thuyết sai. Sai lầm bác bỏ H0 khi H0 đúng được gọi là sai lầm loại I. Sai lầm không bác bỏ H0 khi H0 sai được gọi là sai lầm loại II. Tương ứng với mỗi loại sai lầm này là một giá trị xác suất, được ký hiệu là P(I) và P(II).
Ví dụ về sai lầm loại I và loại II
Giả sử chúng ta xét một vụ án hình sự. Giả thuyết không là bị cáo “vô tội” và giả thuyết ngược lại là “có tội”. Giả định là bên bị đơn là vô tội và bên nguyên đơn phải chứng minh được rằng bên bị đơn có tội, tức là thuyết phục ban hội thẩm bác bỏ giả thuyết không. Nếu ban hội thẩm tuyên bố một người vô tội “không có tội” hoặc một người phạm tội “có tội”, thì đã có một quyết định đúng. Nếu một người vô tội bị tuyên bố có tội, ta phạm sai lầm loại I vì giả thuyết đúng đã bị bác bỏ. Sai lầm loại II xảy ra khi một người có tội được tuyên bố vô tội.
Một cách lý tưởng, chúng ta muốn cả hai xác suất sai lầm loại I P(I) và loại II P(II) đều càng nhỏ càng tốt, không quan trọng giá trị của thông số chưa biết. Tuy nhiên, nỗ lực để giảm P(I) sẽ dẫn đến P(II) tăng lên và ngược lại. Ví dụ, trong trường hợp vụ án hình sự, nếu chúng ta không muốn kết án một người vô tội, thì cách duy nhất là tuyên bố mọi người đều có tội. Trong trường hợp này, P(II) = 0 nhưng P(I) = 1 vì chúng ta cũng kết án tất cả những người vô tội. Tương tự, cách duy nhất để tránh kết án một người có tội là tuyên bố mọi người đều vô tội. Trong trường hợp này, chúng ta cũng thả tự do cho tất cả những kẻ phạm tội, nghĩa là P(II) = 1 và P(I) = 0. Trong thực tế, sự đánh đổi giữa hai sai lầm không cực đoan như vậy, tuy nhiên việc áp dụng một quy tắc quyết định cụ thể sẽ tốt hơn cho một số giá trị của thông số và không tốt cho những giá trị khác. Trong kiểm định giả thuyết truyền thống, người phân tích chọn giá trị cực đại cho sai lầm loại I được chấp nhận và đưa ra quy tắc quyết định sao cho sai lầm loại II là thấp nhất. Với ví dụ vụ án hình sự, điều này có nghĩa là chọn quy tắc quyết định sao cho số lần kết án một người vô tội không vượt quá một phần trăm số lần nào đó (chẳng hạn 1%) và cực tiểu hoá xác suất để một người có tội được thả tự do.
Mức ý nghĩa là gì?
Xác suất sai lầm loại I lớn nhất khi H0 đúng được gọi là mức ý nghĩa (hay kích thước của kiểm định). Trong ví dụ vụ án hình sự, đó là xác suất lớn nhất để kết án một người vô tội.
Như vậy, câu hỏi “Hệ số sig. là gì? Hệ số p value là gì?” đã được trả lời. Nếu có bất kỳ thắc mắc nào, hãy liên hệ với chúng tôi.