Thống kê suy diễn - Kiểm định giả thiết thống kê
Giả thiết
Giả thiết không là một phát biểu về giá trị của tham số hoặc về giá trị của một tập hợp các tham số. Giả thiết ngược phát biểu về giá trị của tham số hoặc một tập hợp tham số khi giả thiết không sai. Giả thiết không thường được ký hiệu là H0 và giả thiết ngược thường được ký hiệu là H1.
Kiểm định hai đuôi
Ví dụ 13. Quay lại ví dụ 11 về biến X là chi phí cho học tập của học sinh tiểu học. Chúng ta biết phương sai của X là =100. Với một mẫu với cỡ mẫu n=100 chúng ta đã tính được =105 ngàn đồng/học sinh/tháng. Chúng ta xem xét khả năng bác bỏ phát biểu cho rằng chi phí cho học tập trung bình của học sinh tiểu học là 106 ngàn đồng/tháng.
Giả thiết
H0: = 106 = 0
H1: 106 = 0
Chúng ta đã biết ~N( , /n), với độ tin cậy 95% hay mức ý nghĩa a = 5% chúng ta đã xây dựng được ước lượng khoảng của là
.
Nếu khoảng này không chứa thì ta bác bỏ giả thiết không với độ tin cậy 95%, ngược lại ta không đủ cơ sở để bác bỏ giả thiết H0.
Ở phần trên chúng ta đã tính được ước lượng khoảng của dựa theo là (103;107). Khoảng này chứa 0 = 106. Vậy ta không thể bác bỏ được giả thiết H0.
Khoảng tin cậy mà ta thiết lập được được gọi là miền chấp nhận, miền giá trị nằm ngoài miền chấp nhận được gọi là miền bác bỏ.
Hình 2.7. Miền bác bỏ và miền chấp nhận H0.
Tổng quát hơn ta có
Z= ~N(0,1) hay Z tuân theo phân phối chuẩn hoá.
α/2α/2
Hình 2.8. Miền chấp nhận và miền bác bỏ theo của trị thống kê Z
Ta có tất cả hai miền bác bỏ và do tính chất đối xứng của phân phối chuẩn, nếu mức ý nghĩa là thì xác suất để Z nằm ở miền bác bỏ bên trái là /2 và xác suất để Z nằm ở miền bác bỏ bên trái cũng là /2. Chúng ta đặt giá trị tới hạn bên trái là Z /2 và giá trị tới hạn bên phải là Z1-/2. Do tính đối xứng ta lại có
Xác suất để Z nằm trong hai khoảng tới hạn là
hay
Thay
và biến đổi một chút chúng ta nhận được
Các mệnh đề (2.1) và (2.2) là những mệnh đề xác suất.
Kiểm định giả thiết thống kê theo phương pháp truyền thống
Phát biểu mệnh đề xác suất
Nguyên tắc ra quyết định
Nếu
hoặc
thì ta bác bỏ H0 với độ tin cậy 1- hay xác suất mắc sai lầm là .
Nếu
thì ta không thể bác bỏ H0.
Với mức ý nghĩa
Ta có
Vậy ta không thể bác bỏ giả thiết Ho.
Kiểm định giả thiết thống kê theo trị thống kê Z
Phát biểu mệnh đề xác suất
Quy tắc quyết định
Nếu
hoặc
thì ta bác bỏ H0 với độ tin cậy 1- hay xác suất mắc sai lầm là .
Nếu Z /2 ≤ Ztt ≤ Z1-/2 thì ta không thể bác bỏ H0.
Với mức ý nghĩa =5% ta có
Z1-/2 = Z97,5% = 1,96 ≈ 2
và Z /2 = Z2,5% = -1,96 ≈ -2
Vậy ta không thể bác bỏ Ho.
Kiểm định giả thiết thống kê theo giá trị p
Đối với kiểm định hai đuôi giá trị p được tính như sau:
Với Ztt = -1 ta có P(1<Z) = 0,16, vậy giá trị p = 0,32.
Quy tắc quyết định
Nếu p : Bác bỏ Ho.
Nếu p ≥ : Không thể bác bỏ Ho.
Trong ví dụ trên p = 0,32 > = 5%. Vậy ta không thể bác bỏ Ho.
Ba cách tiếp cận trên cho cùng một kết quả vì thực ra chỉ từ những biến đổi của cùng một mệnh đề xác suất. Trong kinh tế lượng người ta cũng thường hay sử dụng giá trị p.
Kiểm định một đuôi
Kiểm định đuôi trái
Ví dụ 14. Tiếp tục ví dụ 13. Kiểm định phát biểu : “Chi cho học tập trung bình của học sinh tiểu học lớn hơn 108 ngàn đồng/học sinh/tháng”.
Giả thiết
H0: > 108 = 0
H1: ≤ 108 = 0
Phát biểu mệnh đề xác suất
P(Z <Z) =1-
Quy tắc quyết định
Nếu Ztt < Z : Bác bỏ Ho.
Nếu Ztt ≥ Z : Không thể bác bỏ Ho.
Với = 5% ta có Z5% = -1,644
Ta có
vậy ta bác bỏ Ho.
Kiểm định đuôi phải
Ví dụ 15. Tiếp tục ví dụ 13. Kiểm định phát biểu : “Chi tiêu cho học tập trung bình của học sinh tiểu học nhỏ hơn 108 ngàn đồng/học sinh/tháng”.
Giả thiết
H0: < 107 = 0
H1: ≥ 107 = 0
Phát biểu mệnh đề xác suất
P(Z<Z1-) =1-
Quy tắc quyết định
Nếu Ztt > Z : Bác bỏ Ho.
Nếu Ztt ≤ Z : Không thể bác bỏ Ho.
Ta có
vậy ta không thể bác bỏ Ho.
Một số trường hợp đặc biệt cho ước lượng giá trị trung bình của tổng thể
Tổng thể có phân phối chuẩn, cỡ mẫu lớn, phương sai chưa biết. Chiến lược kiểm định giống như trên nhưng thay phương sai tổng thể bằng phương sai mẫu.
Tổng thể có phân phối chuẩn, phương sai chưa biết, cỡ mẫu nhỏ:
Kiểm định trên trị thống kê t cũng tương tự như đối với trị thống kê Z, ta chỉ việc tra t thay cho Z. Khi cỡ mẫu đủ lớn trị thống kê t tương tự trị thống kê Z.
Tổng thể không tuân theo phân phối chuẩn, áp dụng định lý giới hạn trung tâm. Khi cỡ mẫu đủ lớn thì trị thống kê t tính toán như phần trên có phân phối gần với phân phối Z.
Ngoài ra chúng ta còn có thể kiểm định các giả thiết về phương sai, kiểm định sự bằng nhau giữa các phương sai của hai tổng thể và kiểm định sự bằng nhau giữa các trung bình tổng thể. Chúng ta xét kiểm định giả thiết về phương sai vì giả định về phương sai không đổi là một giả định quan trọng trong phân tích hồi quy.
Kiểm định giả thiết về phưong sai
Xét giả thiết
Ho :
H1 :
Có thể chứng minh được
Mệnh đề xác suất
Quy tắc quyết định
Nếu hoặc, thì bác bỏ H0.
Nếu, thì không bác bỏ H0.
Kiểm định sự bằng nhau của phương sai hai tổng thể
Chúng ta có mẫu cỡ n1 từ tổng thể 1 và mẫu cỡ n2 từ tổng thể 2.
Xét giả thiết
H0 :
H1 :
Chúng ta đã có
Vậy
Hay
Phát biểu mệnh đề xác suất
Quy tắc quyết định
Nếu
thì ta bác bỏ H0.
Nếu thì không bác bỏ H0.
2.4.5. Sai lầm loại I và sai lầm loại II
Khi ta dựa vào một mẫu để bác bỏ một giả thiết, ta có thể mắc phải một trong hai sai lầm như sau:
Sai lầm loại I: Bác bỏ Ho khi thực tế Ho đúng.
Sai lầm loại II : Không bác bỏ Ho khi thực tế nó sai.
Tính chất | ||
Quyết định | H0 đúng | H0 sai |
Bác bỏ | Sai lầm loại I | Không mắc sai lầm |
Không bác bỏ | Không mắc sai lầm | Sai lầm loại II |
Hình 2.7. Sai lầm loại I-Bác bỏ H0: =108 trong khi thực tế H0 đúng.
Xác suất mắc sai lầm loại I
Ví dụ 16. Tiếp tục ví dụ 13. Kiểm định phát biểu : “Chi cho học tập trung bình của học sinh tiểu học là 108 ngàn đồng/học sinh/tháng”. Trung bình thực = 0=108.
Giả thiết
H0: = 108 = 0
H1: ≠ 108 = 0
Giả sử giá trị thực là =108. Với ước lượng khoảng cho là (103;107) với độ tin cậy 95% chúng ta bác bỏ H0 trong khi thực sự H0 là đúng. Xác suất chúng ta mắc sai lầm loại này là = 5%.
Xác suất mắc sai lầm loại II
Ví dụ 17. Tiếp tục ví dụ 13. Kiểm định phát biểu : “Chi tiêu cho học tập trung bình của học sinh tiểu học là 108 ngàn đồng/học sinh/tháng”. Trung bình thực = 0=104.
Giả thiết
H0: = 108 = 0
H1: ≠ 108 = 0
Giả sử giá trị thực là =104. Với ước lượng khoảng cho là (103;107) với độ tin cậy 95% chúng ta không bác bỏ H0 trong khi H0 sai. Xác suất chúng ta mắc sai lầm loại II này là
Lý tưởng nhất là chúng ta tối thiểu hoá cả hai loại sai lầm. Nhưng nếu chúng ta muốn hạn chế sai lầm loại I, tức là chọn mức ý nghĩa nhỏ thì khoảng ước lượng càng lớn và xác suất mắc phải sai lầm loại II càng lớn. Nghiên cứu của Newman và Pearson
Tóm tắt các bước của kiểm định giả thiết thống kê
Bước 1.Phát biểu giả thiết H0 và giả thiết ngược H1.
Bước 2. Lựa chọn trị thống kê kiểm định
Bước 3. Xác định phân phối thống kê của kiểm định
Bước 4. Lựa chọn mức ý nghĩa hay xác suất mắc sai lầm loại I.
Bước 5. Sử dụng phân phối xác suất của thống kê kiểm định, thiết lập một khoảng tin cậy 1- , khoảng này còn được gọi là miền chấp nhận. Nếu trị thống kê ứng với H0 nằm trong miền chấp nhận thì ta không bác bỏ H0, nếu trị thông kê ứng với H0 nằm ngoài miền chấp nhận thì ta bác bỏ H0. Lưu ý là khi bác bỏ H0 chúng ta chấp nhận mức độ sai lầm là .
- Kinh Tế Lượng
- Giới Thiệu_kinh tế lượng
- Xác Suất
- Thống kê mô tả
- Thống kê suy diễn
- Thống kê suy diễn 2
- Khái niệm về hồi quy
- Hàm hồi quy tổng thể và hồi quy mẫu
- Ước lượng các hệ số của mô hình hồi quy theo phương pháp bình phương tối thiểu
- Khoảng tin cậy và kiểm định giả thiết về các hệ số hồi quy
- Ý nghĩa của hồi quy tuyến tính và một số dạng hàm thường được sử dụng
- Xây dựng mô hình hồi quy tuyến tính bội
- Biến phân loại
- Giới thiệu một số vấn đề liên quan đến mô hình hồi quy
- Dự báo với mô hình hồi quy
- Các thành phần của dữ liệu chuỗi thời gian
- Dự báo theo đường xu hướng dài hạn
- Một số tiêu chuẩn kỹ thuật dự báo đơn giản
- Giới thiệu mô hình ARIMA
- Tài liệu tham khảo
- Bài tập kinh tế lương
- Kinh tế lương – mô hinh hồi quy tuyến tính bội