GIÁO TRÌNH

Kinh Tế Lượng

Science and Technology

Thống kê suy diễn 2

Tác giả: Phạm Trí Cao

Thống kê suy diễn - Kiểm định giả thiết thống kê

Giả thiết

Giả thiết không là một phát biểu về giá trị của tham số hoặc về giá trị của một tập hợp các tham số. Giả thiết ngược phát biểu về giá trị của tham số hoặc một tập hợp tham số khi giả thiết không sai. Giả thiết không thường được ký hiệu là H0 và giả thiết ngược thường được ký hiệu là H1.

Kiểm định hai đuôi

Ví dụ 13. Quay lại ví dụ 11 về biến X là chi phí cho học tập của học sinh tiểu học. Chúng ta biết phương sai của X là σx2 size 12{σ rSub { size 8{x} } rSup { size 8{2} } } {}=100. Với một mẫu với cỡ mẫu n=100 chúng ta đã tính được X__1 size 12{ {X} cSup { size 8{"__"} } rSub { size 8{1} } } {}=105 ngàn đồng/học sinh/tháng. Chúng ta xem xét khả năng bác bỏ phát biểu cho rằng chi phí cho học tập trung bình của học sinh tiểu học là 106 ngàn đồng/tháng.

Giả thiết

H0: μ size 12{μ} {} = 106 = μ size 12{μ} {}0

H1: μ size 12{μ} {} size 12{ <> } {} 106 = μ size 12{μ} {}0

Chúng ta đã biết X__ size 12{ {X} cSup { size 8{"__"} } } {}~N( μ size 12{μ} {}, σx2 size 12{σ rSub { size 8{x} } rSup { size 8{2} } } {}/n), với độ tin cậy 95% hay mức ý nghĩa a = 5% chúng ta đã xây dựng được ước lượng khoảng của μ size 12{μ} {}

.

Nếu khoảng này không chứa μ size 12{μ} {} thì ta bác bỏ giả thiết không với độ tin cậy 95%, ngược lại ta không đủ cơ sở để bác bỏ giả thiết H0.

Ở phần trên chúng ta đã tính được ước lượng khoảng của μ size 12{μ} {} dựa theo Xˉ1 size 12{ { bar {X}} rSub { size 8{1} } } {} là (103;107). Khoảng này chứa μ size 12{μ} {}0 = 106. Vậy ta không thể bác bỏ được giả thiết H0.

Khoảng tin cậy mà ta thiết lập được được gọi là miền chấp nhận, miền giá trị nằm ngoài miền chấp nhận được gọi là miền bác bỏ.

Hình 2.7. Miền bác bỏ và miền chấp nhận H0.

Tổng quát hơn ta có

Z=

~N(0,1) hay Z tuân theo phân phối chuẩn hoá.

α/2α/2

Hình 2.8. Miền chấp nhận và miền bác bỏ theo α size 12{α} {}của trị thống kê Z

Ta có tất cả hai miền bác bỏ và do tính chất đối xứng của phân phối chuẩn, nếu mức ý nghĩa là α size 12{α} {}thì xác suất để Z nằm ở miền bác bỏ bên trái là α size 12{α} {}/2 và xác suất để Z nằm ở miền bác bỏ bên trái cũng là α size 12{α} {}/2. Chúng ta đặt giá trị tới hạn bên trái là Z α size 12{α} {}/2 và giá trị tới hạn bên phải là Z1-α size 12{α} {}/2. Do tính đối xứng ta lại có

Xác suất để Z nằm trong hai khoảng tới hạn là

hay

Thay

và biến đổi một chút chúng ta nhận được

Các mệnh đề (2.1) và (2.2) là những mệnh đề xác suất.

Kiểm định giả thiết thống kê theo phương pháp truyền thống

Phát biểu mệnh đề xác suất

Nguyên tắc ra quyết định

Nếu

hoặc

thì ta bác bỏ H0 với độ tin cậy 1- α size 12{α} {} hay xác suất mắc sai lầm là α size 12{α} {}.

Nếu

thì ta không thể bác bỏ H0.

Với mức ý nghĩa

Ta có

Vậy ta không thể bác bỏ giả thiết Ho.

Kiểm định giả thiết thống kê theo trị thống kê Z

Phát biểu mệnh đề xác suất

Quy tắc quyết định

Nếu

hoặc

thì ta bác bỏ H0 với độ tin cậy 1- α size 12{α} {} hay xác suất mắc sai lầm là α size 12{α} {}.

Nếu Z α size 12{α} {}/2 ≤ Ztt ≤ Z1-α size 12{α} {}/2 thì ta không thể bác bỏ H0.

Với mức ý nghĩa α size 12{α} {} =5% ta có

Z1-α size 12{α} {}/2 = Z97,5% = 1,96 ≈ 2

và Z α size 12{α} {}/2 = Z2,5% = -1,96 ≈ -2

Vậy ta không thể bác bỏ Ho.

Kiểm định giả thiết thống kê theo giá trị p

Đối với kiểm định hai đuôi giá trị p được tính như sau:

Với Ztt = -1 ta có P(1<Z) = 0,16, vậy giá trị p = 0,32.

Quy tắc quyết định

Nếu p α size 12{ <= α} {} : Bác bỏ Ho.

Nếu p ≥ α size 12{α} {} : Không thể bác bỏ Ho.

Trong ví dụ trên p = 0,32 > α size 12{α} {} = 5%. Vậy ta không thể bác bỏ Ho.

Ba cách tiếp cận trên cho cùng một kết quả vì thực ra chỉ từ những biến đổi của cùng một mệnh đề xác suất. Trong kinh tế lượng người ta cũng thường hay sử dụng giá trị p.

Kiểm định một đuôi

Kiểm định đuôi trái

Ví dụ 14. Tiếp tục ví dụ 13. Kiểm định phát biểu : “Chi cho học tập trung bình của học sinh tiểu học lớn hơn 108 ngàn đồng/học sinh/tháng”.

Giả thiết

H0: μ size 12{μ} {} > 108 = μ size 12{μ} {}0

H1: μ size 12{μ} {}≤ 108 = μ size 12{μ} {}0

Phát biểu mệnh đề xác suất

P(Z α size 12{α} {}<Z) =1- α size 12{α} {}

Quy tắc quyết định

Nếu Ztt < Z α size 12{α} {} : Bác bỏ Ho.

Nếu Ztt ≥ Z α size 12{α} {} : Không thể bác bỏ Ho.

Với α size 12{α} {} = 5% ta có Z5% = -1,644

Ta có

vậy ta bác bỏ Ho.

Kiểm định đuôi phải

Ví dụ 15. Tiếp tục ví dụ 13. Kiểm định phát biểu : “Chi tiêu cho học tập trung bình của học sinh tiểu học nhỏ hơn 108 ngàn đồng/học sinh/tháng”.

Giả thiết

H0: μ size 12{μ} {}< 107 = μ size 12{μ} {}0

H1: μ size 12{μ} {} ≥ 107 = μ size 12{μ} {}0

Phát biểu mệnh đề xác suất

P(Z<Z1-α size 12{α} {}) =1- α size 12{α} {}

Quy tắc quyết định

Nếu Ztt > Z α size 12{α} {} : Bác bỏ Ho.

Nếu Ztt ≤ Z α size 12{α} {} : Không thể bác bỏ Ho.

Ta có

vậy ta không thể bác bỏ Ho.

Một số trường hợp đặc biệt cho ước lượng giá trị trung bình của tổng thể

Tổng thể có phân phối chuẩn, cỡ mẫu lớn, phương sai chưa biết. Chiến lược kiểm định giống như trên nhưng thay phương sai tổng thể bằng phương sai mẫu.

Tổng thể có phân phối chuẩn, phương sai chưa biết, cỡ mẫu nhỏ:

Kiểm định trên trị thống kê t cũng tương tự như đối với trị thống kê Z, ta chỉ việc tra t thay cho Z. Khi cỡ mẫu đủ lớn trị thống kê t tương tự trị thống kê Z.

Tổng thể không tuân theo phân phối chuẩn, áp dụng định lý giới hạn trung tâm. Khi cỡ mẫu đủ lớn thì trị thống kê t tính toán như phần trên có phân phối gần với phân phối Z.

Ngoài ra chúng ta còn có thể kiểm định các giả thiết về phương sai, kiểm định sự bằng nhau giữa các phương sai của hai tổng thể và kiểm định sự bằng nhau giữa các trung bình tổng thể. Chúng ta xét kiểm định giả thiết về phương sai vì giả định về phương sai không đổi là một giả định quan trọng trong phân tích hồi quy.

Kiểm định giả thiết về phưong sai

Xét giả thiết

Ho : σ2=σ02 size 12{σ rSup { size 8{2} } =σ rSub { size 8{0} } rSup { size 8{2} } } {}

H1 : σ2σ02 size 12{σ rSup { size 8{2} } <> σ rSub { size 8{0} } rSup { size 8{2} } } {}

Có thể chứng minh được

Mệnh đề xác suất

Quy tắc quyết định

Nếu

hoặc
, thì bác bỏ H0.

Nếu

, thì không bác bỏ H0.

Kiểm định sự bằng nhau của phương sai hai tổng thể

Chúng ta có mẫu cỡ n1 từ tổng thể 1 và mẫu cỡ n2 từ tổng thể 2.

Xét giả thiết

H0 : σ12=σ22=σ2 size 12{σ rSub { size 8{ {} rSup { size 6{1} } } } rSup {2} size 12{ {}=σ rSub {2} rSup {2} } size 12{ {}=σ rSup {2} }} {}

H1 : σ12σ22 size 12{σ rSub { size 8{ {} rSup { size 6{1} } } } rSup {2} size 12{ <> σ rSub {2} rSup {2} }} {}

Chúng ta đã có

Vậy

Hay

Phát biểu mệnh đề xác suất

Quy tắc quyết định

Nếu

thì ta bác bỏ H0.

Nếu

thì không bác bỏ H0.

2.4.5. Sai lầm loại I và sai lầm loại II

Khi ta dựa vào một mẫu để bác bỏ một giả thiết, ta có thể mắc phải một trong hai sai lầm như sau:

Sai lầm loại I: Bác bỏ Ho khi thực tế Ho đúng.

Sai lầm loại II : Không bác bỏ Ho khi thực tế nó sai.

Tính chất
Quyết định H0 đúng H0 sai
Bác bỏ Sai lầm loại I Không mắc sai lầm
Không bác bỏ Không mắc sai lầm Sai lầm loại II

Hình 2.7. Sai lầm loại I-Bác bỏ H0: H0 size 12{ {} rSub { size 8{H0} } } {}=108 trong khi thực tế H0 đúng.

Xác suất mắc sai lầm loại I

Ví dụ 16. Tiếp tục ví dụ 13. Kiểm định phát biểu : “Chi cho học tập trung bình của học sinh tiểu học là 108 ngàn đồng/học sinh/tháng”. Trung bình thực μ size 12{μ} {} = μ size 12{μ} {}0=108.

Giả thiết

H0: μ size 12{μ} {} = 108 = μ size 12{μ} {}0

H1: μ size 12{μ} {}≠ 108 = μ size 12{μ} {}0

Giả sử giá trị μ size 12{μ} {}thực là μ size 12{μ} {}=108. Với ước lượng khoảng cho μ size 12{μ} {} là (103;107) với độ tin cậy 95% chúng ta bác bỏ H0 trong khi thực sự H0 là đúng. Xác suất chúng ta mắc sai lầm loại này là μ size 12{μ} {} = 5%.

Xác suất mắc sai lầm loại II

Ví dụ 17. Tiếp tục ví dụ 13. Kiểm định phát biểu : “Chi tiêu cho học tập trung bình của học sinh tiểu học là 108 ngàn đồng/học sinh/tháng”. Trung bình thực μ size 12{μ} {}= μ size 12{μ} {}0=104.

Giả thiết

H0: μ size 12{μ} {} = 108 = μ size 12{μ} {}0

H1: μ size 12{μ} {}≠ 108 = μ size 12{μ} {}0

Giả sử giá trị μ size 12{μ} {} thực là μ size 12{μ} {}=104. Với ước lượng khoảng cho μ size 12{μ} {} là (103;107) với độ tin cậy 95% chúng ta không bác bỏ H0 trong khi H0 sai. Xác suất chúng ta mắc sai lầm loại II này là μ size 12{μ} {}

Lý tưởng nhất là chúng ta tối thiểu hoá cả hai loại sai lầm. Nhưng nếu chúng ta muốn hạn chế sai lầm loại I, tức là chọn mức ý nghĩa μ size 12{μ} {} nhỏ thì khoảng ước lượng càng lớn và xác suất mắc phải sai lầm loại II càng lớn. Nghiên cứu của Newman và Pearson

Damodar N. Gujarati, Basic Econometrics-Third Edition, McGraw-Hill Inc -1995, p 787.
cho rằng sai lầm loại I là nghiêm trọng hơn sai lầm loại II. Do đó, trong thống kê suy diễn cổ điển cũng như trong kinh tế lượng cổ điển, người ta chọn mức ý nghĩa μ size 12{μ} {} hay xác suất mắc sai lầm loại I nhỏ, thông thường nhất là 5% mà không quan tâm nhiều đến μ size 12{μ} {}.

Tóm tắt các bước của kiểm định giả thiết thống kê

Bước 1.Phát biểu giả thiết H0 và giả thiết ngược H1.

Bước 2. Lựa chọn trị thống kê kiểm định

Bước 3. Xác định phân phối thống kê của kiểm định

Bước 4. Lựa chọn mức ý nghĩa μ size 12{μ} {}hay xác suất mắc sai lầm loại I.

Bước 5. Sử dụng phân phối xác suất của thống kê kiểm định, thiết lập một khoảng tin cậy 1- μ size 12{μ} {}, khoảng này còn được gọi là miền chấp nhận. Nếu trị thống kê ứng với H0 nằm trong miền chấp nhận thì ta không bác bỏ H0, nếu trị thông kê ứng với H0 nằm ngoài miền chấp nhận thì ta bác bỏ H0. Lưu ý là khi bác bỏ H0 chúng ta chấp nhận mức độ sai lầm là μ size 12{μ} {}.