Thống kê suy diễn - vấn đề ước lượng
Ước lượng
Chúng ta tìm hiểu bản chất, đặc trưng và yêu cầu của ước lượng thống kê thông qua một ví dụ đơn giản là ước lượng giá trị trung bình của tổng thể.
Ví dụ 11. Giả sử chúng ta muốn khảo sát chi phí cho học tập của học sinh tiểu học tại trường tiểu học Y. Chúng ta muốn biết trung bình chi phí cho học tập của một học sinh tiểu học là bao nhiêu. Gọi X là biến ngẫu nhiên ứng với chi phí cho học tập của một học sinh tiểu học (X tính bằng ngàn đồng/học sinh/tháng). Giả sử chúng ta biết phương sai của X là =100. Trung bình thực của X là là một số chưa biết. Chúng ta tìm cách ước lượng dựa trên một mẫu gồm n=100 học sinh được lựa chọn một cách ngẫu nhiên.
Hàm ước lượng cho
Chúng ta dùng giá trị trung bình mẫu để ước lượng cho giá trị trung bình của tổng thể . Hàm ước lượng như sau

là một biến ngẫu nhiên. Ứng với một mẫu cụ thể thì nhận một giá trị xác định.
Ước lượng điểm
Ứng với một mẫu cụ thể, giả sử chúng ta tính được = 105 (ngàn đồng/học sinh). Đây là một ước lượng điểm.
Xác suất để một ước lượng điểm như trên đúng bằng trung bình thực là bao nhiêu? Rất thấp hay có thể nói hầu như bằng 0.
Ước lượng khoảng
Ước lượng khoảng cung cấp một khoảng giá trị có thể chứa giá trị chi phí trung bình cho học tập của một học sinh tiểu học. Ví dụ chúng ta tìm được = 105. Chúng ta có thể nói có thể nằm trong khoảng hay .
Khoảng ước lượng càng rộng thì càng có khả năng chứa giá trị trung bình thực nhưng một khoảng ước lượng quá rộng như khoảng hay thì hầu như không giúp ích được gì cho chúng ta trong việc xác định . Như vậy có một sự đánh đổi trong ước lượng khoảng với cùng một phương pháp ước lượng nhất định: khoảng càng hẹp thì mức độ tin cậy càng nhỏ.
Phân phối của
Theo định lý giới hạn trung tâm 1 thì là một biến ngẫu nhiên có phân phối chuẩn. Vì có phân phối chuẩn nên chúng ta chỉ cần tìm hai đặc trưng của nó là kỳ vọng và phương sai.
Kỳ vọng của
Phương sai của

Vậy độ lệch chuẩn của
là
Từ thông tin này, áp dụng quy tắc 2 thì xác suất khoảng chứa sẽ xấp xỉ 95%. Ước lượng khoảng với độ tin cậy 95% cho là

Lưu ý: Mặc dù về mặt kỹ thuật ta nói khoảng
Ý nghĩa chính xác của độ tin cậy 95% cho ước lượng khoảng cho
như sau: Với quy tắc xây dựng khoảng là
Tổng quát hơn, nếu trị thống kê cần ước lượng là
với 0 < < 1
hay xác suất khoảng từ đến chứa giá trị thật là 1- thì 1- được gọi là độ tin cậy của ước lượng, được gọi là mức ý nghĩa của ước lượng và cũng là xác suất mắc sai lầm loại I.
Nếu = 5% thì 1- là 95%. Mức ý nghĩa 5% hay độ tin cậy 95% thường được sử dụng trong thống kê và trong kinh tế lượng.
Các tính chất đáng mong đợi của một ước lượng được chia thành hai nhóm, nhóm tính chất của ước lượng trên cỡ mẫu nhỏ và nhóm tính chất ước lượng trên cỡ mẫu lớn.
Các tính chất ứng với mẫu nhỏ
Không thiên lệch(không chệch)
Một ước lượng là không thiên lệch nếu kỳ vọng của đúng bằng .
Như đã chứng minh ở phần trên, là ước lượng không thiên lệch của .

Hình 2.4. Tính không thiên lệch của ước lượng.
1 là ước lượng không thiên lệch của trong khi 2 là ước lượng thiên lệch của .
Phương sai nhỏ nhất
Hàm ước lượng có phương sai nhỏ nhất khi với bất cứ hàm ước lượng nào ta cũng có .
Không thiên lệch tốt nhất hay hiệu quả
Một ước lượng là hiệu quả nếu nó là ước lượng không thiên lệch và có phương sai nhỏ nhất.
Hình 2.5. Ước lượng hiệu quả. Hàm ước lượng 2 hiệu quả hơn 1.
Tuyến tính
Một ước lượng của được gọi là ước lượng tuyến tính nếu nó là một hàm số tuyến tính của các quan sát mẫu.
Ta có
Vậy là ước lượng tuyến tính cho .
Ước lượng không thiên lệch tuyến tính tốt nhất (Best Linear Unbiased Estimator-BLUE)
Một ước lượng được gọi là BLUE nếu nó là ước lượng tuyến tính, không thiên lệch và có phương sai nhỏ nhất trong lớp các ước lượng tuyến tính không thiên lệch của . Có thể chứng minh được là BLUE.
Sai số bình phương trung bình nhỏ nhất
Sai số bình phương trung bình: MSE( )=E( - )2
Sau khi biến đổi chúng ta nhận được: MSE( )=var( )+E[E( )- ]2
MSE( )=var( )+bias( )
Sai số bình phương trung bình bằng phương sai của ước lượng cộng với thiên lệch của ước lượng. Chúng ta muốn ước lượng ít thiên lệch đồng thời có phương sai nhỏ. Người ta sử dụng tính chất sai số bình phương trung bình nhỏ khi không thể chọn ước lượng không thiên lệch tốt nhất.
Tính chất của mẫu lớn
Một số ước lượng không thoả mãn các tính chất thống kê mong muốn khi cỡ mẫu nhỏ nhưng khi cỡ mẫu lớn đến vô hạn thì lại có một số tính chất thống kê mong muốn. Các tính chất thống kê này được gọi là tính chất của mẫu lớn hay tính tiệm cận.
Tính không thiên lệch tiệm cận
Ước lượng được gọi là không thiên lệch tiệm cận của nếu
Ví dụ 2.12. Xét phương sai mẫu của biến ngẫu nhiên X:


Có thể chứng minh được

Vậy là ước lượng không thiên lệch của , trong khi là ước lượng không thiên lệch tiệm cận của .
Nhất quán
Một ước lượng
Hình 2.6. Ước lượng nhất quán
Quy luật chuẩn tiệm cận
Một ước lượng
Trong phần trên chúng ta đã thấy biến X có phân phối chuẩn với trung bình μ và phương sai σ2 thì có phân phối chuẩn với trung bình μ và phương sai σ2/n với cả cỡ mẫu nhỏ và lớn.
Nếu X là biến ngẫu nhiên có trung bình μ và phương sai σ2 nhưng không theo phân phân phối chuẩn thì
- Kinh Tế Lượng
- Giới Thiệu_kinh tế lượng
- Xác Suất
- Thống kê mô tả
- Thống kê suy diễn
- Thống kê suy diễn 2
- Khái niệm về hồi quy
- Hàm hồi quy tổng thể và hồi quy mẫu
- Ước lượng các hệ số của mô hình hồi quy theo phương pháp bình phương tối thiểu
- Khoảng tin cậy và kiểm định giả thiết về các hệ số hồi quy
- Ý nghĩa của hồi quy tuyến tính và một số dạng hàm thường được sử dụng
- Xây dựng mô hình hồi quy tuyến tính bội
- Biến phân loại
- Giới thiệu một số vấn đề liên quan đến mô hình hồi quy
- Dự báo với mô hình hồi quy
- Các thành phần của dữ liệu chuỗi thời gian
- Dự báo theo đường xu hướng dài hạn
- Một số tiêu chuẩn kỹ thuật dự báo đơn giản
- Giới thiệu mô hình ARIMA
- Tài liệu tham khảo
- Bài tập kinh tế lương
- Kinh tế lương – mô hinh hồi quy tuyến tính bội