2
Most read
5
Most read
10
Most read
Khoa Kinh tế
ĐHQG TP.HCM

Kinh tế lượng

©2007

CHƯƠNG 3: HỒI QUI ĐƠN BIẾN
3.1 Bản chất thống kê của mô hình hồi quy đơn biến
Phương pháp ước lượng LS, về thực chất, chỉ là vẽ một đường hồi quy đi xuyên qua “đám
bụi” dữ liệu, sao cho tổng bình phương các phần dư [hay sai số] ESS là nhỏ nhất. Nhưng
việc đo lường mang tính thuần túy đại số đó chưa có gì bảo đảm chắc chắn rằng nó sẽ cho
^

^

ra những ước lượng α , β tốt nhất của các tham số tổng thể α , β theo những tiêu chuẩn xác
định về mặt thống kê. Để có thể những đánh giá cụ thể hơn về độ tốt của ước lượng, chúng
ta cần xem xét sâu hơn bản chất thống kê của mô hình hồi quy.
Để dễ hình dung, chúng ta bắt đầu bằng sự giả định phi thực rằng, quan hệ giữa biến X và
Y [chẳng hạn như giữa thu nhập và tiêu dùng] chỉ tuân theo quy luật xác định, và hoàn toàn
N
không bị chi phối bởi các yếu tố ngẫu nhiên. Khi đó, các quan sát {x n , y n }n =1 sẽ nằm gọn
trên một đường thẳng mô tả xu thế thực của tổng thể:

Y =α +β ⋅X
x
x
x
x
x
x

yn

x

ˆ
β ≡β

Không có yếu tố
ngẫu nhiên tác động
R2 = 1

x

0

xn

Đồ thị 3.1a: quy luật xác định giữa X và Y.

^

^

Khi đó, việc ước lượng trở nên tầm thường, vì ta luôn có α = α , β = β , và R 2 = 1 .
Lê Hồng Nhật
Trần Thiện Trúc Phượng

1
Khoa Kinh tế
ĐHQG TP.HCM

Kinh tế lượng

©2007

Bây giờ, chúng ta cho phép các yếu tố ngẫu nhiên tác động lên quan hệ giữa X , Y . Như đã
N
nêu, các nhân tố này khiến cho các quan sát {x n , y n }n =1 bị lệch một cách ngẫu nhiên khỏi
đường xu thế tổng thể. Vì vậy, thay vì nhìn thấy một đường xu thẳng tuyến tính như trên
hình 3.1a, ta chỉ nhìn thấy một đám bụi dữ liệu bám xung quanh một xu thế nào đó mà ta
muốn ước lượng.

x
x
x

x

x

x
x

x

0

Đồ thị 3.1b: Quan hệ giữa X và Y bị nhiễu bởi các yếu tố ngẫu nhiên

N
Trên Đồ thị 3.1b, ta thấy các điểm quan sát {x n , y n }n =1 , trước đây nằm trên cùng một
đường thẳng trên hình 3.1a, nay bị “thổi bay” lên thành một “đám bụi” dữ liệu, mà việc
“chụp ảnh” chúng [tức là đi thu thập dữ liệu], rồi vẽ một đường hồi quy chạy xuyên qua
chúng sẽ không nhất thiết là trùng với quy luật tổng thể (mô tả bởi gạch chấm). Điều này
^

gợi ý rằng mỗi ước lượng β chịu sự quy định bởi tham số tổng thể β , nhưng bị lái đi bởi
^

^

các biến ngẫu nhiên. [Tương tự, ta có thể nói như vậy về α ]. Vì vậy, β cũng là một biến
ngẫu nhiên. Vấn đề đặt ra là, về trung bình mà nói [tức là sau rất nhiều lần chụp ảnh các
^

đám bụi dữ liệu], liệu ước lượng β có thể hiện đúng β hay không? Và liệu phương pháp
ước lượng bình phương cực tiểu có là hiệu quả nhất hay không?
Về mặt toán học, phương pháp bình phương cực tiểu cho ta ước lượng sau:
Lê Hồng Nhật
Trần Thiện Trúc Phượng

2
Khoa Kinh tế
ĐHQG TP.HCM

Kinh tế lượng

ˆ
β=

S XY
=
S XX

∑ (x

n

©2007

− x )( y n − y )

(3.1)

S XX

Hay cũng vậy,

ˆ
β=

[điều này là do

∑

∑ (x

n

− x )yn

(3.2)

S XX
−

( xn − x ) y = 0 , như đã chỉ ra ở chương 1, phần ôn tập].
n
−

( x − x)
Trong (3.2), ta đặt c n = n
, và nhận xét rằng, tham số đó chỉ phụ thuộc vào các quan
S XX
N
sát {x n }n =1 . Do vậy, nó không chịu ảnh hưởng bởi các yếu tố ngẫu nhiên. Khi đó, công thức
(3.2) có thể viết lại như sau:

^

β = ∑n c n y n
= ∑n c n [α + β x n + ε n ]
= α ∑ cn + β ∑ cn xn + ∑ cnε n

Chúng ta có thể dễ dàng chỉ ra rằng,

∑c
n

n

= 0 và

ˆ
β = β + ∑ cn ε n

∑c
n

n

x n = 1. Và do vậy:

(3.3)

ˆ
ˆ
Phương trình (3.3) khẳng định nhận định trước đây về β là đúng: Ước lượng β bị ảnh
hưởng bởi các yếu tố ngẫu nhiên ε n , làm giá trị của nó không trùng khít với β tổng thể.
ˆ
Và vì vậy, β cũng là một biến ngẫu nhiên.

ˆ
ˆ
Chúng ta gọi β là ước lượng không chệch, nếu Eβ = β . Và gọi nó là ước lượng hiệu
^

ˆ
quả nhất, nếu sai số ước lượng Varβ = E ( β − β ) 2 là nhỏ nhất trong lớp tất cả các ước
lượng tuyến tính, không chệch.
Lê Hồng Nhật
Trần Thiện Trúc Phượng

3
Khoa Kinh tế
ĐHQG TP.HCM

Kinh tế lượng

©2007

ˆ
Để trả lời xem β có phải là ước lượng không chệch và hiệu quả hay không, ta phải xét đến
N
bản chất thống kê của các quá trình ngẫu nhiên {ε n }n =1 [mà ta đã ví chúng như những “cơn
gió”, ngẫu nhiên “thổi bay” các quan sát khỏi đường xu thế xác định của tổng thể].

3.2 Các yếu tố ngẫu nhiên
Chúng ta hãy nêu lên giả định về các quá trình ngẫu nhiên. Hãy nhìn vào đồ thị sau:

N
Đồ thị 3.2: Quy luật phân phối xác suất của các nhiễu {ε n }n =1

Như đã nhận xét từ các Đồ thị 3.1a và 3.1b, khi không có các tác động ngẫu nhiên, hay
N
ε n = 0 , các quan sát {x n , y n }n =1 nằm ngay trên đường xu thế của tổng thể. Dưới tác động
N
của yếu tố ngẫu nhiên, các quan sát {x n , y n }n =1 nằm rải ra, nhưng “bám” xung quanh đường
xu thế. Rất hiếm khi có quan sát bị “thổi” mạnh tới nỗi “bay” quá xa so với đường xu thế.
Điều đó dẫn đến hai giả thiết sau:

Lê Hồng Nhật
Trần Thiện Trúc Phượng

4
Khoa Kinh tế
ĐHQG TP.HCM

Kinh tế lượng

©2007

A1 Eε n = 0, với mọi n. [Bụi giữ liệu không thể bay quá xa, mà bám xung quanh đường
tổng thể]
A2 Varε n = σ 2 , với mọi n. [Độ tán xạ của đám bụi dữ liệu được thể hiện bởi độ lớn của

σ 2 ].
Chúng ta cũng coi rằng quy luật tác động của “cơn gió”, tức là phân bố xác suất của yếu tố
ngẫu nhiên ε n là như nhau (identical), và theo phân bố chuẩn. Hơn nữa, các yếu tố ngẫu
nhiên đó là độc lập (independent). Vì vậy, kết hợp với các giả thiết A1 và A2, ta có:
iid

A3 ε n ~ N (0, σ 2 ) với mọi n.

Cuối cùng, ta coi ta coi x n là xác định trước. Từ giả thiết A1 và dạng mô hình
y n = α + βx n + ε n , điều đó bao hàm rằng:
A4 E ( y n | x n ) = α + βx n ,

với mọi n.

Hai giả thiết cuối là quan trọng nhất. A3 tóm tắt mọi đặc trưng thống kê của nhiễu ngẫu
nhiên, và A4 mô tả xu thế của tổng thể, mà ta ước lượng nó theo phương pháp bình phương
cực tiểu.

3.3 Những đặc trưng thống kê của ước lượng bình phương cực tiểu
Bây giờ ta có thể nói đến tính tốt của các ước lượng theo các tiêu chuẩn thống kê .

ˆ
Từ phương trình (3.3), ta đã có: β = β + ∑ cnε n . Bây giờ, hãy áp dụng toán tử kỳ vọng
vào hai vế của (3.3):
ˆ
Eβ = E ( β + ∑ c n ε n )
= β + ∑ c n Eε n

=β

ˆ
[ở đây, ta sử dụng giả thiết A1: Eε n = 0 ].Ta đi đến kết luận rằng, ước lượng β là không
chệch:
Lê Hồng Nhật
Trần Thiện Trúc Phượng

5
Khoa Kinh tế
ĐHQG TP.HCM

Kinh tế lượng

ˆ
Eβ = β

©2007

(3.4)

Tiếp theo, sử dụng công thức: Var ( x) = Var ( x − Ex) [xem chương 1, phần ôn tập], và lưu ý
(3.3), (3.4), ta có:
^

ˆ
Varβ = Var ( β − β )
= Var (∑ c n ε n )
Sử dụng giả thiết A3 về tính độc lập của các yếu tố ngẫu nhiên, cuối cùng ta nhận được:
2
ˆ
Varβ = ∑ c n Varε n

2
= σ 2 ∑ c n , hay
^

Var β =

σ2

(3.5)

S XX
2

−
⎡
⎤
( x n − x) ⎥
S
1
2
(ở đây, ta sử dụng cái điều là ∑ c n = ∑ ⎢
= XX =
)
2
⎢ S XX ⎥
S XX S XX
⎣
⎦

Định Lý Gauss - Markov: Phương pháp bình phương cực tiểu có sai số ước lượng, đo
^

lường bởi Var β , là nhỏ nhất trong lớp tất cả các ước lượng tuyến tính và không chệch.
Định lý Gauss-Markov là hết sức quan trọng. Nó nêu lên rằng, chúng ta có được những tính
chất rất tốt cho ước lượng theo phương pháp bình phương cực tiểu, mà chỉ đòi hỏi có trung
bình bằng zero, tính độc lập, và phương sai giống nhau của các yếu tố ngẫu nhiên – tức là
giả thiết A3.
Chúng ta cũng nên nói thêm là, phương trình (3.5) có một ý nghĩa thực tiễn đáng lưu ý. Nó
^

nói rằng sai số của ước lượng Var β sẽ nhỏ đi, hay hiệu quả ước lượng sẽ tăng lên, nếu độ
đa dạng của thông tin quan sát, đo bởi S XX , tăng lên. Điều đó bao hàm rằng, khi làm nghiên
cứu, ta không cứ nhất thiết phải tăng rất lớn số quan sát (sample size) N. Nếu giả thiết về
tính tuyến tính của đường hồi quy là đúng, thì việc tăng độ đa dạng của thông tin quan sát,
6
Lê Hồng Nhật
Trần Thiện Trúc Phượng
Khoa Kinh tế
ĐHQG TP.HCM

Kinh tế lượng

©2007

−

hay biên độ giao động của biến giải thích, S XX = ∑n ( x n − x) 2 , sẽ làm cho ước lượng có độ
chính xác cao hơn. Hãy xét các ví dụ sau:

A
x
x

x

x
x

x

x

0

Đồ thị 3.3a: Ước lượng có độ chính xác thấp, do S XX nhỏ.

Trên Đồ thị 3.3a, giả sử ta có số quan sát N rất lớn, nhưng với biên độ giao động S XX nhỏ.
Khi đó, chỉ cần bỏ đi một quan sát như ứng với điểm A thôi, thì cũng đủ làm các hệ số ước
^

^

lượng {α , β } thay đổi rất mạnh [từ đường mầu đỏ chuyển sang đường tô mầu da cam].
^

Điều đó chứng tỏ sai số ước lượng, đo bởi Var β , là lớn. Ta sẽ xét kỹ hơn vấn đề này trong
chương 7 về đa cộng tuyến (multicollinearity).

A
x
x

x

x
x
x

x

x

x
x

0

x

Đồ thị 3.3b: Ước lượng có độ chính xác cao hơn, ứng với S XX lớn hơn.

Lê Hồng Nhật
Trần Thiện Trúc Phượng

7
Khoa Kinh tế
ĐHQG TP.HCM

Kinh tế lượng

©2007

Trên Đồ thị 3.3b, việc loại bỏ đi một vài quan sát, như điểm A, sẽ ít làm thay đổi các hệ số
ước lượng. Kết quả ước lượng có độ ổn định cao hơn và chính xác hơn.
Tuy nhiên, những nhận xét trên chỉ đúng, khi giả thuyết tuyến tính của đường hồi quy là
đúng. Đôi khi, giá trị rất lớn của S XX lại hàm ý rằng giả thuyết tuyến tính là đáng nghi vấn:

x
x

x

x
x

x
x

x

x

x
x

0

Đồ thị 3.3c: Quy luật tổng thể không phải là tuyến tính (gây nên S XX lớn)

Đồ thị 3.3c thể hiện rằng, việc hiểu sai về bản chất kinh tế đã gây nên việc áp dụng sai mô
hình hồi quy tuyến tính. Những sai lầm kiểu như vậy dẫn đến yêu cầu phải kiểm định giả
thuyết thống kê về tính có ý nghĩa của các tham số của mô hình. Đó là chủ đề của phần
3.4.2 của chương này. Việc sử dụng các dạng hàm khác nhau (functional forms) để mô tả
N
quy luật chi phối các dữ liệu quan sát {x n , y n }n =1 là một chủ đề khác nữa, mà nó cũng sẽ
được đề cập trong chương 6.

3.4 Kiểm định giả thuyết thống kê
Để có màu sắc kinh tế, ta hãy xét vấn đề kiểm định thông qua một ví dụ cụ thể.
Ví dụ 3.5: Một công ty bảo hiểm ở Mỹ muốn kinh doanh bảo hiểm nhân thọ. Họ tiến hành
nghiên cứu tiềm năng của thị trường sở tại. Lý luận kinh tế đã chỉ ra rằng, yêu cầu về mua
bảo hiểm tăng lên cùng với khả năng xẩy ra rủi ro, với quy mô về tổn thất tài chính khi rủi
ro xẩy ra, và với tâm lý ngại rủi ro của cá nhân. Họ nhận định rằng, gia đình càng giầu có
nhờ kinh doanh, thì người chủ gia đình càng chịu nhiều stress. Tức là, những người lệ thuộc
càng ngại rủi ro gây nên bởi stress cho người chủ gia đình, hơn là tại những gia đình có thu

Lê Hồng Nhật
Trần Thiện Trúc Phượng

8
Khoa Kinh tế
ĐHQG TP.HCM

Kinh tế lượng

©2007

nhập thấp, ít tham dự vào kinh doanh. Vì vậy, ban nghiên cứu thị trường của công ty bảo
hiểm này đề xuất mô hình sau:
INS = α + βINC
Trong đó, INS là giá trị hợp đồng bảo hiểm, được trả cho bên mua bảo hiểm, nếu xẩy ra rủi
ro. Và INC là thu nhập. Cả hai biến lượng đều tính bằng nghìn dollars. Dữ liệu điều tra và
kết quả ước lượng được ghi lại trong các bảng dưới đây
obs
1
2
3
4
5
6
7
8
9
10

INSUR
90
165
220
145
114
175
145
192
395
339

INC
25
40
60
30
29
41
37
46
105
81

obs
11
12
13
14
15
16
17
18
19
20

INSUR
230
262
570
100
210
243
335
299
305
205

INC
57
72
140
23
55
58
87
72
80
48

Bảng 3.1: Số liệu điều tra về nhu cầu mua bảo hiểm

Lê Hồng Nhật
Trần Thiện Trúc Phượng

9
Khoa Kinh tế
ĐHQG TP.HCM

Kinh tế lượng

©2007

INSUR vs. INC
600
500

INSUR

400
300
200
100
0
20

40

60

80

100 120 140 160

INC

Đồ thị 3.4: Nhu cầu mua bảo hiểm

Sử dụng eviews, chúng ta nhận được kết quả hồi quy dưới đây:

Dependent Variable: INSUR
Method: Least Squares
Date: 04/21/07 Time: 21:41
Sample: 1 20
Included observations: 20
Variable

Coefficient

Std. Error

t-Statistic

Prob.

C
INC

6.854991
3.880186

7.383473
0.112125

0.928424
34.60601

0.3655
0.0000

R-squared
Adjusted R-squared
S.E. of regression
Sum squared resid
Log likelihood
Durbin-Watson stat

Lê Hồng Nhật
Trần Thiện Trúc Phượng

0.985192
0.984370
14.35730
3710.375
-80.61033
3.175965

Mean dependent var
S.D. dependent var
Akaike info criterion
Schwarz criterion
F-statistic
Prob(F-statistic)

236.9500
114.8383
8.261033
8.360606
1197.576
0.000000

10
Khoa Kinh tế
ĐHQG TP.HCM

Kinh tế lượng

©2007

Bảng 3.2: Kết quả ước lượng các tham số của mô hình

Kết quả ước lượng được tóm tắt lại như sau:
INS = 6.85 + 3.88 INC

(3.6)

(7.38) (0.11)
N = 20,

R 2 = 0.98,

ESS = 3710

Vấn đề tiếp theo của các nhà hoạch định chiến lược của công ty là liệu họ có thể nói gì về
sức mua bảo hiểm tương ứng với từng lớp thu nhập. Điều đó sẽ giúp cho công ty ra quyết
định kinh doanh. Ví dụ, nếu thu nhập gia đình tăng thêm một ngàn dollars, thì chi cho bảo
hiểm sẽ tăng lên trong khỏang từ 3 ngàn tới 5 ngàn dollars với độ tin cậy là bao nhiêu?
Nghĩa là công ty cần xác định được khoảng tin cậy của β tổng thể.
3.4.1 Khoảng tin cậy

ˆ ˆ
Chúng ta sẽ sử dụng các đặc trưng thống kê của ước lượng α , β để đánh giá về các tính
chất của tham số thực (tổng thể) α , β .

ˆ
Từ quan hệ (3.3), β = β + ∑ cnε n , và giả thuyết A3 về tính phân bố chuẩn của các yếu tố
ˆ
ngẫu nhiên ε , ta đã biết rằng β có phân bố chuẩn. Hơn thế nữa, từ các đánh giá về trung
n

ˆ
bình và phương sai của β , ghi trong phương trình (3.4) và (3.5), ta có thể viết lại
ˆ
σ2
β −β
ˆ
rằng: β ~ N ( β ,
) . Điều đó có nghĩa là, sau khi chuẩn hóa, Z =
~ N (0,1) .
S XX
σ 2 S XX
Để công thức này có ý nghĩa ứng dụng, ta thay thế σ 2 , bởi ức lượng không trệch của nó là
1
1
s2 =
∑n en2 = N − 2 ESS . Khi đó, thống kê Z chuyển thành thống kê
N −2
^
ˆ
β −β
β− β
t=
=
~ t ( N − 2) . Đồ thị phân bố của thống kê t , trông rất tương tự như
^
s 2 S XX
se( β )
thống kê Z:

Lê Hồng Nhật
Trần Thiện Trúc Phượng

11
Khoa Kinh tế
ĐHQG TP.HCM

Kinh tế lượng

©2007

^

Đồ thị 3.5: Phân bố t =

β− β
^

se( β )

~ t ( N − 2)

Như đã chỉ ra trên Đồ thị 3.5, khoảng tin cậy (Confidence interval) (1 − λ ) % của thống kê
^

t=

β− β
^

se( β )

là vùng mà t sẽ rơi vào khoảng đó với xác suất là (1 − λ ) . Tức là:
^

Pr ob{−t λ ( N − 2) ≤
2

β− β
^

se( β )

≤ t λ ( N − 2)} = (1 − λ ) .
2

Nói khác đi, ta có:
^

^

β ∈ {β ± se( β )t λ ( N − 2)}
2

với độ tin cậy (1 − λ ) %

^

(3.7)

^

Chẳng hạn, trong ví dụ về công ty bảo hiểm (3.6), ta có: β = 3.88 ; se( β ) = 0.112 . Lưu ý
rằng t 0.025 [18] = 2.101 , độ tin cậy 95% của β tổng thể là:

β ∈ {3.88 ± 0.112 × 2.101}

(3.8)

3.4.2 Kiểm định giả thuyết thống kê

Thông thường, kết quả ước lượng mô hình (3.6) và đánh giá độ tin cậy (3.8) sẽ được đính
kèm trong bản báo cáo đưa lên cho ban giám đốc công ty để ra quyết định về chiến lược
kinh doanh. Tuy nhiên, công việc nghiên cứu thị trường không chỉ dừng lại tại đó. Chúng ta
Lê Hồng Nhật
Trần Thiện Trúc Phượng

12
Khoa Kinh tế
ĐHQG TP.HCM

Kinh tế lượng

©2007

tiếp tục ví dụ bảo hiểm bằng việc nói rằng, ban giám đốc công ty họp để đánh giá bản báo
cáo này. Sau đây là những ghi chép được từ cuộc họp:
Nhà quản lý M1 nói rằng, theo kinh nghiệm của ông, thu nhập đã được thể chế hóa qua các
tài sản tài chính, như cổ phiếu, địa ốc, vân vân. Và ảnh hưởng của thu nhập bằng tiền mặt
tới chi tiêu cho bảo hiểm nhân thọ là rất yếu.
Thành viên khác của ban giám đốc, nhà quản lý M2 lại cho rằng, thu nhập bằng tiền có ảnh
hưởng rất mạnh tới nhu cầu mua bảo hiểm nhân thọ. Kinh nghiệm làm ăn của ông cho thấy,
cứ 1000 dollars tăng thêm về thu nhập sẽ kéo theo giá trị gói bảo hiểm mua bởi hộ gia đình
tăng lên 5000 dollars.
Cuối cùng, ông M3 nêu lại rằng, thu nhập bằng tiền đúng là có ảnh hưởng, nhưng không
mạnh tới như vậy. Cứ 1000 dollars tăng thêm về thu nhập chỉ kéo theo nhu cầu về bảo hiểm
tăng lên 4000 dollars.
Vậy ai trong số họ là đúng? Và nếu nhận định của nhà quản lý M1 đúng, thì thật là rất đáng
tiếc. Vì vậy, chúng ta cần tiến hành kiểm định lại những nhận định này.
Một cách tổng quát, ta tiến hành kiểm định giả thiết thống kê như sau:
H 0 : β = β 0 .vs. H 1 : β ≠ β 0
Ví dụ, theo nhận định của nhà quản lý công ty M1, ta có:
H 0 : β = 0 .vs. H 1 : β ≠ 0
Logic chung của vấn đề kiểm định giả thuyết là như sau: Nếu như nhận định của anh là
đúng, thì nó phải phù hợp với phần lớn trường hợp quan sát thấy trên thực tế. Tức là, giá trị
^

thống kê t 0 =

β − β0
^

phải rơi vào khoảng tin cậy, chẳng hạn là 95%. Trong trường hợp đó,

se( β )
ta không bác bỏ giả thuyết H 0 (hay ký hiệu bằng tiếng Anh: DNRH 0 ) . Nếu giá trị
^

t0 =

β − β0
^

nằm ngoài khoảng tin cậy, tức là rơi vào vùng hiếm quan sát thấy trên thực tế,

se( β )
khi đó ta bác bỏ H 0 (hay ký hiệu là RH 0 ).

Lê Hồng Nhật
Trần Thiện Trúc Phượng

13
Khoa Kinh tế
ĐHQG TP.HCM

Kinh tế lượng

©2007

Đồ thị 3.6: Vùng chấp nhận và bác bỏ H 0

^

Đồ thị 3.6 thể hiện rằng, chúng ta sẽ bác bỏ ( RH 0 ), nếu | t 0 |=

β− β
^

se( β )

≥ t λ ( N − 2) , và
2

^

chúng ta sẽ không bác bỏ ( DNRH 0 ), nếu

β− β
^

se( β )

≤ t λ ( N − 2) .
2

Trong ví dụ nêu trên, đối với nhận định của nhà quản lý M1, ta tiến hành kiểm định như
sau:

| t 0 |=

3.88
= 34.6 ≥ 2.01 = t 0.025 [18]
0.112

Như vậy, dựa trên kết quả kiểm định, ta có thể bác bỏ mạnh mẽ giả định của nhà quản lý
M1. Bây giờ chúng ta hãy thử tự kiểm định xem nhận định của các nhà quản lý M2 và M3
có đúng không.
Cuối cùng, để cho tiện sử dụng, trong các software ứng dụng như eviews, người ta thường
cho biết giá trị p-value, được định nghĩa như sau:
P − value = Pr ob{| t ( N − 2) |≥| t 0 |)

Lê Hồng Nhật
Trần Thiện Trúc Phượng

14
Khoa Kinh tế
ĐHQG TP.HCM

Kinh tế lượng

©2007

Đồ thị 3.7: biểu diễn của p-value

Vì vậy, chúng ta sẽ bác bỏ giả thuyết ( RH 0 ), nếu: p − value ≤ λ , [như chỉ ra trên đồ thị
3.7]. Và chúng ta sẽ không bác bỏ giả thuyết đó ( DNRH 0 ) , nếu p − value ≥ λ .

Lê Hồng Nhật
Trần Thiện Trúc Phượng

15

More Related Content

PDF
Lịch sử các học thuyết kinh tế.pdfdggggggggggggggggggg
PDF
Bảng Student
PDF
Chuong5 KIỂM ĐỊNH PHI THAM SỐ
PPT
Phương pháp nghiên cứu định lượng
PDF
Kiểm định giả thuyết thống kê
PDF
Mô hình hổi qui đơn biến
PDF
đề Thi xác suất thống kê và đáp án
PDF
Chuong4 PHÂN TÍCH PHƯƠNG SAI MỘT YẾU TỐ
Lịch sử các học thuyết kinh tế.pdfdggggggggggggggggggg
Bảng Student
Chuong5 KIỂM ĐỊNH PHI THAM SỐ
Phương pháp nghiên cứu định lượng
Kiểm định giả thuyết thống kê
Mô hình hổi qui đơn biến
đề Thi xác suất thống kê và đáp án
Chuong4 PHÂN TÍCH PHƯƠNG SAI MỘT YẾU TỐ

What's hot (20)

PDF
huong dan giai bai tap kinh te vĩ mô phan 1
DOC
Đề tài: Học thuyết kinh tế của John Maynard Keynes và ứng dụng học thuyết kin...
PDF
Hồi qui vói biến giả
DOC
Tổng cầu và các hàm tổng cầu
PDF
BẢNG TRA PHÂN PHỐI CHI-SQUARE
PPTX
kinh tế vĩ mô - chương 5,6,7
DOCX
bài tập kinh tế vi mô
PPT
Chương 3: Hồi quy bội
DOCX
đề Cương kinh tế lượng
DOCX
đề cương kinh tế lượng
PDF
Suy diễn thống kê và ngôn ngữ R (3): Thống kê mô tả
DOCX
đáP án ktvm
PDF
Bai tap-tinh-huong-quan-tri-hoc-co-loi-giai-vieclamvui
PDF
Kinh tế vi mô_Chuong 4 pdf.ppt
PPTX
Tổng quan chung về kinh tế học
PDF
Thống kê ứng dụng Chương 1
PPT
Chương 3 lý thuyết về hành vi của người tiêu dùng
PPTX
Lí thuyết về hành vi của người tiêu dùng
DOC
Bai giang kinh te vĩ mo (2)
DOC
Giáo trình thuế
huong dan giai bai tap kinh te vĩ mô phan 1
Đề tài: Học thuyết kinh tế của John Maynard Keynes và ứng dụng học thuyết kin...
Hồi qui vói biến giả
Tổng cầu và các hàm tổng cầu
BẢNG TRA PHÂN PHỐI CHI-SQUARE
kinh tế vĩ mô - chương 5,6,7
bài tập kinh tế vi mô
Chương 3: Hồi quy bội
đề Cương kinh tế lượng
đề cương kinh tế lượng
Suy diễn thống kê và ngôn ngữ R (3): Thống kê mô tả
đáP án ktvm
Bai tap-tinh-huong-quan-tri-hoc-co-loi-giai-vieclamvui
Kinh tế vi mô_Chuong 4 pdf.ppt
Tổng quan chung về kinh tế học
Thống kê ứng dụng Chương 1
Chương 3 lý thuyết về hành vi của người tiêu dùng
Lí thuyết về hành vi của người tiêu dùng
Bai giang kinh te vĩ mo (2)
Giáo trình thuế
Ad

Similar to Kinh te lương chương 3 (20)

PDF
Econometrics Lecture3 assumptions
PDF
Bài giảng kinh te luong
PPT
BÀI GiẢNG HỌC PHẦN KINH TẾ LƯỢNG HCC.ppt
DOC
De thi-ktl
PDF
Mpp04 521-r1201 v
PDF
Các biến giải thích ngẫu nhiên và phương pháp biến công cụ - Domadar N. Gujar...
PDF
Các biến giải thích ngẫu nhiên và phương pháp biến công cụ - Domadar N. Gujar...
PPTX
chuong2. hoiquyboi_kinhteluongcapnhat.pptx
PPT
On tap kinh te luong co ban
PDF
05 tvu sta301_bai3_v1.00131012140
PDF
Chương 4_ Ước lượng tham số.pdf.........
DOC
Chương 5 & 6 Tương Quan Và Hồi Quy
PDF
Phương trình hồi quy
PDF
kinh tế lượng
PDF
Kinh Te Luong nganh Quan tri kinh doanh (5chap).pdf
PPT
Bai 7 b. hoi quy boi
PDF
Luận văn: Tích phân ngẫu nhiên đối với martingale, HAY, 9đ
PDF
Luận văn: Tích phân ngẫu nhiên đối với Martingale, HOT - Gửi miễn phí qua zal...
PDF
Chương5_ Kiểm định giả thuyết - Phần 1.pdf
PDF
Phát hiện và khắc phục phương sai thay đổi (heteroskedasticity) trên Eview, S...
Econometrics Lecture3 assumptions
Bài giảng kinh te luong
BÀI GiẢNG HỌC PHẦN KINH TẾ LƯỢNG HCC.ppt
De thi-ktl
Mpp04 521-r1201 v
Các biến giải thích ngẫu nhiên và phương pháp biến công cụ - Domadar N. Gujar...
Các biến giải thích ngẫu nhiên và phương pháp biến công cụ - Domadar N. Gujar...
chuong2. hoiquyboi_kinhteluongcapnhat.pptx
On tap kinh te luong co ban
05 tvu sta301_bai3_v1.00131012140
Chương 4_ Ước lượng tham số.pdf.........
Chương 5 & 6 Tương Quan Và Hồi Quy
Phương trình hồi quy
kinh tế lượng
Kinh Te Luong nganh Quan tri kinh doanh (5chap).pdf
Bai 7 b. hoi quy boi
Luận văn: Tích phân ngẫu nhiên đối với martingale, HAY, 9đ
Luận văn: Tích phân ngẫu nhiên đối với Martingale, HOT - Gửi miễn phí qua zal...
Chương5_ Kiểm định giả thuyết - Phần 1.pdf
Phát hiện và khắc phục phương sai thay đổi (heteroskedasticity) trên Eview, S...
Ad

More from hung bonglau (19)

PDF
Anh huong cua may hai che den nang xuat thu hoach che
PDF
Chế độ tiền lương tối thiểu tại việt nam
PDF
DANH SACH CONG TY DUC TAI VIET NAM
PDF
DANH SACH CTY TRONG KCN VISIP I BINH DUONG
PDF
TAI SAO CAC QUOC GIA THAT BAI
PDF
CACH SU DUNG LINKEDIN TRONG KINH DOANH
PDF
Cach su dung facebook trong kinh doanh
PDF
CO BAN VE HIEP DINH GATS
PDF
Kinh te lương chương 4
PDF
Kinh te lương chương 1
PDF
Kinh te lương chương 2
PDF
Kinh te lương chương 5
PDF
Slide dau tu quoc te
PDF
Luat dau tu 2005
PDF
Huong dan thi hanh luat dau tu 2005
PPT
Nguyen ly thong ke 2 (ĐH KTQD)
PPT
Nguyen ly thong ke 1 (ĐH KTQD)
PPT
Mạng Máy tính
PPTX
Ly thuyet quan tri hien dai
Anh huong cua may hai che den nang xuat thu hoach che
Chế độ tiền lương tối thiểu tại việt nam
DANH SACH CONG TY DUC TAI VIET NAM
DANH SACH CTY TRONG KCN VISIP I BINH DUONG
TAI SAO CAC QUOC GIA THAT BAI
CACH SU DUNG LINKEDIN TRONG KINH DOANH
Cach su dung facebook trong kinh doanh
CO BAN VE HIEP DINH GATS
Kinh te lương chương 4
Kinh te lương chương 1
Kinh te lương chương 2
Kinh te lương chương 5
Slide dau tu quoc te
Luat dau tu 2005
Huong dan thi hanh luat dau tu 2005
Nguyen ly thong ke 2 (ĐH KTQD)
Nguyen ly thong ke 1 (ĐH KTQD)
Mạng Máy tính
Ly thuyet quan tri hien dai

Recently uploaded (20)

PDF
TỔNG QUAN KỸ THUẬT CDHA MẠCH MÁU.5.2025.pdf
PDF
CĐHA GAN 1, Benh GAN KHU TRU, 04.2025.pdf
PDF
BÀI TẬP BỔ TRỢ TIẾNG ANH I-LEARN SMART WORLD LỚP 10 BÁM SÁT NỘI DUNG SGK - PH...
DOCX
ĐỀ BÀI ĐÁNH GIÁ GIÁO DỤC GIÁ TRỊ SỐNG VÀ KỸ NĂNG SỐNG
PPTX
Từ và câu NHÓM 4 - LỚP 5 CTST tiểu học.pptx
PPTX
Chương 5 của Tâm lí học - Tâm Lí Học Giáo Dục Đạo Đức
PDF
BÀI GIẢNG CƠ SỞ SINH HỌC NGƯỜI - KHOA SƯ PHẠM KHOA HỌC TỰ NHIÊN ĐẠI HỌC ĐỒNG ...
PDF
GIẢI PHÁP NÂNG CAO CÔNG TÁC CHỦ NHIỆM QUA CÁC TIẾT SINH HOẠT THEO CHỦ ĐỀ NHẰ...
PDF
ki_nang_tu_van_ca_nhan_ve_lua_chon_va_phat_trien_nghe_final_130806_1.pdf
PPTX
Bai 11.1 Tuan hoan mau.cấu tạo và vai trò pptx
PPTX
[123doc] - bai-giang-hoc-phan-hanh-vi-nguoi-tieu-dung-trong-du-lich-consumer-...
DOCX
LUẬN VĂN GROUP ĐỀ BÀI ĐÁNH GIÁ GIAO TIẾP SƯ PHẠM
PDF
f37ac936-c8c6-4642-9bc9-a9383dc18c15.pdf
PDF
CHUYÊN ĐỀ DẠY THÊM HÓA HỌC LỚP 12 CẢ NĂM THEO FORM THI MỚI BGD - CÓ ÔN TẬP + ...
PDF
1001 câu đàm thoại thông dụng nhất.pdf
DOCX
Cao Thuy Linh-San pham cuoi khoa.- bồi dưỡng thường xuyêndocx
PDF
TUYỂN CHỌN ĐỀ ÔN THI OLYMPIC 30 THÁNG 4 HÓA HỌC LỚP 10-11 CÁC NĂM 2006-2021 B...
PDF
TÀI LIỆU DẠY THÊM HÓA HỌC 12 THEO FORM THI MỚI BGD - TẬP 2 - NĂM HỌC 2025-202...
PDF
SÁNG KIẾN THIẾT KẾ MÔ HÌNH HỆ SINH THÁI HƯỚNG NGHIỆP CHO HỌC SINH THPT TRONG ...
PPTX
Chương3,Buổi7,8,9,10(Buổi10 kiểmtraL2).pptx
TỔNG QUAN KỸ THUẬT CDHA MẠCH MÁU.5.2025.pdf
CĐHA GAN 1, Benh GAN KHU TRU, 04.2025.pdf
BÀI TẬP BỔ TRỢ TIẾNG ANH I-LEARN SMART WORLD LỚP 10 BÁM SÁT NỘI DUNG SGK - PH...
ĐỀ BÀI ĐÁNH GIÁ GIÁO DỤC GIÁ TRỊ SỐNG VÀ KỸ NĂNG SỐNG
Từ và câu NHÓM 4 - LỚP 5 CTST tiểu học.pptx
Chương 5 của Tâm lí học - Tâm Lí Học Giáo Dục Đạo Đức
BÀI GIẢNG CƠ SỞ SINH HỌC NGƯỜI - KHOA SƯ PHẠM KHOA HỌC TỰ NHIÊN ĐẠI HỌC ĐỒNG ...
GIẢI PHÁP NÂNG CAO CÔNG TÁC CHỦ NHIỆM QUA CÁC TIẾT SINH HOẠT THEO CHỦ ĐỀ NHẰ...
ki_nang_tu_van_ca_nhan_ve_lua_chon_va_phat_trien_nghe_final_130806_1.pdf
Bai 11.1 Tuan hoan mau.cấu tạo và vai trò pptx
[123doc] - bai-giang-hoc-phan-hanh-vi-nguoi-tieu-dung-trong-du-lich-consumer-...
LUẬN VĂN GROUP ĐỀ BÀI ĐÁNH GIÁ GIAO TIẾP SƯ PHẠM
f37ac936-c8c6-4642-9bc9-a9383dc18c15.pdf
CHUYÊN ĐỀ DẠY THÊM HÓA HỌC LỚP 12 CẢ NĂM THEO FORM THI MỚI BGD - CÓ ÔN TẬP + ...
1001 câu đàm thoại thông dụng nhất.pdf
Cao Thuy Linh-San pham cuoi khoa.- bồi dưỡng thường xuyêndocx
TUYỂN CHỌN ĐỀ ÔN THI OLYMPIC 30 THÁNG 4 HÓA HỌC LỚP 10-11 CÁC NĂM 2006-2021 B...
TÀI LIỆU DẠY THÊM HÓA HỌC 12 THEO FORM THI MỚI BGD - TẬP 2 - NĂM HỌC 2025-202...
SÁNG KIẾN THIẾT KẾ MÔ HÌNH HỆ SINH THÁI HƯỚNG NGHIỆP CHO HỌC SINH THPT TRONG ...
Chương3,Buổi7,8,9,10(Buổi10 kiểmtraL2).pptx

Kinh te lương chương 3

  • 1. Khoa Kinh tế ĐHQG TP.HCM Kinh tế lượng ©2007 CHƯƠNG 3: HỒI QUI ĐƠN BIẾN 3.1 Bản chất thống kê của mô hình hồi quy đơn biến Phương pháp ước lượng LS, về thực chất, chỉ là vẽ một đường hồi quy đi xuyên qua “đám bụi” dữ liệu, sao cho tổng bình phương các phần dư [hay sai số] ESS là nhỏ nhất. Nhưng việc đo lường mang tính thuần túy đại số đó chưa có gì bảo đảm chắc chắn rằng nó sẽ cho ^ ^ ra những ước lượng α , β tốt nhất của các tham số tổng thể α , β theo những tiêu chuẩn xác định về mặt thống kê. Để có thể những đánh giá cụ thể hơn về độ tốt của ước lượng, chúng ta cần xem xét sâu hơn bản chất thống kê của mô hình hồi quy. Để dễ hình dung, chúng ta bắt đầu bằng sự giả định phi thực rằng, quan hệ giữa biến X và Y [chẳng hạn như giữa thu nhập và tiêu dùng] chỉ tuân theo quy luật xác định, và hoàn toàn N không bị chi phối bởi các yếu tố ngẫu nhiên. Khi đó, các quan sát {x n , y n }n =1 sẽ nằm gọn trên một đường thẳng mô tả xu thế thực của tổng thể: Y =α +β ⋅X x x x x x x yn x ˆ β ≡β Không có yếu tố ngẫu nhiên tác động R2 = 1 x 0 xn Đồ thị 3.1a: quy luật xác định giữa X và Y. ^ ^ Khi đó, việc ước lượng trở nên tầm thường, vì ta luôn có α = α , β = β , và R 2 = 1 . Lê Hồng Nhật Trần Thiện Trúc Phượng 1
  • 2. Khoa Kinh tế ĐHQG TP.HCM Kinh tế lượng ©2007 Bây giờ, chúng ta cho phép các yếu tố ngẫu nhiên tác động lên quan hệ giữa X , Y . Như đã N nêu, các nhân tố này khiến cho các quan sát {x n , y n }n =1 bị lệch một cách ngẫu nhiên khỏi đường xu thế tổng thể. Vì vậy, thay vì nhìn thấy một đường xu thẳng tuyến tính như trên hình 3.1a, ta chỉ nhìn thấy một đám bụi dữ liệu bám xung quanh một xu thế nào đó mà ta muốn ước lượng. x x x x x x x x 0 Đồ thị 3.1b: Quan hệ giữa X và Y bị nhiễu bởi các yếu tố ngẫu nhiên N Trên Đồ thị 3.1b, ta thấy các điểm quan sát {x n , y n }n =1 , trước đây nằm trên cùng một đường thẳng trên hình 3.1a, nay bị “thổi bay” lên thành một “đám bụi” dữ liệu, mà việc “chụp ảnh” chúng [tức là đi thu thập dữ liệu], rồi vẽ một đường hồi quy chạy xuyên qua chúng sẽ không nhất thiết là trùng với quy luật tổng thể (mô tả bởi gạch chấm). Điều này ^ gợi ý rằng mỗi ước lượng β chịu sự quy định bởi tham số tổng thể β , nhưng bị lái đi bởi ^ ^ các biến ngẫu nhiên. [Tương tự, ta có thể nói như vậy về α ]. Vì vậy, β cũng là một biến ngẫu nhiên. Vấn đề đặt ra là, về trung bình mà nói [tức là sau rất nhiều lần chụp ảnh các ^ đám bụi dữ liệu], liệu ước lượng β có thể hiện đúng β hay không? Và liệu phương pháp ước lượng bình phương cực tiểu có là hiệu quả nhất hay không? Về mặt toán học, phương pháp bình phương cực tiểu cho ta ước lượng sau: Lê Hồng Nhật Trần Thiện Trúc Phượng 2
  • 3. Khoa Kinh tế ĐHQG TP.HCM Kinh tế lượng ˆ β= S XY = S XX ∑ (x n ©2007 − x )( y n − y ) (3.1) S XX Hay cũng vậy, ˆ β= [điều này là do ∑ ∑ (x n − x )yn (3.2) S XX − ( xn − x ) y = 0 , như đã chỉ ra ở chương 1, phần ôn tập]. n − ( x − x) Trong (3.2), ta đặt c n = n , và nhận xét rằng, tham số đó chỉ phụ thuộc vào các quan S XX N sát {x n }n =1 . Do vậy, nó không chịu ảnh hưởng bởi các yếu tố ngẫu nhiên. Khi đó, công thức (3.2) có thể viết lại như sau: ^ β = ∑n c n y n = ∑n c n [α + β x n + ε n ] = α ∑ cn + β ∑ cn xn + ∑ cnε n Chúng ta có thể dễ dàng chỉ ra rằng, ∑c n n = 0 và ˆ β = β + ∑ cn ε n ∑c n n x n = 1. Và do vậy: (3.3) ˆ ˆ Phương trình (3.3) khẳng định nhận định trước đây về β là đúng: Ước lượng β bị ảnh hưởng bởi các yếu tố ngẫu nhiên ε n , làm giá trị của nó không trùng khít với β tổng thể. ˆ Và vì vậy, β cũng là một biến ngẫu nhiên. ˆ ˆ Chúng ta gọi β là ước lượng không chệch, nếu Eβ = β . Và gọi nó là ước lượng hiệu ^ ˆ quả nhất, nếu sai số ước lượng Varβ = E ( β − β ) 2 là nhỏ nhất trong lớp tất cả các ước lượng tuyến tính, không chệch. Lê Hồng Nhật Trần Thiện Trúc Phượng 3
  • 4. Khoa Kinh tế ĐHQG TP.HCM Kinh tế lượng ©2007 ˆ Để trả lời xem β có phải là ước lượng không chệch và hiệu quả hay không, ta phải xét đến N bản chất thống kê của các quá trình ngẫu nhiên {ε n }n =1 [mà ta đã ví chúng như những “cơn gió”, ngẫu nhiên “thổi bay” các quan sát khỏi đường xu thế xác định của tổng thể]. 3.2 Các yếu tố ngẫu nhiên Chúng ta hãy nêu lên giả định về các quá trình ngẫu nhiên. Hãy nhìn vào đồ thị sau: N Đồ thị 3.2: Quy luật phân phối xác suất của các nhiễu {ε n }n =1 Như đã nhận xét từ các Đồ thị 3.1a và 3.1b, khi không có các tác động ngẫu nhiên, hay N ε n = 0 , các quan sát {x n , y n }n =1 nằm ngay trên đường xu thế của tổng thể. Dưới tác động N của yếu tố ngẫu nhiên, các quan sát {x n , y n }n =1 nằm rải ra, nhưng “bám” xung quanh đường xu thế. Rất hiếm khi có quan sát bị “thổi” mạnh tới nỗi “bay” quá xa so với đường xu thế. Điều đó dẫn đến hai giả thiết sau: Lê Hồng Nhật Trần Thiện Trúc Phượng 4
  • 5. Khoa Kinh tế ĐHQG TP.HCM Kinh tế lượng ©2007 A1 Eε n = 0, với mọi n. [Bụi giữ liệu không thể bay quá xa, mà bám xung quanh đường tổng thể] A2 Varε n = σ 2 , với mọi n. [Độ tán xạ của đám bụi dữ liệu được thể hiện bởi độ lớn của σ 2 ]. Chúng ta cũng coi rằng quy luật tác động của “cơn gió”, tức là phân bố xác suất của yếu tố ngẫu nhiên ε n là như nhau (identical), và theo phân bố chuẩn. Hơn nữa, các yếu tố ngẫu nhiên đó là độc lập (independent). Vì vậy, kết hợp với các giả thiết A1 và A2, ta có: iid A3 ε n ~ N (0, σ 2 ) với mọi n. Cuối cùng, ta coi ta coi x n là xác định trước. Từ giả thiết A1 và dạng mô hình y n = α + βx n + ε n , điều đó bao hàm rằng: A4 E ( y n | x n ) = α + βx n , với mọi n. Hai giả thiết cuối là quan trọng nhất. A3 tóm tắt mọi đặc trưng thống kê của nhiễu ngẫu nhiên, và A4 mô tả xu thế của tổng thể, mà ta ước lượng nó theo phương pháp bình phương cực tiểu. 3.3 Những đặc trưng thống kê của ước lượng bình phương cực tiểu Bây giờ ta có thể nói đến tính tốt của các ước lượng theo các tiêu chuẩn thống kê . ˆ Từ phương trình (3.3), ta đã có: β = β + ∑ cnε n . Bây giờ, hãy áp dụng toán tử kỳ vọng vào hai vế của (3.3): ˆ Eβ = E ( β + ∑ c n ε n ) = β + ∑ c n Eε n =β ˆ [ở đây, ta sử dụng giả thiết A1: Eε n = 0 ].Ta đi đến kết luận rằng, ước lượng β là không chệch: Lê Hồng Nhật Trần Thiện Trúc Phượng 5
  • 6. Khoa Kinh tế ĐHQG TP.HCM Kinh tế lượng ˆ Eβ = β ©2007 (3.4) Tiếp theo, sử dụng công thức: Var ( x) = Var ( x − Ex) [xem chương 1, phần ôn tập], và lưu ý (3.3), (3.4), ta có: ^ ˆ Varβ = Var ( β − β ) = Var (∑ c n ε n ) Sử dụng giả thiết A3 về tính độc lập của các yếu tố ngẫu nhiên, cuối cùng ta nhận được: 2 ˆ Varβ = ∑ c n Varε n 2 = σ 2 ∑ c n , hay ^ Var β = σ2 (3.5) S XX 2 − ⎡ ⎤ ( x n − x) ⎥ S 1 2 (ở đây, ta sử dụng cái điều là ∑ c n = ∑ ⎢ = XX = ) 2 ⎢ S XX ⎥ S XX S XX ⎣ ⎦ Định Lý Gauss - Markov: Phương pháp bình phương cực tiểu có sai số ước lượng, đo ^ lường bởi Var β , là nhỏ nhất trong lớp tất cả các ước lượng tuyến tính và không chệch. Định lý Gauss-Markov là hết sức quan trọng. Nó nêu lên rằng, chúng ta có được những tính chất rất tốt cho ước lượng theo phương pháp bình phương cực tiểu, mà chỉ đòi hỏi có trung bình bằng zero, tính độc lập, và phương sai giống nhau của các yếu tố ngẫu nhiên – tức là giả thiết A3. Chúng ta cũng nên nói thêm là, phương trình (3.5) có một ý nghĩa thực tiễn đáng lưu ý. Nó ^ nói rằng sai số của ước lượng Var β sẽ nhỏ đi, hay hiệu quả ước lượng sẽ tăng lên, nếu độ đa dạng của thông tin quan sát, đo bởi S XX , tăng lên. Điều đó bao hàm rằng, khi làm nghiên cứu, ta không cứ nhất thiết phải tăng rất lớn số quan sát (sample size) N. Nếu giả thiết về tính tuyến tính của đường hồi quy là đúng, thì việc tăng độ đa dạng của thông tin quan sát, 6 Lê Hồng Nhật Trần Thiện Trúc Phượng
  • 7. Khoa Kinh tế ĐHQG TP.HCM Kinh tế lượng ©2007 − hay biên độ giao động của biến giải thích, S XX = ∑n ( x n − x) 2 , sẽ làm cho ước lượng có độ chính xác cao hơn. Hãy xét các ví dụ sau: A x x x x x x x 0 Đồ thị 3.3a: Ước lượng có độ chính xác thấp, do S XX nhỏ. Trên Đồ thị 3.3a, giả sử ta có số quan sát N rất lớn, nhưng với biên độ giao động S XX nhỏ. Khi đó, chỉ cần bỏ đi một quan sát như ứng với điểm A thôi, thì cũng đủ làm các hệ số ước ^ ^ lượng {α , β } thay đổi rất mạnh [từ đường mầu đỏ chuyển sang đường tô mầu da cam]. ^ Điều đó chứng tỏ sai số ước lượng, đo bởi Var β , là lớn. Ta sẽ xét kỹ hơn vấn đề này trong chương 7 về đa cộng tuyến (multicollinearity). A x x x x x x x x x x 0 x Đồ thị 3.3b: Ước lượng có độ chính xác cao hơn, ứng với S XX lớn hơn. Lê Hồng Nhật Trần Thiện Trúc Phượng 7
  • 8. Khoa Kinh tế ĐHQG TP.HCM Kinh tế lượng ©2007 Trên Đồ thị 3.3b, việc loại bỏ đi một vài quan sát, như điểm A, sẽ ít làm thay đổi các hệ số ước lượng. Kết quả ước lượng có độ ổn định cao hơn và chính xác hơn. Tuy nhiên, những nhận xét trên chỉ đúng, khi giả thuyết tuyến tính của đường hồi quy là đúng. Đôi khi, giá trị rất lớn của S XX lại hàm ý rằng giả thuyết tuyến tính là đáng nghi vấn: x x x x x x x x x x x 0 Đồ thị 3.3c: Quy luật tổng thể không phải là tuyến tính (gây nên S XX lớn) Đồ thị 3.3c thể hiện rằng, việc hiểu sai về bản chất kinh tế đã gây nên việc áp dụng sai mô hình hồi quy tuyến tính. Những sai lầm kiểu như vậy dẫn đến yêu cầu phải kiểm định giả thuyết thống kê về tính có ý nghĩa của các tham số của mô hình. Đó là chủ đề của phần 3.4.2 của chương này. Việc sử dụng các dạng hàm khác nhau (functional forms) để mô tả N quy luật chi phối các dữ liệu quan sát {x n , y n }n =1 là một chủ đề khác nữa, mà nó cũng sẽ được đề cập trong chương 6. 3.4 Kiểm định giả thuyết thống kê Để có màu sắc kinh tế, ta hãy xét vấn đề kiểm định thông qua một ví dụ cụ thể. Ví dụ 3.5: Một công ty bảo hiểm ở Mỹ muốn kinh doanh bảo hiểm nhân thọ. Họ tiến hành nghiên cứu tiềm năng của thị trường sở tại. Lý luận kinh tế đã chỉ ra rằng, yêu cầu về mua bảo hiểm tăng lên cùng với khả năng xẩy ra rủi ro, với quy mô về tổn thất tài chính khi rủi ro xẩy ra, và với tâm lý ngại rủi ro của cá nhân. Họ nhận định rằng, gia đình càng giầu có nhờ kinh doanh, thì người chủ gia đình càng chịu nhiều stress. Tức là, những người lệ thuộc càng ngại rủi ro gây nên bởi stress cho người chủ gia đình, hơn là tại những gia đình có thu Lê Hồng Nhật Trần Thiện Trúc Phượng 8
  • 9. Khoa Kinh tế ĐHQG TP.HCM Kinh tế lượng ©2007 nhập thấp, ít tham dự vào kinh doanh. Vì vậy, ban nghiên cứu thị trường của công ty bảo hiểm này đề xuất mô hình sau: INS = α + βINC Trong đó, INS là giá trị hợp đồng bảo hiểm, được trả cho bên mua bảo hiểm, nếu xẩy ra rủi ro. Và INC là thu nhập. Cả hai biến lượng đều tính bằng nghìn dollars. Dữ liệu điều tra và kết quả ước lượng được ghi lại trong các bảng dưới đây obs 1 2 3 4 5 6 7 8 9 10 INSUR 90 165 220 145 114 175 145 192 395 339 INC 25 40 60 30 29 41 37 46 105 81 obs 11 12 13 14 15 16 17 18 19 20 INSUR 230 262 570 100 210 243 335 299 305 205 INC 57 72 140 23 55 58 87 72 80 48 Bảng 3.1: Số liệu điều tra về nhu cầu mua bảo hiểm Lê Hồng Nhật Trần Thiện Trúc Phượng 9
  • 10. Khoa Kinh tế ĐHQG TP.HCM Kinh tế lượng ©2007 INSUR vs. INC 600 500 INSUR 400 300 200 100 0 20 40 60 80 100 120 140 160 INC Đồ thị 3.4: Nhu cầu mua bảo hiểm Sử dụng eviews, chúng ta nhận được kết quả hồi quy dưới đây: Dependent Variable: INSUR Method: Least Squares Date: 04/21/07 Time: 21:41 Sample: 1 20 Included observations: 20 Variable Coefficient Std. Error t-Statistic Prob. C INC 6.854991 3.880186 7.383473 0.112125 0.928424 34.60601 0.3655 0.0000 R-squared Adjusted R-squared S.E. of regression Sum squared resid Log likelihood Durbin-Watson stat Lê Hồng Nhật Trần Thiện Trúc Phượng 0.985192 0.984370 14.35730 3710.375 -80.61033 3.175965 Mean dependent var S.D. dependent var Akaike info criterion Schwarz criterion F-statistic Prob(F-statistic) 236.9500 114.8383 8.261033 8.360606 1197.576 0.000000 10
  • 11. Khoa Kinh tế ĐHQG TP.HCM Kinh tế lượng ©2007 Bảng 3.2: Kết quả ước lượng các tham số của mô hình Kết quả ước lượng được tóm tắt lại như sau: INS = 6.85 + 3.88 INC (3.6) (7.38) (0.11) N = 20, R 2 = 0.98, ESS = 3710 Vấn đề tiếp theo của các nhà hoạch định chiến lược của công ty là liệu họ có thể nói gì về sức mua bảo hiểm tương ứng với từng lớp thu nhập. Điều đó sẽ giúp cho công ty ra quyết định kinh doanh. Ví dụ, nếu thu nhập gia đình tăng thêm một ngàn dollars, thì chi cho bảo hiểm sẽ tăng lên trong khỏang từ 3 ngàn tới 5 ngàn dollars với độ tin cậy là bao nhiêu? Nghĩa là công ty cần xác định được khoảng tin cậy của β tổng thể. 3.4.1 Khoảng tin cậy ˆ ˆ Chúng ta sẽ sử dụng các đặc trưng thống kê của ước lượng α , β để đánh giá về các tính chất của tham số thực (tổng thể) α , β . ˆ Từ quan hệ (3.3), β = β + ∑ cnε n , và giả thuyết A3 về tính phân bố chuẩn của các yếu tố ˆ ngẫu nhiên ε , ta đã biết rằng β có phân bố chuẩn. Hơn thế nữa, từ các đánh giá về trung n ˆ bình và phương sai của β , ghi trong phương trình (3.4) và (3.5), ta có thể viết lại ˆ σ2 β −β ˆ rằng: β ~ N ( β , ) . Điều đó có nghĩa là, sau khi chuẩn hóa, Z = ~ N (0,1) . S XX σ 2 S XX Để công thức này có ý nghĩa ứng dụng, ta thay thế σ 2 , bởi ức lượng không trệch của nó là 1 1 s2 = ∑n en2 = N − 2 ESS . Khi đó, thống kê Z chuyển thành thống kê N −2 ^ ˆ β −β β− β t= = ~ t ( N − 2) . Đồ thị phân bố của thống kê t , trông rất tương tự như ^ s 2 S XX se( β ) thống kê Z: Lê Hồng Nhật Trần Thiện Trúc Phượng 11
  • 12. Khoa Kinh tế ĐHQG TP.HCM Kinh tế lượng ©2007 ^ Đồ thị 3.5: Phân bố t = β− β ^ se( β ) ~ t ( N − 2) Như đã chỉ ra trên Đồ thị 3.5, khoảng tin cậy (Confidence interval) (1 − λ ) % của thống kê ^ t= β− β ^ se( β ) là vùng mà t sẽ rơi vào khoảng đó với xác suất là (1 − λ ) . Tức là: ^ Pr ob{−t λ ( N − 2) ≤ 2 β− β ^ se( β ) ≤ t λ ( N − 2)} = (1 − λ ) . 2 Nói khác đi, ta có: ^ ^ β ∈ {β ± se( β )t λ ( N − 2)} 2 với độ tin cậy (1 − λ ) % ^ (3.7) ^ Chẳng hạn, trong ví dụ về công ty bảo hiểm (3.6), ta có: β = 3.88 ; se( β ) = 0.112 . Lưu ý rằng t 0.025 [18] = 2.101 , độ tin cậy 95% của β tổng thể là: β ∈ {3.88 ± 0.112 × 2.101} (3.8) 3.4.2 Kiểm định giả thuyết thống kê Thông thường, kết quả ước lượng mô hình (3.6) và đánh giá độ tin cậy (3.8) sẽ được đính kèm trong bản báo cáo đưa lên cho ban giám đốc công ty để ra quyết định về chiến lược kinh doanh. Tuy nhiên, công việc nghiên cứu thị trường không chỉ dừng lại tại đó. Chúng ta Lê Hồng Nhật Trần Thiện Trúc Phượng 12
  • 13. Khoa Kinh tế ĐHQG TP.HCM Kinh tế lượng ©2007 tiếp tục ví dụ bảo hiểm bằng việc nói rằng, ban giám đốc công ty họp để đánh giá bản báo cáo này. Sau đây là những ghi chép được từ cuộc họp: Nhà quản lý M1 nói rằng, theo kinh nghiệm của ông, thu nhập đã được thể chế hóa qua các tài sản tài chính, như cổ phiếu, địa ốc, vân vân. Và ảnh hưởng của thu nhập bằng tiền mặt tới chi tiêu cho bảo hiểm nhân thọ là rất yếu. Thành viên khác của ban giám đốc, nhà quản lý M2 lại cho rằng, thu nhập bằng tiền có ảnh hưởng rất mạnh tới nhu cầu mua bảo hiểm nhân thọ. Kinh nghiệm làm ăn của ông cho thấy, cứ 1000 dollars tăng thêm về thu nhập sẽ kéo theo giá trị gói bảo hiểm mua bởi hộ gia đình tăng lên 5000 dollars. Cuối cùng, ông M3 nêu lại rằng, thu nhập bằng tiền đúng là có ảnh hưởng, nhưng không mạnh tới như vậy. Cứ 1000 dollars tăng thêm về thu nhập chỉ kéo theo nhu cầu về bảo hiểm tăng lên 4000 dollars. Vậy ai trong số họ là đúng? Và nếu nhận định của nhà quản lý M1 đúng, thì thật là rất đáng tiếc. Vì vậy, chúng ta cần tiến hành kiểm định lại những nhận định này. Một cách tổng quát, ta tiến hành kiểm định giả thiết thống kê như sau: H 0 : β = β 0 .vs. H 1 : β ≠ β 0 Ví dụ, theo nhận định của nhà quản lý công ty M1, ta có: H 0 : β = 0 .vs. H 1 : β ≠ 0 Logic chung của vấn đề kiểm định giả thuyết là như sau: Nếu như nhận định của anh là đúng, thì nó phải phù hợp với phần lớn trường hợp quan sát thấy trên thực tế. Tức là, giá trị ^ thống kê t 0 = β − β0 ^ phải rơi vào khoảng tin cậy, chẳng hạn là 95%. Trong trường hợp đó, se( β ) ta không bác bỏ giả thuyết H 0 (hay ký hiệu bằng tiếng Anh: DNRH 0 ) . Nếu giá trị ^ t0 = β − β0 ^ nằm ngoài khoảng tin cậy, tức là rơi vào vùng hiếm quan sát thấy trên thực tế, se( β ) khi đó ta bác bỏ H 0 (hay ký hiệu là RH 0 ). Lê Hồng Nhật Trần Thiện Trúc Phượng 13
  • 14. Khoa Kinh tế ĐHQG TP.HCM Kinh tế lượng ©2007 Đồ thị 3.6: Vùng chấp nhận và bác bỏ H 0 ^ Đồ thị 3.6 thể hiện rằng, chúng ta sẽ bác bỏ ( RH 0 ), nếu | t 0 |= β− β ^ se( β ) ≥ t λ ( N − 2) , và 2 ^ chúng ta sẽ không bác bỏ ( DNRH 0 ), nếu β− β ^ se( β ) ≤ t λ ( N − 2) . 2 Trong ví dụ nêu trên, đối với nhận định của nhà quản lý M1, ta tiến hành kiểm định như sau: | t 0 |= 3.88 = 34.6 ≥ 2.01 = t 0.025 [18] 0.112 Như vậy, dựa trên kết quả kiểm định, ta có thể bác bỏ mạnh mẽ giả định của nhà quản lý M1. Bây giờ chúng ta hãy thử tự kiểm định xem nhận định của các nhà quản lý M2 và M3 có đúng không. Cuối cùng, để cho tiện sử dụng, trong các software ứng dụng như eviews, người ta thường cho biết giá trị p-value, được định nghĩa như sau: P − value = Pr ob{| t ( N − 2) |≥| t 0 |) Lê Hồng Nhật Trần Thiện Trúc Phượng 14
  • 15. Khoa Kinh tế ĐHQG TP.HCM Kinh tế lượng ©2007 Đồ thị 3.7: biểu diễn của p-value Vì vậy, chúng ta sẽ bác bỏ giả thuyết ( RH 0 ), nếu: p − value ≤ λ , [như chỉ ra trên đồ thị 3.7]. Và chúng ta sẽ không bác bỏ giả thuyết đó ( DNRH 0 ) , nếu p − value ≥ λ . Lê Hồng Nhật Trần Thiện Trúc Phượng 15