So sánh trung bình hai mẫu độc lập stata

QEÃF ÏBE NỦ LKỈY đệFE LƪợFD ‒QEÃF ÏBE QEƪơFD RMK (MFJXM)

So sánh trung bình hai mẫu độc lập stata

@ek sữ nứfd `kỂo ĝỀfe t ĝờk vỐk emk oẠu ĝớb lắp, trƱởfd eỢp ckẺf peãf lỏmk bò 2 feòo, be÷fd tm bò teỂ teỽb ekỄf 2 bẴp sj sífe (=-3,=-2,3-2). FẺu ckẺf peãf lỏmk bò > feòo, be÷fd tm bò teỂ peẢk teỽb ekỄf 8 bẴp sj sífe (=-3,=-2,=->,3-2,3->,2->). ^rjfd feỪfd trƱởfd eỢp feƱ vắy, be÷fd tm bò teỂ sữ nứfd peãf tïbe peƱƭfd smk (

Mfmlysks Jh Xmrkmfbi

-MFJXM)

@EÍK FKỈO XÁ XẬF NỮFD

So sánh trung bình hai mẫu độc lập stata

Xïnứ7 Rờ lƱỢfdtkỂubẤudkẢofekọutrjfdcỄfeRờtxuẩteuyẺt(RUE), dkẢotrufdcìfetrjfdRờtnifdui (RN) vádkẢoïttrjfdFekỉoskçuvk `eíb(FRX). UëtfdekỄotkỂubẤu\=1 cỄfefeãfbej oỔkfeòo. @ẺtquẢĝƱỢbdekfeắftrjfdcẢfdsmu. EỊkbòsỽ`eíbckỄttrỀ sờ ^B dkỪm2 feòocỄfe:

ÒO Lß ^EY[Ặ QEÃF ^ÏBE QEƪơFD RMK

So sánh trung bình hai mẫu độc lập stata

Như bạn thấy trong kết quả ở trên, xe trong nước có mpg thấp hơn đáng kể (19,8) so với xe nước ngoài (24,7). Nghĩa là xe trong nước chạy hau xăng hơn xe nước ngoài nhập khẩu.

Kiểm định chi bình phương Chi-square stata

Hãy so sánh xếp hạng sửa chữa (rep78) của ô tô nước ngoài và ô tô trong nước. Chúng ta có thể làm một bảng chéo crosstab của rep78 và foreign. Chúng ta có thể muốn hỏi liệu các biến này có độc lập hay không. Chúng ta có thể sử dụng tùy chọn chi2 để yêu cầu một kiểm định chi-bình phương về tính độc lập giữa hai biến đồng thời thể hiện bảng chéo crosstab tabulate rep78 foreign, chi2

So sánh trung bình hai mẫu độc lập stata

Pearson chi2(4) = 27.2640 Pr = 0.000 Giá trị Pr =0.000 chứng tỏ có mối quan hệ giữa rep78 và foreign. Nghĩa là 2 biến này không độc lập. Chi-square không thực sự hợp lệ khi bạn có các ô trống. Trong những trường hợp như vậy khi bạn có các ô trống hoặc các ô có tần số nhỏ, bạn có thể yêu cầu kiểm định “Fisher’s exact test” với tùy chọn exact. tabulate rep78 foreign, chi2 exact

So sánh trung bình hai mẫu độc lập stata
Do kết quả Fisher's exact = 0.000, nên ta vẫn kết luận có mối quan hệ giữa hai giá trị biến này nhé.

Tương quan correlation

Chúng ta có thể sử dụng lệnh tương quan correlation để lấy tương quan giữa các biến. Hãy xem xét mối tương quan giữa price mpg weight và rep78. (Sử dụng rep78 trong mối tương quan mặc dù nó không liên tục, nghĩa là số liệu bị thiếu missing value, để minh họa điều gì sẽ xảy ra khi ta sử dụng mối tương quan với các biến có dữ liệu bị thiếu.) correlate price mpg weight rep78

So sánh trung bình hai mẫu độc lập stata

Lưu ý rằng kết quả ở trên đã nói (số quan sát obs = 69). Lệnh tương quan xóa drop dữ liệu theo nguyên tắt listwise, có nghĩa là nếu bất kỳ biến nào bị thiếu dữ liệu ở dòng quan sát đó, thì toàn bộ quan sát ở dòng đó sẽ bị bỏ qua khỏi phân tích tương quan. Chúng ta có thể sử dụng pwcorr (tương quan theo từng cặp pairwise correlations) nếu chúng ta muốn có được các tương quan xóa dữ liệu bị thiếu trên cơ sở từng cặp pairwise thay vì cơ sở theo danh sách listwise. Nói đơn giản, vì tương quan là xét mối quan hệ giữa hai biến, nếu hai biến đó có đầy đủ số liệu không bị thiếu thì đưa tấ cả các quan sát vào để chạy tương quan, bất chấp 1 biến khác bị thiếu. Chúng ta sẽ sử dụng tùy chọn obs để hiển thị số lượng quan sát được sử dụng để tính toán mỗi mối tương quan. pwcorr price mpg weight rep78, obs

So sánh trung bình hai mẫu độc lập stata
Lưu ý rằng các tương quan liên quan đến rep78 có số lượng quan sát N là 69 so với các tương quan khác có N là 74. Điều này là do rep78 có 5 giá trị bị thiếu, vì vậy nó chỉ có 69 quan sát hợp lệ, nhưng các biến khác không có dữ liệu bị thiếu nên đã có 74 quan sát hợp lệ.

Hồi Quy

Hãy xem xét thực hiện phân tích hồi quy trong Stata. Đối với ví dụ này, hãy loại bỏ các trường hợp mà rep78 là 1 hoặc 2 hoặc bị thiếu.