Giáo trình Lý Thuyết Thống Kê Phần 2 (PGS.TS Trần Thị Kim Thu)

Giáo trình Lý thuyết Thống kê phần 2, PGS.TS. Trần Thị Kim Thu chủ biên. Tài liệu chuyên sâu về thống kê, phù hợp cho sinh viên và nhà nghiên cứu.

Chuyên ngành

Lý thuyết thống kê

Người đăng

Ẩn danh

Thể loại

Giáo trình
358
1
0

Phí lưu trữ

75 Point

Tóm tắt

I. Hướng dẫn học tốt giáo trình lý thuyết thống kê phần 2 Kim Thu

Giáo trình lý thuyết thống kê phần 2 do PGS.TS Trần Thị Kim Thu chủ biên là một tài liệu học thuật quan trọng, được biên soạn chuyên sâu cho sinh viên khối ngành kinh tế và quản trị kinh doanh. Đây là phần tiếp nối, nâng cao kiến thức từ tập 1, tập trung vào các phương pháp suy luận thống kê phức tạp, nền tảng cho các môn học như kinh tế lượng và phân tích dữ liệu. Cuốn sách này không chỉ là một giáo trình đại học kinh tế quốc dân tiêu chuẩn mà còn là nguồn tài liệu tham khảo giá trị cho các nhà nghiên cứu, chuyên viên phân tích dữ liệu. Nội dung sách được hệ thống hóa một cách khoa học, đi từ lý thuyết nền tảng đến các ví dụ ứng dụng thực tiễn, giúp người học nắm vững bản chất của các công cụ thống kê. Điểm nổi bật của giáo trình là sự kết hợp chặt chẽ giữa lý thuyết thống kê kinh tế xã hội và các bài toán ứng dụng, giúp sinh viên không chỉ hiểu công thức mà còn biết cách vận dụng vào giải quyết vấn đề thực tế. Các chương mục được trình bày rõ ràng, logic, đặc biệt là các phần về ước lượng tham sốkiểm định giả thuyết thống kê, được xem là xương sống của thống kê suy luận. Sách cung cấp hệ thống bài tập lý thuyết thống kê có lời giải chi tiết, là công cụ hữu ích cho việc ôn tập thống kê và chuẩn bị cho các kỳ thi. Việc nắm vững kiến thức trong cuốn giáo trình này là chìa khóa để chinh phục các học phần chuyên ngành và xây dựng nền tảng vững chắc cho sự nghiệp sau này. Tài liệu do Nhà xuất bản Thống kê phát hành, đảm bảo tính chính xác và uy tín học thuật.

1.1. Vai trò của PGS.TS Trần Thị Kim Thu và giáo trình cốt lõi

PGS.TS Trần Thị Kim Thu là một chuyên gia hàng đầu trong lĩnh vực thống kê tại Việt Nam. Với kinh nghiệm giảng dạy và nghiên cứu sâu rộng, bà đã biên soạn cuốn sách pgs ts trần thị kim thu này với mục tiêu cung cấp một tài liệu chuẩn mực, cập nhật và dễ tiếp cận. Giáo trình đóng vai trò là kim chỉ nam, dẫn dắt người học qua những khái niệm phức tạp của thống kê suy luận. Sách không chỉ dừng lại ở việc trình bày công thức, mà còn giải thích cặn kẽ bối cảnh áp dụng, các giả định cần tuân thủ và cách diễn giải kết quả. Vai trò của giáo trình không chỉ gói gọn trong phạm vi một môn học, mà còn là cầu nối kiến thức tới các lĩnh vực ứng dụng như tài chính, marketing, quản trị nhân sự, nơi mà việc ra quyết định dựa trên dữ liệu ngày càng trở nên quan trọng. Đây là tài liệu không thể thiếu để xây dựng tư duy phân tích định lượng một cách bài bản.

1.2. Cấu trúc và nội dung chính trong lý thuyết thống kê phần 2

Giáo trình lý thuyết thống kê phần 2 được cấu trúc thành các chương logic, bao quát các chủ đề nâng cao. Các nội dung chính bao gồm: ước lượng tham số (ước lượng điểm và ước lượng khoảng), kiểm định giả thuyết thống kê cho một và nhiều tổng thể, phân tích phương sai ANOVA, phân tích hồi quy và tương quan, và kiểm định phi tham số. Mỗi chương đều bắt đầu bằng việc giới thiệu khái niệm, tiếp theo là các công thức, tiêu chuẩn kiểm định, và cuối cùng là các ví dụ minh họa cụ thể. Cấu trúc này giúp người học tiếp cận kiến thức một cách có hệ thống, từ đơn giản đến phức tạp. Đặc biệt, các phần về kiểm định phi tham số như Wilcoxon, Kruskal-Wallis, Friedman được trình bày chi tiết, giải quyết bài toán khi dữ liệu không tuân theo phân phối chuẩn, một vấn đề thường gặp trong thực tế.

II. Thách thức khi học thống kê nâng cao và giải pháp từ sách

Việc tiếp cận kiến thức thống kê nâng cao đặt ra không ít thách thức cho người học. Một trong những khó khăn lớn nhất là việc phải nắm vững các giả định đằng sau mỗi phương pháp kiểm định. Ví dụ, nhiều kiểm định tham số yêu cầu dữ liệu phải có phân phối chuẩn, nhưng trong thực tế, điều kiện này thường bị vi phạm. Giáo trình của PGS.TS Trần Thị Kim Thu đã giải quyết triệt để vấn đề này bằng cách dành riêng một chương lớn về các kiểm định phi tham số. Theo tài liệu gốc, "Kiểm định phi tham số cũng được dùng để kiểm định dữ liệu định lượng nhưng yêu cầu về phân phối chuẩn bị vi phạm." Đây là một giải pháp quan trọng, cung cấp công cụ thay thế mạnh mẽ khi các phương pháp truyền thống không còn phù hợp. Một thách thức khác là sự phức tạp của các công thức và quy trình tính toán. Để vượt qua, cuốn sách cung cấp hệ thống ví dụ và bài tập lý thuyết thống kê có lời giải được trình bày từng bước, giúp người học rèn luyện kỹ năng áp dụng. Việc ôn luyện qua các slide bài giảng lý thuyết thống kê và giải các dạng đề thi lý thuyết thống kê cũ sẽ giúp củng cố kiến thức và làm quen với áp lực thời gian. Cuốn sách không chỉ là nguồn lý thuyết mà còn là cẩm nang thực hành, giúp người học tự tin đối mặt và vượt qua các rào cản trong quá trình chinh phục môn học này.

2.1. Khó khăn khi giả định về xác suất thống kê không thỏa mãn

Một trong những trở ngại phổ biến nhất trong phân tích dữ liệu thực tế là giả định về phân phối chuẩn của tổng thể không được đáp ứng. Các phương pháp xác suất thống kê cổ điển thường dựa trên giả định này. Khi dữ liệu bị lệch hoặc có các giá trị ngoại lai, việc áp dụng các kiểm định t hoặc phân tích phương sai ANOVA có thể dẫn đến kết luận sai lầm. Tài liệu gốc chỉ rõ: "Khi dữ liệu là định tính với thang đo thứ bậc, giá trị trung bình không còn phù hợp để so sánh... Lúc này chúng ta sẽ so sánh các tổng thể với nhau mà không sử dụng một tham số cụ thể nào cả." Giáo trình cung cấp một bộ công cụ kiểm định phi tham số mạnh mẽ để xử lý các tình huống này, giúp đảm bảo tính chính xác và tin cậy của kết quả phân tích, ngay cả khi các điều kiện lý tưởng không được thỏa mãn.

2.2. Phương pháp tiếp cận bài tập và đề thi lý thuyết thống kê

Để làm tốt các bài tập lý thuyết thống kê có lời giải và đạt điểm cao trong các kỳ thi, người học cần có một chiến lược rõ ràng. Thay vì học thuộc lòng công thức, cần tập trung vào việc hiểu bản chất và điều kiện áp dụng của từng phương pháp. Hãy bắt đầu bằng việc tóm tắt lý thuyết thống kê mỗi chương, sau đó thực hành với các ví dụ trong sách. Khi gặp một bài toán, bước đầu tiên là xác định loại dữ liệu (định lượng, định tính), số lượng mẫu (một, hai, hay nhiều hơn), và mối quan hệ giữa các mẫu (độc lập hay tương đồng từng cặp). Việc xác định đúng phương pháp kiểm định cần sử dụng là yếu tố quyết định. Luyện tập thường xuyên với các dạng đề thi lý thuyết thống kê sẽ giúp nhận diện nhanh các yêu cầu và áp dụng công thức một cách chính xác.

III. Phương pháp so sánh hai tổng thể với kiểm định phi tham số

Khi so sánh hai tổng thể mà dữ liệu không tuân theo phân phối chuẩn hoặc ở dạng thang đo thứ bậc, các kiểm định phi tham số là công cụ không thể thiếu. Giáo trình lý thuyết thống kê phần 2 trình bày rất chi tiết các phương pháp này. Đối với hai mẫu độc lập, kiểm định tổng hạng Wilcoxon (còn gọi là kiểm định Mann-Whitney U) là một giải pháp hiệu quả. Theo tài liệu, phương pháp này được áp dụng khi "Mục đích nghiên cứu nhằm so sánh hai tổng thể" và "Hai mẫu độc lập". Giả thuyết của kiểm định này tập trung vào vị trí của hai tổng thể thay vì trung bình. Cụ thể, giả thuyết H₀ là "Vị trí của hai tổng thể là như nhau". Quy trình thực hiện bao gồm việc xếp hạng chung cho tất cả các quan sát trong hai mẫu, sau đó tính tổng hạng cho từng mẫu và so sánh với giá trị tới hạn. Đối với hai mẫu tương đồng từng cặp (ví dụ: đo lường trước và sau một can thiệp), giáo trình giới thiệu kiểm định dấukiểm định tổng hạng có dấu Wilcoxon. Kiểm định dấu được sử dụng cho dữ liệu định tính với thang đo thứ bậc, chỉ quan tâm đến dấu của chênh lệch (+ hoặc -). Trong khi đó, kiểm định tổng hạng có dấu Wilcoxon áp dụng cho dữ liệu định lượng, xét đến cả dấu và độ lớn của chênh lệch, mang lại một kiểm định mạnh hơn. Việc hiểu rõ phạm vi áp dụng của từng kiểm định là cực kỳ quan trọng để lựa chọn đúng công cụ phân tích.

3.1. Kỹ thuật kiểm định tổng hạng Wilcoxon cho hai mẫu độc lập

Kiểm định tổng hạng Wilcoxon là phương pháp thay thế cho kiểm định t-test khi so sánh hai mẫu độc lập mà giả định phân phối chuẩn bị vi phạm. Nguyên tắc cốt lõi là chuyển đổi các giá trị dữ liệu thành các thứ hạng. Tài liệu gốc hướng dẫn: "đầu tiên chúng ta cần xếp hạng chung cho tất cả các đơn vị trong các mẫu. Nguyên tắc xếp hạng là cho hạng của giá trị nhỏ nhất bằng 1...". Sau khi xếp hạng, tổng hạng của một trong hai mẫu (thường là mẫu có kích thước nhỏ hơn) được dùng làm tiêu chuẩn kiểm định. Giá trị này sau đó được so sánh với các giá trị tới hạn từ bảng phân phối Wilcoxon (đối với mẫu nhỏ) hoặc được chuẩn hóa về phân phối xấp xỉ chuẩn (đối với mẫu lớn) để đưa ra kết luận thống kê về sự khác biệt vị trí giữa hai tổng thể.

3.2. Áp dụng kiểm định dấu và kiểm định tổng hạng có dấu Wilcoxon

Khi dữ liệu được thu thập theo cặp (mẫu tương đồng), kiểm định dấukiểm định tổng hạng có dấu Wilcoxon là các lựa chọn phù hợp. Kiểm định dấu là phương pháp đơn giản nhất, chỉ dựa trên việc đếm số lượng chênh lệch dương và chênh lệch âm giữa các cặp quan sát. Nó đặc biệt hữu ích cho dữ liệu định tính thứ bậc. Kiểm định tổng hạng có dấu Wilcoxon là một bước tiến xa hơn, áp dụng cho dữ liệu định lượng. Phương pháp này không chỉ xem xét dấu của chênh lệch mà còn xếp hạng cho độ lớn của các chênh lệch đó. Bằng cách tính tổng hạng của các chênh lệch dương (hoặc âm), nó cung cấp một tiêu chuẩn kiểm định mạnh hơn để phát hiện sự khác biệt giữa hai tổng thể.

IV. Bí quyết phân tích nhiều tổng thể bằng Kruskal Wallis Friedman

Trong nhiều nghiên cứu, nhu cầu không chỉ dừng lại ở việc so sánh hai nhóm mà cần phải phân tích sự khác biệt giữa ba hay nhiều nhóm. Giáo trình lý thuyết thống kê phần 2 cung cấp hai công cụ phi tham số mạnh mẽ cho mục đích này: kiểm định Kruskal-Walliskiểm định Friedman. Kiểm định Kruskal-Wallis được coi là phiên bản phi tham số của phân tích phương sai ANOVA một yếu tố, sử dụng cho các mẫu độc lập. Theo tài liệu gốc, kiểm định này được áp dụng khi "Mục đích nghiên cứu nhằm so sánh hai hoặc nhiều tổng thể" và "Các mẫu độc lập". Giả thuyết H₀ của kiểm định này là "Vị trí của k tổng thể là như nhau". Tương tự kiểm định Wilcoxon, phương pháp này cũng dựa trên việc xếp hạng chung cho tất cả các quan sát từ các nhóm, sau đó tính toán một tiêu chuẩn kiểm định H có phân phối xấp xỉ Khi-bình phương. Nếu giá trị H đủ lớn, giả thuyết H₀ sẽ bị bác bỏ, cho thấy có ít nhất hai tổng thể có vị trí khác nhau. Trong khi đó, kiểm định Friedman là giải pháp cho trường hợp các mẫu tương đồng từng nhóm (phiên bản mở rộng của mẫu cặp). Đây là phương pháp thay thế cho ANOVA hai yếu tố không lặp. Kiểm định này xếp hạng các quan sát trong từng khối (nhóm tương đồng) thay vì xếp hạng chung, giúp loại bỏ sự biến thiên giữa các khối và tập trung vào sự khác biệt giữa các nhóm xử lý.

4.1. So sánh các nhóm độc lập qua kiểm định Kruskal Wallis

Kiểm định Kruskal-Wallis là một công cụ thiết yếu khi cần so sánh từ ba nhóm độc lập trở lên mà dữ liệu không đáp ứng giả định của ANOVA. Quy trình thực hiện bắt đầu bằng việc gộp tất cả dữ liệu từ các nhóm và xếp hạng chúng từ nhỏ nhất đến lớn nhất. Sau đó, tính tổng hạng cho từng nhóm. Tiêu chuẩn kiểm định H được tính dựa trên tổng hạng của các nhóm và kích thước mẫu. Giá trị H lớn cho thấy sự khác biệt đáng kể về tổng hạng giữa các nhóm, dẫn đến việc bác bỏ giả thuyết rằng tất cả các tổng thể đều có cùng một vị trí trung tâm. Đây là một phương pháp linh hoạt và mạnh mẽ trong lý thuyết thống kê kinh tế xã hội.

4.2. Xử lý dữ liệu mẫu tương đồng từng nhóm với kiểm định Friedman

Khi các quan sát được nhóm lại thành các khối tương đồng (ví dụ, nhiều chuyên gia cùng đánh giá nhiều sản phẩm), kiểm định Friedman được sử dụng để phát hiện sự khác biệt giữa các nhóm xử lý. Khác với Kruskal-Wallis, việc xếp hạng được thực hiện riêng trong từng khối. Chẳng hạn, trong mỗi khối, quan sát nhỏ nhất được xếp hạng 1, tiếp theo là 2, và cứ thế. Tiêu chuẩn kiểm định Friedman (Fr) được tính toán dựa trên tổng hạng của từng nhóm xử lý. Phương pháp này rất hiệu quả trong việc kiểm soát các yếu tố gây nhiễu liên quan đến sự khác biệt giữa các khối, giúp tăng độ chính xác khi so sánh hiệu quả của các xử lý.

V. Ứng dụng phân tích hồi quy và tương quan hạng Spearman

Ngoài việc so sánh các tổng thể, việc xác định và đo lường mối liên hệ giữa các biến là một nhiệm vụ cốt lõi của thống kê. Giáo trình lý thuyết thống kê phần 2 dành một phần quan trọng để trình bày về phân tích hồi quy và tương quan, đặc biệt là các phương pháp phi tham số. Khi mối quan hệ giữa hai biến không phải là tuyến tính hoặc khi dữ liệu ở dạng thứ bậc, hệ số tương quan Pearson không còn phù hợp. Lúc này, kiểm định tương quan hạng Spearman trở thành một công cụ thay thế lý tưởng. Theo tài liệu, phương pháp này được dùng khi "một trong hai biến là tiêu thức thuộc tính với thang đo thứ bậc, hoặc các biến là tiêu thức số lượng nhưng không thỏa mãn điều kiện phân phối chuẩn". Hệ số tương quan hạng Spearman (rs) đo lường mức độ mạnh và chiều hướng của mối liên hệ đơn điệu (monotonic) giữa hai biến. Quy trình tính toán bao gồm việc xếp hạng riêng cho từng biến, sau đó tính toán hệ số tương quan dựa trên sự chênh lệch thứ hạng giữa các cặp quan sát. Giá trị rs nằm trong khoảng từ -1 đến +1, tương tự như hệ số Pearson, giúp diễn giải kết quả một cách trực quan. Phương pháp này là nền tảng quan trọng cho các phân tích sâu hơn trong kinh tế lượng và khoa học xã hội.

5.1. Đo lường mối liên hệ bằng kiểm định tương quan hạng Spearman

Kiểm định tương quan hạng Spearman cung cấp một thước đo mạnh mẽ về mối liên hệ khi các giả định của tương quan Pearson bị vi phạm. Bằng cách chuyển đổi dữ liệu thô sang dạng thứ hạng, phương pháp này giảm thiểu ảnh hưởng của các giá trị ngoại lai và không yêu cầu mối quan hệ phải tuyến tính. Sau khi tính được hệ số tương quan hạng Spearman từ mẫu (rs), bước tiếp theo là thực hiện kiểm định giả thuyết thống kê để xem liệu mối liên hệ này có ý nghĩa trong tổng thể hay không (tức là ρs có khác 0 không). Giáo trình cung cấp các công thức và bảng tra cần thiết để thực hiện kiểm định này cho cả mẫu nhỏ và mẫu lớn, giúp nhà nghiên cứu đưa ra kết luận đáng tin cậy về mối quan hệ giữa các biến.

5.2. Chỉ số thống kê và vai trò trong phân tích dữ liệu thực tế

Các chỉ số thống kê như hệ số tương quan hạng Spearman đóng vai trò quan trọng trong việc chuyển đổi dữ liệu thô thành thông tin có ý nghĩa. Trong thực tế, các mối quan hệ kinh tế - xã hội hiếm khi hoàn hảo và tuyến tính. Việc sử dụng các chỉ số phi tham số cho phép các nhà phân tích khám phá các mối liên hệ phức tạp hơn, phù hợp hơn với bản chất của dữ liệu. Hiểu và áp dụng đúng các chỉ số này không chỉ là yêu cầu của môn học lý thuyết thống kê kinh tế xã hội mà còn là kỹ năng thiết yếu cho bất kỳ ai làm việc với dữ liệu, từ nghiên cứu thị trường, phân tích tài chính đến hoạch định chính sách công. Các kiến thức này tạo tiền đề vững chắc cho việc học các mô hình kinh tế lượng phức tạp hơn sau này.

VI. Tóm tắt lý thuyết thống kê và tài liệu ôn tập hiệu quả

Để chinh phục thành công môn học, việc hệ thống hóa kiến thức là vô cùng quan trọng. Giáo trình lý thuyết thống kê phần 2 của PGS.TS Trần Thị Kim Thu cung cấp một nền tảng lý thuyết vững chắc, nhưng người học cần chủ động tổng hợp để ghi nhớ và vận dụng. Một phương pháp hiệu quả là tạo ra một bản tóm tắt lý thuyết thống kê cho mỗi chương, bao gồm các định nghĩa chính, công thức quan trọng, điều kiện áp dụng của từng phương pháp và sơ đồ quy trình ra quyết định. Việc này giúp biến kiến thức phức tạp thành một hệ thống dễ tra cứu. Bên cạnh đó, các tài liệu bổ trợ như slide bài giảng lý thuyết thống kê từ giảng viên cũng là nguồn tài liệu quý giá, thường chắt lọc những nội dung cốt lõi và nhấn mạnh các điểm cần lưu ý. Việc kết hợp giữa giáo trình, bản tóm tắt cá nhân và slide bài giảng sẽ tạo ra một bộ công cụ ôn tập thống kê toàn diện. Cuối cùng, không có gì hiệu quả hơn việc thực hành. Hãy tìm kiếm và giải các đề thi lý thuyết thống kê từ các năm trước để làm quen với cấu trúc đề, các dạng bài tập thường gặp và rèn luyện kỹ năng quản lý thời gian. Sự chuẩn bị kỹ lưỡng này sẽ giúp người học tự tin bước vào phòng thi và đạt được kết quả tốt nhất.

6.1. Chiến lược chuẩn bị hiệu quả cho các đề thi lý thuyết thống kê

Chuẩn bị cho một đề thi lý thuyết thống kê đòi hỏi một kế hoạch có hệ thống. Đầu tiên, hãy xác định các chủ đề trọng tâm thường xuất hiện, như ước lượng tham số, kiểm định giả thuyết thống kê, và phân tích hồi quy và tương quan. Dành thời gian ôn tập kỹ lưỡng lý thuyết của các phần này. Tiếp theo, hãy thực hành giải đa dạng các loại bài tập, từ bài tập tự luận đến trắc nghiệm, để nắm vững cách áp dụng công thức. Khi giải đề, hãy tập thói quen đọc kỹ yêu cầu, xác định đúng phương pháp cần dùng trước khi bắt tay vào tính toán. Sử dụng các bài tập lý thuyết thống kê có lời giải trong sách để đối chiếu và rút kinh nghiệm từ những lỗi sai. Việc luyện tập này giúp xây dựng phản xạ và sự tự tin cần thiết.

6.2. Vai trò của Nhà xuất bản Thống kê và tài liệu tham khảo

Nhà xuất bản Thống kê là đơn vị uy tín hàng đầu tại Việt Nam trong việc phát hành các ấn phẩm học thuật về thống kê. Việc giáo trình được xuất bản bởi đơn vị này là một sự bảo chứng về chất lượng, độ chính xác và tính cập nhật của nội dung. Ngoài giáo trình đại học kinh tế quốc dân này, người học cũng có thể tìm kiếm thêm các tài liệu tham khảo khác từ cùng nhà xuất bản để mở rộng kiến thức. Việc tham khảo chéo nhiều nguồn tài liệu giúp có được cái nhìn đa chiều và hiểu sâu hơn về bản chất của các khái niệm xác suất thống kê, làm giàu thêm kiến thức và kỹ năng phân tích của bản thân.

16/08/2025

Trích đoạn nội dung tài liệu

Chương 10 KIEM ĐỊNH PHI THAM SÓ Từ chương 7 đến 9, chúng ta đã nghiên cứu các phương pháp dùng để kiểm định dữ liệu định lượng. Khi đó để so sánh các tổng thể với nhau, chúng ta thường so sánh giá trị trung bình của các tổng thể. Trong chương này, chúng tôi sẽ giới thiệu các phương pháp dùng để kiểm định-dữ liệu định tính với thang đo thứ bậc. Khi dữ liệu là định tính với thang đo thứ bậc, giá trị trung bình không còn phù hợp để so sánh vị trí trung tâm của các tông thể khác nhau.

Lúc này chúng ta sẽ so sánh các tổng thể với nhau mà không sử dụng một tham số cụ thể nào cả. Thay vì việc so sánh giá trị trung bình của các tổng thể, chúng ta sẽ so sánh vị trí của các tổng thể với nhau. Chính vì lý do nêu trên mà các kiêm định trình bày ở chương này được gọi là kiểm định phi tham số.1 mô tả phân phối của hai tổng thể 1 va 2. Do kiém dinh phi tham số không ràng buộc yêu cầu về phân phối chuẩn nên ở đây trình bày các dạng phân phối tự do.1a, vị trí của hai tông thể là như nhau phản ánh giá trị của hai tông thê tương tự như nhau.

Hình 10-Ib cho thấy vị trí của tông thể 1 nằm ở phía trái vị trí của tổng thể 2 hay tong, thể 1 nhỏ hơn tổng thé 2. Trong khi ở hình 10. Ic vị trí của tông thể 1 lại nằm ở bên phải vị trí của tổng thể 2 hay téng thé 1 lớn hơn tổng thể2. Tong thé1 Téng thé 2.1 eRe GENE ss UE ee 381 Tổng thể 1 Tổng thể 2 Hinh 10.1b Tổng thể 2 Tổng thể Ï Hinh 10.1c Kiểm định phi tham số cũng được dùng để kiểm định dữ liệu định lượng nhưng yêu cầu về phân phối chuẩn bị vi phạm.

Chương này sẽ trình bày các kiểm định phi tham số bao gồm kiểm định tổng hang Wilcoxon, kiểm định dấu, kiểm định tổng hạng có dấu Wilcoxori, kiểm định Kruskal- Wallis, kiểm định Friedman và kiểm định tương quan hạng Spearman. KIEM DINH TONG HANG WILCOXON 10. Pham vi 4p dung va gia thuyét thống kê Kiểm định tổng hạng Wilcoxon được áp dụng trong trường hợp sau đây: - Mục đích nghiên cứu nhằm so sánh hai tổng thể - Số liệu có thể là định tính với thang đo thứ bậc hoặc định lượng nhưng yêu cầu về phân phối chuẩn của #4 — #4; không thỏa mãn - Hai mẫu độc lập Giả sử chúng ta cần so sánh tổng thể 1 vA tông thể 2. Khi số liệu thỏa mãn các điều kiện nêu ở trên chúng ta dùng kiểm định tong hang Wilcoxon và so sánh vị trí của hai tổng thé thay vì so sánh trực tiếp số trung bình của hai tổng thể như trường hợp kiểm định tham số (xem chương 8).

Lúc này giả thuyết kiểm định sẽ là: Hạ: Vị trí của hai tổng thé 1a như nhau. Hị: Vị trí của hai tổng thể là khác nhau 382 Trên đây là trường hợp kiểm định hai phía. Nếu chúng ta muốn kết luận tổng thê 1 lớn hơn tổng thê 2, ta dùng kiểm định phía phải và giả thuyết đối lúc này là: HI: Vị trí của tổng thể 1 nằm phía phải vị trí của tổng thể 2 Hoặc ngược lại nếu chúng ta muốn kết luận tổng thể 1 nhỏ hơn tổng thể 2, ta dùng kiểm định phía trái với giả thuyết đối là: HI: Vị trí của tổng thể 1 nằm phía trái vị trí của tổng thể 2 10. Tiêu chuẩn kiểm định và phân phối của tiêu chuẩn kiểm định 10.

Trường hợp cỡ mẫu nhỏ (< 10) Vi du 10.1: Hiện nay tinh trạng thay đổi việc làm khá phổ biến đối với một bộ phận lao động có trình độ chuyên môn cao. Điều này gây ra gánh nặng chỉ phí phải tuyển và đào tạo các nhân viên mới cho các công ty. Để giảm thiểu chỉ phí này, trưởng phòng nhân sự của một công ty muốn so sánh thời gian mà nhân viên có bằng cử nhân quản trị kinh doanh và nhân viên có bằng cử nhân thuộc các chuyên ngành khác làm việc ở công ty ông trước khi chuyên sang chỗ làm mới. Ông đã chọn ngẫu nhiên 5 nhân viên có bằng cử nhân quản trị kinh doanh và 5 nhân viên có bằng cử nhân thuộc các chuyên ngành khác mà công ty đã tuyển trong vòng 3 năm qua.

Số tháng làm việc của 10 nhân viên này được liệt kê dưới đây (những người vẫn đang làm việc tại công ty được quy số tháng làm việc là 36). Bằng cử nhân quản trị kinh doanh: 22 23 20 36 25. - Bằng cử nhân chuyên ngành khác: 18 27 26 33 28 Liệu ông trưởng phòng nhân sự có thể kết luận ở mức ý nghĩa ø = 5% là có sự khác biệt về thời gian làm việc tại công ty của các nhân viên có hai loại bằng khác nhạu? , Giải:. Để giúp ông trưởng phòng nhân sự có những bằng chứng đưa ra kết luận ở mức ý nghĩa 5%, chúng ta sử dụngÌ kiểm định tổng hạng Wilcoxon.

Giả thuyết kiểm định được nếu ra đưới đây: Họ: Vị trí của hai tổng thể lä như nhau Hị: Vị trí của hai tổng thể là khác nhau (thời gian làm việc tại công ty của cử nhân quản trị kinh doanh và cử nhân các chuyên ngành khác là khác nhau) 383 -Bước 1: Cho hạng tất cả các đơn vị trong mẫu Để tính được tiêu chuẩn kiểm định, đầu tiên chúng ta cần xếp hạng chung cho tất cả các đơn vị trong các mẫu. Nguyên tắc xếp hạng là cho hạng của giá trị nhỏ nhất bằng I, giá trị nhỏ tiếp theo bằng 2 và cứ thế tiếp tục cho đến khi chúng ta cho xong hang của đơn vị cuối cùng có giá trị lớn nhất trong mẫu bằng 10. Trường hợp các đơn vị trong mẫu có giá trị bằng nhau thì hati của các đơn vị này sẽ bằng giá trị trung bình của hạng tính được từ các đơn vị đó.1 dưới đây thống kê lại hạng của các đơn vị trong mẫu. Hạng Mẫu 2 Hạng 23.

26 6 36 10 33 9 2 528, 8 Téng _ 24 ~~‘ Téng 31 Bước2: Tính tổng hạng của các mẫu và giá trị của tiêu chuẩn kiểm định” Tổng hạng của mẫu 1 kí hiệu là 7¡, 7,=24, và tổng hạng của mẫu 2 Kt hiéu 1a 72, T1 (lưu ýý là T¡ + 7; phải bằng tổng hạng của tất cả các đơn vị trong hai mau, tire la bang 55). Chúng ta có thể lấy ngẫu nhiên bất ky 7; hoặc 7; làm giá trị của tiêu chuẩn kiểm định tính từ mẫu quan sát. Ở đây, chúng ta lẫy ngẫu nhiên 7} làm giá trị của tiêu chuẩn kiểm định và kí hiệu là 7. Như vậy giá trị của tiêu chuẩn kiểm định tính cho ví dụ 1 là T= T.: ụ Bước 3: Phân phối của tiêu chuẩn kiểm định và miền bác bỏ ial Khi cỡ mẫu nhỏ hơn hoặc bang 10, chúng ta cóthể s SỬ dụng tiêu 'chuẩn kiểm định Wilcoxon’ (Bảng phụ lục 5): ¬ gi - Đối với kiểm định hai phía, chúng ta sẽ bác bỏ giả thuyết Họ, 6 ‘mgt mức ý nghĩa œ nào đó khi giá trị của tiêu chuẩn kiểm định T: hoặc.

tất nhỏ 7 <T,, hoặc rất lớn, 7 2 Tự. trong đó 7, là cận dưởi và 7% 1a cần trên của tiêu chad kiểm định. : writ ữ3 384 - Đối với phía phải, chúng ta sẽ bác bỏ giá thuyết Ho khi 7 > 7, - Đối với kiểm định phía trái, chúng ta bác bỏ giả thuyết #fo khi 7 <7, Ví dụ 10.1 ở trên sử dựng kiểm định hai phía với mức ý nghĩa 5% nên chúng ta sẽ sử dụng phần a của Bảng phụ lục 5. Chúng ta sẽ đối chiếu tiêu chuẩn kiểm định ở cột có n =5 và đồng có m,=5.

Tra bảng thấy miễn bác bỏ của tiêu chuẩn kiểm định là vùng có 7 <T, =18 hoặc T >1 ==37. Do giá trị của tiêu chuẩn kiểm định tính cho ví dụ 10.7=24, chúng ta không thé bác bỏ giả thuyết Ho. Bước4: Kết luận : Như vậy trong trường hợp này, trưởng phòng nhân sự của công ty không có đủ bằng chứng để kết luận có sự khác biệt về thời gian làm việc tại công ty của cử nhân có bằng quản trị kinh doanh và cử nhân có bằng thuộc chuyên ngành khác với mức ý nghĩa ø = 5%. Trường hợp cỡ mẫu:lớn (> 10) Các nhà thống kê đã chỉ rả rằng khi cỡ mẫu lớn hơn 10, tiêu chuẩn kiểm định có phân phối xấp xi chuẩn với kỳ vọng là E(7) và độ lệch chuẩn la o,, trong dé: 4 (10.1) #ữ)” a(n, tm) và: ơy =_ [Rmmữm+m,+Ð (02) 12 ˆ _ Tiêu chuẩn Âiểm định lúc này sẽlä:ˆ “ˆ so (1033) “ - Tương tự tưởng tp 'dỡ thấu nhỏ Rơn 10, ching ta có thể lấy ngẫu nhiên bắt kỳ 7; höặc 72 'để tính tiết thuận kiểm định.

Tuy nhiên : nên dựa vào giá thuyết abi để coiif Bi at : ft Ai (px ` ty " tt t Dog PRA$ E: Sy xin Gig 2 385 Vĩ dụ 10.2: Một nhà sản xuất thuốc đang tiến hành nghiên cứu sản xuất một loại thuốc giảm đau tạm đặt tên là A. Thí nghiệm đầu tiên mà nhà sắn xuất tiến hành là so sánh hiệu quả của A;¡ với loại thuốc aspirin đang bán trên thị trường. Để tiến hành thí nghiệm này, nhà sản xuất chọn ngẫu nhiên 30 người. Trong số đó, 15 người được cho uống A¡ và 15 người được cho uống aspirin khi bị đau đầu hoặc có bất kỳ một triệu chứng đau nào khác.

Những người này sau đó được hỏi về hiệu quả của loại thuốc mà họ đã sử đụng bằng cách cho điểm như sau: 5 = Cực kỳ hiệu nghiệm 4 = Rất hiệu nghiệm 3 = Tương đối hiệu nghiệm 2 = Hơi hiệu nghiệm 1 = Không hiệu nghiệm Phương án trả lời của hai mẫu được liệt kê đưới đây: Ai: 3,5,4,3,2,5,1,4,5,3,3,5,5,5,4 Aspirin: 4, 1, 3, 2, 4, 1, 3, 4, 2, 2, 2, 4, 3, 4, 5 ‘ Liệu có đủ bằng chứng ở mức ý nghĩa a = 5% dé kết luận ring AAl hiéu qua hon aspirin? _ Giải: Giả thuyết kiểm định là: Ho: Vị trí của hai tổng thể là như nhau (hiệu quả của hai loại thuốc là như nhau) Hy: Vj tri cia tổng thể 1 nằm ở bên phải vị trí của tổng thể 2 (A1 hiệu quả hơn aspirin) Tiêu chuẩn kiểm định Đề tính được giá trị của tiêu chuẩn kiếm định, chúng ta cần phải XẾp. hạng cho tất cả các đơn vị trong hai mẫu. Trong hai mẫu quan sát ở trên, có 3 đơn vị có giá trị nhỏ nhất bằng ‘1°, theo thứ tự các đơn vị này sẽ có hạng lần lượt là 1, 2, 3.

Nội dung được bảo vệ bản quyền — Tải xuống đầy đủ