Giáo trình spss phương pháp nghiên cứu xã hội học iii đề tài khoa học cấp cơ sở

Giáo trình về spss phương pháp nghiên cứu xã hội học iii đề tài khoa học cấp cơ sở, biên soạn theo chương trình đào tạo chuẩn, hệ thống hóa kiến thức từ cơ bản đến nâng cao.

Người đăng

Ẩn danh
78
1
0

Phí lưu trữ

30 Point

Tóm tắt

I. Tổng quan giáo trình SPSS và vai trò trong nghiên cứu xã hội

Giáo trình SPSS phương pháp nghiên cứu xã hội học III là một tài liệu khoa học cấp cơ sở, đóng vai trò nền tảng cho sinh viên và nhà nghiên cứu. Mục tiêu chính của giáo trình là trang bị kiến thức lý thuyết và kỹ năng thực hành về phần mềm xử lý dữ liệu định lượng. SPSS, viết tắt của “Statistical Package for the Social Sciences”, là công cụ không thể thiếu trong các ngành khoa học xã hội. Nó cho phép thực hiện toàn bộ quy trình phân tích dữ liệu định lượng, từ việc nhập liệu, lập bảng biểu, thống kê mô tả đến các phân tích thống kê phức tạp. So với các phần mềm khác, phần mềm SPSS có ưu thế vượt trội về tính đa năng và giao diện thân thiện, cho phép tổng hợp, phân tích và xử lý số liệu SPSS một cách tiện lợi. Trong bối cảnh nghiên cứu khoa học sinh viên ngày càng được chú trọng, việc nắm vững SPSS giúp sinh viên tự tin thực hiện các đề tài, khóa luận tốt nghiệp xã hội học và các công trình nghiên cứu khác. Giáo trình này không chỉ là một tài liệu hướng dẫn sử dụng công cụ, mà còn là một phần quan trọng trong phương pháp luận nghiên cứu, giúp người học liên kết giữa lý thuyết xã hội học và các vấn đề thực tiễn thông qua số liệu. Như tài liệu gốc đã nêu: "Phần 2 của môn học trang bị cho sinh viên những kiến thức lý thuyết và kỹ năng thực hành về một phần mềm xử lý dữ liệu định lượng được các nhà khoa học xã hội nói chung, xã hội học nói riêng sử dụng phổ biến hiện nay, SPSS". Điều này khẳng định tầm quan trọng của việc ứng dụng SPSS để biến những dữ liệu thô từ các cuộc điều tra xã hội học thành những kết quả có ý nghĩa, phục vụ cho việc kiểm định giả thuyết và đưa ra các kết luận khoa học xác đáng. Nền tảng kiến thức từ các môn như Xã hội học đại cương, Lý thuyết xã hội học và Phương pháp nghiên cứu xã hội học I & II là điều kiện tiên quyết để tiếp thu hiệu quả nội dung của giáo trình này.

1.1. Giới thiệu phần mềm SPSS trong phân tích dữ liệu định lượng

Phần mềm SPSS là một hệ thống thống kê toàn diện, được thiết kế để xử lý mọi giai đoạn của một phân tích thống kê. Công cụ này bắt đầu từ môi trường DOS và phát triển mạnh mẽ trên nền tảng Windows từ phiên bản 6. Ưu điểm nổi bật của SPSS là giao diện trực quan, cho phép người dùng không chuyên sâu về lập trình vẫn có thể thực hiện các phân tích phức tạp. SPSS có khả năng làm việc với nhiều định dạng file khác nhau như Excel, Stata, SAS, giúp tối ưu hóa quy trình làm việc. Chức năng chính của nó là hỗ trợ phân tích dữ liệu định lượng, từ các thống kê mô tả cơ bản như tần suất, trung bình, phương sai đến các kỹ thuật nâng cao như phân tích hồi quy tuyến tính, phân tích nhân tố khám phá EFA, kiểm định t-testkiểm định anova.

1.2. Sự cần thiết ứng dụng SPSS trong điều tra xã hội học

Trong các cuộc điều tra xã hội học, lượng dữ liệu thu thập được thường rất lớn và phức tạp. Việc xử lý thủ công không chỉ tốn thời gian mà còn dễ gây ra sai sót. SPSS cung cấp một giải pháp hiệu quả để quản lý và phân tích bộ dữ liệu này. Chỉ với vài thao tác đơn giản, nhà nghiên cứu có thể tạo ra hàng trăm biểu bảng tổng hợp, ví dụ như phân tích mức lương theo độ tuổi hoặc trình độ học vấn. Điều này giúp nhanh chóng khám phá các mối liên hệ giữa các biến độc lậpbiến phụ thuộc, làm cơ sở cho việc diễn giải kết quả. Theo tài liệu, "Chỉ trong vòng vài phút, có thể tạo được hàng trăm biểu bảng tổng hợp mà không phải lập trình như nhiều chương trình khác". Đây là minh chứng rõ ràng cho sự cần thiết của thống kê ứng dụng thông qua SPSS trong nghiên cứu hiện đại.

II. Thách thức khi xử lý số liệu SPSS cho đề tài khoa học

Mặc dù SPSS là công cụ mạnh mẽ, quá trình xử lý số liệu SPSS cho một đề tài khoa học cấp cơ sở vẫn tiềm ẩn nhiều thách thức, đặc biệt với những người mới bắt đầu. Thách thức lớn nhất đến từ khâu chuẩn bị dữ liệu, bao gồm việc tạo file cơ sở dữ liệu, mã hóa biến số, và quan trọng nhất là làm sạch dữ liệu. Một bộ dữ liệu thiếu nhất quán hoặc chứa nhiều lỗi nhập liệu sẽ dẫn đến kết quả phân tích sai lệch, ảnh hưởng trực tiếp đến độ tin cậy của toàn bộ công trình nghiên cứu. Sinh viên thường gặp khó khăn trong việc nhận diện các loại thang đo (định danh, thứ bậc, tỷ lệ) và áp dụng chúng một cách chính xác. Ví dụ, việc sử dụng sai thang đo có thể dẫn đến việc lựa chọn sai phép kiểm định giả thuyết, chẳng hạn như áp dụng kiểm định t-test cho dữ liệu định danh. Một vấn đề khác là sự phức tạp trong việc xử lý các câu hỏi nhiều lựa chọn hoặc câu hỏi mở. Việc mã hóa và biến đổi các loại dữ liệu này đòi hỏi một phương pháp luận nghiên cứu chặt chẽ và sự hiểu biết sâu về các lệnh trong SPSS như Recode hay Compute. Hơn nữa, việc diễn giải kết quả từ các bảng phân tích cũng là một kỹ năng quan trọng. Các chỉ số như độ tin cậy Cronbach's Alpha, giá trị p-value trong kiểm định chi-bình phương, hay hệ số hồi quy không phải lúc nào cũng dễ hiểu. Nếu không có kiến thức nền tảng vững chắc về thống kê ứng dụng, người nghiên cứu có thể diễn giải sai ý nghĩa của các con số, dẫn đến những kết luận khoa học không chính xác. Do đó, việc nắm vững các kỹ thuật được trình bày trong giáo trình là cực kỳ quan trọng để vượt qua những rào cản này.

2.1. Khó khăn trong việc mã hóa biến số và làm sạch dữ liệu

Một trong những công đoạn tốn nhiều thời gian nhất là mã hóa biến sốlàm sạch dữ liệu. Việc đặt tên biến không tuân thủ quy tắc (ví dụ: chứa ký tự đặc biệt, bắt đầu bằng số) có thể gây ra lỗi hệ thống. Hơn nữa, khi dữ liệu được nhập từ nhiều nguồn hoặc bởi nhiều người, tính nhất quán rất dễ bị phá vỡ. Các lỗi thường gặp bao gồm nhập sai giá trị (ví dụ: nhập '3' cho biến giới tính chỉ có mã 1=Nam, 2=Nữ), bỏ sót dữ liệu (missing values), hoặc thông tin logic mâu thuẫn (ví dụ: người trả lời 'không có con' nhưng lại trả lời câu hỏi về số tuổi của con). Nếu không được làm sạch cẩn thận, những dữ liệu 'bẩn' này sẽ làm sai lệch mọi kết quả phân tích sau đó.

2.2. Nhầm lẫn giữa biến độc lập biến phụ thuộc và thang đo

Sự nhầm lẫn trong việc xác định vai trò của các biến là một lỗi cơ bản nhưng nghiêm trọng trong nghiên cứu khoa học sinh viên. Việc xác định đâu là biến độc lập (yếu tố tác động) và đâu là biến phụ thuộc (yếu tố bị tác động) là cốt lõi để xây dựng mô hình phân tích. Bên cạnh đó, việc lựa chọn thang đo phù hợp (Scale, Ordinal, Nominal) quyết định loại phân tích thống kê nào có thể được áp dụng. Ví dụ, không thể tính giá trị trung bình cho một biến danh nghĩa (Nominal) như 'dân tộc'. Sử dụng sai thang đo Likert hoặc không kiểm tra độ tin cậy Cronbach's Alpha cho các thang đo đa mục có thể làm giảm giá trị khoa học của kết quả nghiên cứu.

III. Hướng dẫn tạo file cơ sở dữ liệu SPSS cho nghiên cứu xã hội

Việc tạo một file cơ sở dữ liệu có cấu trúc tốt là bước đầu tiên và quan trọng nhất trong quy trình xử lý số liệu SPSS. Một file dữ liệu được tổ chức khoa học sẽ giúp quá trình nhập liệu, làm sạch và phân tích trở nên dễ dàng và chính xác hơn. Quá trình này bắt đầu trong cửa sổ Data Editor, tại tab Variable View. Tại đây, mỗi hàng đại diện cho một biến và mỗi cột đại diện cho một thuộc tính của biến đó. Thuộc tính quan trọng nhất là tên biến (Name), phải tuân thủ các quy tắc nghiêm ngặt: bắt đầu bằng chữ cái, không chứa khoảng trắng hay ký tự đặc biệt. Tiếp theo là việc chọn loại biến (Type), phổ biến nhất là Numeric (số) và String (chuỗi). Ngay cả với các dữ liệu định tính như giới tính hay nghề nghiệp, chúng cũng thường được mã hóa biến số thành dạng số để thuận tiện cho phân tích dữ liệu định lượng. Gán nhãn biến (Label) là một bước không thể bỏ qua. Nhãn biến cho phép mô tả chi tiết nội dung câu hỏi, giúp kết quả xuất ra dễ đọc và dễ hiểu hơn. Theo tài liệu, "nhãn biến có thể dài đến 256 ký tự" và nên thể hiện đầy đủ nội dung câu hỏi, đối tượng và đơn vị đo lường nếu có. Tương tự, gán trị số (Value) là việc định nghĩa ý nghĩa cho các con số đã được mã hóa (ví dụ: 1 = 'Nam', 2 = 'Nữ'). Việc này cực kỳ hữu ích, giúp người đọc hiểu được ý nghĩa của các con số trong bảng kết quả. Cuối cùng, việc xác định các loại thang đo (Measure) - Scale, Ordinal, Nominal - là bước quyết định các phép thống kê ứng dụng nào sẽ được sử dụng sau này.

3.1. Quy trình khai báo tên biến loại biến và mã hóa biến số

Quy trình khai báo biến trong SPSS đòi hỏi sự cẩn thận và tuân thủ nguyên tắc. Tên biến (Name) nên ngắn gọn, gợi nhớ và không chứa ký tự tiếng Việt có dấu. Loại biến (Type) thường được mặc định là Numeric, phù hợp cho cả dữ liệu định lượng (tuổi, thu nhập) và dữ liệu định tính đã được mã hóa. Việc mã hóa biến số là chuyển đổi các câu trả lời định tính thành các con số. Ví dụ, trong một cuộc điều tra xã hội học, các phương án trả lời cho câu hỏi về trình độ học vấn có thể được mã hóa thành 1='Tiểu học', 2='Trung học cơ sở', v.v. Quá trình này giúp chuẩn hóa dữ liệu, tạo điều kiện cho việc phân tích thống kê hiệu quả.

3.2. Cách gán nhãn biến trị số và xác định các loại thang đo

Gán nhãn biến (Label) và trị số (Value) là hai thao tác làm cho bộ dữ liệu trở nên 'biết nói'. Nhãn biến mô tả đầy đủ câu hỏi, trong khi nhãn trị số giải thích ý nghĩa của từng mã số. Ví dụ, một biến tên 'gt' có thể có nhãn là 'Giới tính của người trả lời', và các trị số được gán là 1='Nam', 2='Nữ'. Việc xác định thang đo (Measure) là bước cuối cùng. Dữ liệu định lượng liên tục như tuổi sẽ dùng thang đo tỷ lệ (Scale). Dữ liệu có tính thứ bậc như mức độ hài lòng (Rất hài lòng, Hài lòng...) dùng thang đo thứ bậc (Ordinal). Dữ liệu chỉ dùng để phân loại như nơi ở (Thành thị, Nông thôn) dùng thang đo định danh (Nominal). Việc xác định đúng thang đo là nền tảng cho việc lựa chọn các phép phân tích phù hợp sau này.

IV. Phương pháp nhập liệu và làm sạch dữ liệu SPSS hiệu quả

Sau khi đã tạo cấu trúc file, giai đoạn tiếp theo là nhập và làm sạch dữ liệu. Đây là công đoạn đòi hỏi sự tỉ mỉ để đảm bảo tính chính xác và nhất quán của bộ số liệu. Việc nhập dữ liệu được thực hiện trong tab Data View, nơi mỗi hàng là một trường hợp (case) và mỗi cột là một biến. Người nhập liệu nên tuân thủ nguyên tắc nhập theo từng trường hợp, tức là nhập toàn bộ thông tin của một bảng hỏi rồi mới chuyển sang bảng hỏi tiếp theo. Đối với các biến định tính đã được mã hóa biến số, chỉ cần nhập các mã số tương ứng (ví dụ: nhập '1' cho 'Nam'). SPSS cung cấp tính năng Value Labels (View -> Value Labels) để hiển thị nhãn trị số thay vì mã số, giúp kiểm tra trực quan trong quá trình nhập. Tuy nhiên, sai sót trong quá trình nhập là khó tránh khỏi. Do đó, làm sạch dữ liệu là một bước bắt buộc trước khi tiến hành phân tích. Mục đích của việc này là "để đảm bảo rằng các dữ liệu được nhập chính xác" và "các thông tin nhập vào phải nhất quán, đáng tin cậy". Các bước làm sạch cơ bản bao gồm: chạy thống kê tần suất (Frequencies) cho tất cả các biến để phát hiện các giá trị nằm ngoài phạm vi đã mã hóa (ví dụ: giá trị '3' trong biến giới tính). Sau khi phát hiện lỗi, sử dụng chức năng Find (Edit -> Find) để nhanh chóng định vị ô dữ liệu sai và đối chiếu với bảng hỏi gốc để sửa chữa. Ngoài ra, cần kiểm tra tính logic giữa các biến, ví dụ như một người trả lời 'chưa từng kết hôn' thì không thể có dữ liệu ở biến 'số năm kết hôn'. Việc này đảm bảo bộ dữ liệu không chỉ đúng về mặt số học mà còn hợp lý về mặt logic, sẵn sàng cho các bước phân tích dữ liệu định lượng sâu hơn.

4.1. Kỹ thuật nhập dữ liệu định lượng cho câu hỏi đơn và bội

Nhập dữ liệu cho câu hỏi một lựa chọn (câu hỏi đơn) tương đối đơn giản, chỉ cần nhập mã số tương ứng với phương án được chọn. Tuy nhiên, với câu hỏi nhiều lựa chọn (câu hỏi bội), có hai cách tiếp cận chính. Cách thứ nhất là tách mỗi phương án trả lời thành một biến riêng biệt (ví dụ: b5.1, b5.2) và nhập giá trị 1 nếu được chọn, 0 (hoặc 2) nếu không được chọn. Cách thứ hai là nhập gộp các mã số được chọn vào một biến duy nhất (dạng số hoặc chuỗi). Cách thứ hai nhập nhanh hơn nhưng đòi hỏi phải thực hiện các thao tác biến đổi dữ liệu phức tạp hơn trước khi phân tích.

4.2. Các bước kiểm tra và xử lý số liệu SPSS thiếu nhất quán

Để kiểm tra tính nhất quán của dữ liệu, phương pháp hiệu quả nhất là chạy thống kê mô tả và bảng chéo (Crosstabs). Lệnh Frequencies giúp phát hiện các giá trị bất thường (outliers) hoặc các mã không hợp lệ. Ví dụ, trong biến 'tuổi' của đối tượng khảo sát là sinh viên, một giá trị '100' rõ ràng là một lỗi. Lệnh Crosstabs giúp kiểm tra mối quan hệ logic giữa hai biến. Ví dụ, lập bảng chéo giữa biến 'Tình trạng hôn nhân' và 'Số con' có thể phát hiện các trường hợp 'Chưa kết hôn' nhưng lại có 'Số con' lớn hơn 0. Khi phát hiện sự thiếu nhất quán, cần quay lại bảng hỏi gốc để xác minh và chỉnh sửa, đảm bảo bộ dữ liệu đáng tin cậy cho việc xử lý số liệu SPSS.

V. Bí quyết biến đổi và nhóm gộp dữ liệu trong phần mềm SPSS

Biến đổi dữ liệu là một kỹ thuật nâng cao trong phần mềm SPSS, cho phép nhà nghiên cứu tạo ra các biến mới hoặc điều chỉnh các biến hiện có để phù hợp hơn với mục tiêu phân tích. Không phải lúc nào dữ liệu thô cũng có thể được sử dụng trực tiếp. Đôi khi, việc nhóm gộp các giá trị lại giúp phân tích trở nên có ý nghĩa hơn. Lệnh Recode là công cụ mạnh mẽ nhất cho mục đích này. Nó cho phép mã hóa lại các giá trị của một biến. Ví dụ, một biến 'năm sinh' có thể được Recode thành một biến mới 'nhóm tuổi' (ví dụ: 18-25, 26-35). Có hai tùy chọn: Recode into Same Variables (thay đổi trực tiếp biến gốc) và Recode into Different Variables (tạo một biến mới và giữ lại biến gốc). Lựa chọn thứ hai thường được khuyến khích để bảo toàn dữ liệu gốc. Một công cụ quan trọng khác là lệnh Compute. Lệnh này cho phép tạo một biến mới dựa trên các phép tính toán số học từ các biến khác. Ví dụ, để tính chỉ số BMI, có thể sử dụng lệnh Compute để tạo biến BMI từ hai biến 'cân nặng' và 'chiều cao'. Lệnh này đặc biệt hữu ích khi xây dựng các chỉ số tổng hợp hoặc các thang đo Likert tổng. Ngoài ra, lệnh Count được sử dụng để đếm số lần xuất hiện của một giá trị cụ thể trên một loạt các biến. Ví dụ, trong một điều tra xã hội học về các hoạt động giải trí, lệnh Count có thể được dùng để tạo ra một biến mới 'tổng số hoạt động tham gia' bằng cách đếm số lần câu trả lời 'Có' xuất hiện. Những kỹ thuật này là chìa khóa để khai thác sâu hơn bộ dữ liệu, biến đổi chúng để thực hiện các phép kiểm định giả thuyết phức tạp như phân tích hồi quy tuyến tính.

5.1. Sử dụng lệnh Recode để tạo biến phụ thuộc biến độc lập mới

Lệnh Recode là công cụ thiết yếu để chuẩn bị dữ liệu cho các mô hình phân tích. Nhà nghiên cứu có thể nhóm gộp các loại nghề nghiệp chi tiết thành các nhóm lớn hơn (ví dụ: 'Lao động trí óc', 'Lao động chân tay') để tạo ra một biến độc lập có ý nghĩa hơn. Tương tự, một biến liên tục như 'thu nhập' có thể được mã hóa lại thành các khoảng thu nhập ('Thấp', 'Trung bình', 'Cao') để sử dụng như một biến phân loại. Kỹ thuật này giúp đơn giản hóa dữ liệu, làm nổi bật các xu hướng và đáp ứng các giả định của một số phép kiểm định thống kê.

5.2. Kỹ thuật Compute và Count trong thống kê ứng dụng thực tiễn

Trong thống kê ứng dụng, lệnh Compute và Count đóng vai trò quan trọng. Lệnh Compute không chỉ dùng cho các phép tính đơn giản mà còn có thể kết hợp với các hàm logic (IF, AND, OR) để tạo ra các biến phức tạp. Ví dụ, tạo một biến 'Tình trạng nghèo' (1='Nghèo', 0='Không nghèo') dựa trên điều kiện về thu nhập và số thành viên hộ gia đình. Lệnh Count hữu ích khi làm việc với dữ liệu dạng ma trận (matrix questions). Nó giúp nhanh chóng tổng hợp thông tin, chẳng hạn như đếm xem một sinh viên đã chọn bao nhiêu kỹ năng mềm trong danh sách cho trước, tạo ra một biến định lượng mới phục vụ cho các phân tích sâu hơn.

VI. Ứng dụng SPSS hoàn thiện khóa luận tốt nghiệp xã hội học

Việc ứng dụng thành thạo các kỹ năng trong giáo trình SPSS phương pháp nghiên cứu xã hội học là yếu tố quyết định đến chất lượng của một khóa luận tốt nghiệp xã hội học sử dụng phương pháp định lượng. Toàn bộ quá trình, từ việc xây dựng cơ sở dữ liệu, làm sạch dữ liệu, biến đổi và cuối cùng là phân tích, đều là những bước không thể thiếu để biến ý tưởng nghiên cứu thành một công trình khoa học hoàn chỉnh. Sau khi dữ liệu đã được chuẩn bị kỹ lưỡng, sinh viên có thể tiến hành các phân tích thống kê để trả lời câu hỏi nghiên cứu và kiểm định giả thuyết. Các phân tích cơ bản bao gồm thống kê mô tả (tần suất, tỷ lệ, trung bình) để phác họa bức tranh tổng quan về mẫu nghiên cứu. Tiếp theo là các phân tích suy luận nhằm tìm ra các mối quan hệ giữa các biến. Ví dụ, sử dụng phép kiểm định chi-bình phương (Chi-Square) để xem xét mối liên hệ giữa 'Giới tính' và 'Quan điểm về hôn nhân đồng giới', hoặc dùng kiểm định t-testkiểm định anova để so sánh giá trị trung bình của một biến phụ thuộc (ví dụ: 'Mức độ hài lòng với cuộc sống') giữa các nhóm khác nhau của một biến độc lập (ví dụ: 'Nhóm thu nhập'). Đối với các đề tài phức tạp hơn, sinh viên có thể thực hiện phân tích hồi quy tuyến tính để dự báo giá trị của một biến phụ thuộc dựa trên một hoặc nhiều biến độc lập, hoặc phân tích nhân tố khám phá EFA để rút gọn một tập hợp lớn các biến quan sát thành một số ít các nhân tố tiềm ẩn. Việc trình bày kết quả một cách rõ ràng, kèm theo diễn giải ý nghĩa thống kê và ý nghĩa xã hội học của chúng, là bước cuối cùng để hoàn thiện công trình nghiên cứu khoa học sinh viên.

6.1. Từ xử lý số liệu đến kiểm định giả thuyết khoa học

Quá trình chuyển từ xử lý số liệu SPSS thô sang kiểm định giả thuyết là cốt lõi của nghiên cứu định lượng. Sau khi dữ liệu sạch, nhà nghiên cứu chọn các công cụ phân tích phù hợp. Ví dụ, để kiểm định giả thuyết "Có sự khác biệt về mức lương trung bình giữa nam và nữ", phép kiểm định t-test cho mẫu độc lập (Independent Samples T-Test) sẽ được sử dụng. Để kiểm định mối quan hệ giữa hai biến định tính, chi-bình phương là lựa chọn phù hợp. Việc lựa chọn đúng phép kiểm định và diễn giải chính xác giá trị p-value (mức ý nghĩa) là chìa khóa để chấp nhận hay bác bỏ giả thuyết một cách khoa học.

6.2. Tối ưu hóa phân tích cho nghiên cứu khoa học sinh viên

Đối với nghiên cứu khoa học sinh viên, việc tối ưu hóa phân tích là rất quan trọng. Thay vì thực hiện tràn lan các phép phân tích, cần tập trung vào những phân tích trực tiếp trả lời câu hỏi nghiên cứu. Bắt đầu với thống kê mô tả để hiểu rõ về mẫu. Sau đó, sử dụng bảng chéo và các phép kiểm định tương quan để khám phá các mối liên hệ ban đầu. Cuối cùng, lựa chọn một mô hình phân tích phù hợp như hồi quy hoặc ANOVA để đi sâu vào vấn đề. Việc sử dụng đồ thị, biểu đồ được tạo ra từ SPSS cũng là một cách hiệu quả để trực quan hóa kết quả, giúp bài khóa luận tốt nghiệp xã hội học trở nên sinh động và thuyết phục hơn.

25/07/2025

Trích đoạn nội dung tài liệu

Ban Lire ĐT18-XHH GIAO 2014 - pa 80100487_ _ HỌC VIÊN CHÍNH TRỊ QUỐC GIA HỖ CHÍ MINH_ HỌC VIỆN BẢO CHÍ VÀ TUYÊN TRUYỂN - DE TAI KHOA HOC CAP CO’ SO’ | GIÁO TRÌNH SPSS " | HƯƠNG PHÁP NGHIÊN CỨU XÃ HỘI HỌC II) Chủ nhiệm đề tài: Phạm Thị Vân Hà Nội— 2014—. Giáo trình SPSS- _ 80100487 1. Tên học phần: PHƯƠNG PHÁP NGHIÊN CỨU XÃ HỘI HỌC IH. Mã số môn học: 3.

Số đơn vị học trình: 4 (3,2,0). Mục đích môn học: Phần 2 của môn học trang bị cho sinh viên những kiến thức lý thuyết và kỹ năng thực hành về một phần mềm xử lý dữ liệu định lượng được các nhà khoa học xã hội nói chung, xã hội học nói riêng sử dụng phổ biến hiện nay, SPSS. Từ đó, sinh viên có thể áp dụng những kiến thức và kỹ năng học được từ phần này của môn học để nhập, biến đổi và xử lý thông tin từ các cuộc điều tra định lượng, phục vụ cho việc phân tích kết quả khảo sát xã hội học: _'. Yêu cầu: * Về tri thức: Sinh viên cần được trang bị trước những kiến thức về: Xã hội học đại cương, Lý thuyết xã hội học, Phương pháp nghiên cứu xã hội học I, Phương pháp nghiên cứu xã hội học II.

Những kiến thức nền tảng mà sinh viên được trang bị qua các môn học đó sẽ giúp họ hiểu được dễ dàng hơn các loại dữ liệu, cách xử lý các dữ liệu định lượng. | * Về kỹ năng: Sinh viên cần có các kỹ năng nhận diện dữ liệu, các loại thang đo, sử dụng máy tính và gắn lý thuyết vào việc phân tích, giải quyết các vấn đề thực tiễn. Phân bỗ thời gian: Học phần gom : 60 tiét— 04 don vi hoc trinh, trong đó phần 2 chiếm 40 tiết được phân bô về thời gian như sau: - Phần lý thuyết: 20 tiết - Phần thực hành: 0 tiết - Thảo luận và làm bài tập: 20 tiết - Xêmina - 7, Giảng viên tham gia giảng dạy môn học TT Họ và tên Cơ quanh công tác Chuyên ngành Phạm Thị Vân Học viện Báo chí và Xã hội học Tuyên truyền 8. Điều kiện tiên quyết Học phần được học sau khi sinh viên đã học xong học phần Xã hội học đại cương, Lý thuyết xã hội học, Phương pháp nghiên cứu xã hội học I, Phương pháp nghiên cứu xã hội học II.

9, Nội đung môn hoc * Nội dưng chỉ tiết TT Nội dung Tổng lLý |Bài | Thự số tiết | thuy |tập/ |c ét - | Thảo | hàn luận |h 1 Chương 1: Giới thiệu về chương trình SPSS for | z 3 2 0 windows 13. | SPSS va sw can thiét ing dung SPSS 1. | Cách vào, ra chương trình SPSS 1. | Các file/cửa số cơ bản của chương trình SP.SS 2 Chương 2: Tạo file cơ sở dữ liệu trong chương | z 3 2 0 trình SPSS 2.

| Khai bdo tén bién (Name) 2. | Chon loai bién (Type) 2. | Gán nhdan cho bién (Label) 2. Gán trị số cho biến (Value).

| Khai báo trị số khuyết thiéu (Missing) 2. Các thông số khác 2.7 | Một số thao tác khác khi tạo /tle cơ sở dữ liệu 3 Chương 3: Nhập và làm sạch dữ liệu 5 3. | Nhập dữ liệu dạng số (numeric) với câu hỏi một lựa chọn 3. | Nhập dữ liệu dạng số (numeric) với câu hỏi nhiều _ | la chon 3.

| Nhập dữ liệu dạng chudi/ky tu (string) 34. | Làmsạch dữ liệu. 4 Chương 4: Biến đôi, nhóm gộp đữ liệu 15 4. | Sử dụng lệnh Recode để biển dỗi dữ liệu 4.2, | Sit dung lénh Compute dé bién doi dữ liệu 4.

| Sit dung lénh Count dé bién doi dữ liệu 4.4, | Sử dụng lệnh Merge file dé ghép bién, ban ghi 45. | Sir dụng lệnh Select cases để lựa chọn trường hợp để phân tích 5. Chương 5: Xứ lý dữ liệu bằng chương trình 10 SPSS for windows 13. | Cach tao va dién gidi cdc bang/do thi tan suat 5.

| Cách tính và diễn giải các đại lượng thông kê (số | rung bình, trung vị, phương sdi. | Cách tạo và diễn giải các bảng tương quan 2. chiếu MỤC LỤC NỘI DUNG TRANG Chương 1: Giới thiệu về chương trình SPSS for windows 13. SPSS va sw can thiét eng dung SPSS 6 1.

Cách vào ra chương trình SPSS 7 | 1. Cae /file/cửa sé cơ bản của chương trình SPSS 9 Chương 2: Tạo file cơ sở dữ liệu trong chương trình SPSS 16 2. Khai báo tén bién (Name) _ 16 ‘2. Chon loai bién (Type) 8 2.

Gan nhãn cho biến (Label) 20 2. Gán trị sé cho bién (Value) 21 2. Khai bao tri sd khuyét thiéu (Missing) 22 2. Các thông số khác 23 2.

Một số thao tác khác khi tạo file cơ sở dữ liệu 24 Chương 3: Nhập và làm sạch dữ liệu 28 3. Nhập dữ liệu dạng số (numeric) với câu hỏi một lựa chọn 28 3. Nhập dữ liệu dạng số (numeric) voi câu hỗi nhiều lựa chọn. Nhập dữ liệu dụng chudi/ky tu (string) 31 3.

Làm sạch dữ liệu 32 Chương 4: Biến đôi, nhóm gộp dữ liệu 36 4. Sứ dụng lệnh Recode dé bién doi dữ liệu 36 4. Sie dung lénh Compute dé bién doi dữ liệu 44 4. Sie dung lénh Count dé bién doi dữ liệu 45 4.

Sứ dụng lệnh Merge file để ghép biến, bản ghỉ 47 4. Sử dụng lệnh Selecf cases để lựa chọn trường hợp để phân tích 48 Chương 5ã: Xử lý dữ liệu bằng chương trình SPSS for windows 53 13. Cách tạo và diễn giải các bang/do thi tan suất 53 5. Cách tỉnh và diễn giải các đại hrợng thông kê (số trung bình, 63 trung vị, phương sai.

Cách tạo và diễn giải các bằng tương quan 2 chiều 67 CHUONG 1. GIOI THIEU VE CHUONG TRINH SPSS FOR WINDOWS 13. SPSS và sự cần thiết ứngE dụng SPSS 1. SPSS SPSS là tên viết tắt của “Statistical Package for the Social Sciences” (Phần mềm thống kê trọn gói cho các môn khoa học xã hội).

SPSS cũng là viết tắt của của “Statistical Products for the Social Services” (Các sản phẩm thống kê cho các dịch vụ xã hội). SPSS là phần mềm chuyên ngành thống kê khởi đầu vào những năm 1960, trong môi trường DOS. Từ phiên bản 6 trở lên nó được dùng trong môi trường Windows. Phiên bản SPSS for Windows có một tính năng ưu việt hơn so với SPSS for DOS là có mục Help (trợ giúp) tương đối đầy đủ để giúp người sử dụng tự giải quyết những khó khăn vướng mắc (lợi thế cho những người thành thạo tiếng Anh, Tin học, thành thạo về chuyên môn).

SPSS for Windows có rất nhiều nét chung với các phần mềm tiện ích khác dùng cho Windows như EXCEL hay Winword. SPSS là một phần mềm thống kê toàn diện được thiết kế để thực hiện tất cả các bước trong bất kỳ phân tích thống kê nào từ việc liệt kê dữ liệu, lập bảng biểu và các thống kê mô tả đến các thống kê phức tạp hơn. Sự cần thiết ing dung SPSS So với các phần mềm khác như Excel, SPSS là phần mềm đa năng, cho phép tổng hợp, phân tích và xử lý các dữ liệu kinh tế xã hội đầy đủ và tiện lợi. SPSS có thể cho ra các bản tính tần suất của tất cả các biến (định tính và định lượng) trong cơ sở dữ liệu hoặc lập một bảng tương quan giữa hai biến với cách trình bày đẹp.

Ví dụ: Trong cơ sở đữ liệu của một cơ quan có thể lập các bảng tổng hợp: Mức lương phân theo độ tuổi, theo trình độ học vấn, đoàn thể phân theo giới tính,. Chỉ trong vòng vài phút, có thể tạo được hàng trăm biểu bảng tổng hợp mà không phải lập trình như nhiều chương trình khác. SPSS cũng thích hợp cho những người không cần biết sâu về máy tính, phần mềm này có thể liên kết các phần mềm khác như EXCEL, STATA, SAS, V. SPSS được dùng nhiều trong khoa học xã hội và thống kê.

Cách vào, ra chương trình SPSS 1. Khởi động SPSS Trên màn hình desktop của Widows nhắp vào biểu tượng - Sle# Sẽ xuất hiện cửa số SPSS Data Editor và một hộp thoại như sau: Hình 1-1: Cửa sé Data Editor addons Warden Hale "HS. Ss CE Name. Type Width | Decimals.

: = Columns Alien Measure + t 3 a p Whew Yt 9) ene T aw © Poavthe has : el C Trendn 6 fe © Ress an estingery ? ea co sing Diane Vicar! 5 1 -_ " s to ‘Open an existing data socroe [2 a i sPropea\Deng bt tay Noures\ ey opie. 3 Sean bai gaeg SPS Du ben SAVY áyeop> | fe i = i Với hộp thoại trên, ta có thể: Run the tutorial: Chạy chương trình trợ giúp Type in data: Nhập dữ liệu mới Run an existing query: Chay mét truy vấn đữ liệu đã có sẵn Create new query using Database Wizard: Lập một truy vẫn đữ liệu sử dụng Database Wizard Open an exisfing data source: Mở file dữ liệu đã có sẵn (Chú ý: Hộp thoại này chỉ xuất hiện một lần khi ta khởi động SPSS) 1. Mở một file Nếu đã có sẵn một file đữ liệu, ta có thể mở nó bằng lựa chọn Open an existing data source va nhắp vao More Files; Néu dang 6 trong ctra sé SPSS Data Editor: - Ttrthanh menu chon: - File Open Data. - Trong hép thoai Open File, chon file ma ta muén mé.

Hoặc ta có thé nhan vao biéu tuong &. Bên cạnh các file được lưu dưới định dạng của SPSS, ta có thể mở các file có định dạng của Excel, Lotus, dBASE, tab-deliminated mà không cần phải chuyên đôi chúng sang một định dạng trung gian hoặc nhập các thông tin định nghĩa dữ liệu. Hình 1-2: Các loại file dữ liệu có thÊ mở trong SPSS Fenan: | ` [ ma | Fies oftype: | SPSS (“.sav) | Paste | SPSS/PC+ {sys} Systat {*.syd) | _—ang_J Systat (sys) SPSS Portable (*.por) Excel (ods) Lotus (.dbf} SAS Long File Name (*.3387bdal) SAS Short Fie Name (.3d7) SAS v6 for Windows (*.sd2} — SỐS vỆ for Unpc (*.ssd01) mem OAS Transport (“xpt) Nếu ta muốn mở một file mới, từ thanh Menu, chọn: File New Data SPSS sẽ mở ra một file đữ liệu mới hoàn toàn, từ đó ta có thể thực hiện các thủ tục tạo file cơ sở dữ liệu, nhập dữ liệu, v. Đóng file và thoát khỏi chương trình SPSS Đối với SPSS for Windows 13.0 cũng như các phiên bản trước đó, một lúc ta chỉ có thể mở một file để làm việc.

Muốn mở một file mới hoặc một file khác, SPSS sẽ tự động đóng file đang làm việc, tuy nhiên, nếu ta chưa kịp lưu file dang lam việc, SPSS sẽ hỏi xem ta có lưu lại file đó không như hình dưới đây. Nếu muốn các đữ liệu/thông tin ta mới đưa vào được lưu lại, ta nhắn Yes.

Nội dung được bảo vệ bản quyền — Tải xuống đầy đủ