Mô hình thống kê đa cấp khác gì so với hồi quy tuyến tính thông thường?

Mô hình hồi quy tuyến tính thông thường giả định tất cả các quan sát là độc lập. Trong thực tế, dữ liệu phân cấp vi phạm giả định này. Mô hình đa cấp giải quyết vấn đề bằng cách cho phép hiệu ứng ngẫu nhiên thay đổi giữa các nhóm. Các ước lượng trở nên chính xác hơn. Sai số chuẩn được tính đúng, giảm nguy cơ đưa ra kết luận sai lầm.

Khi nào nên sử dụng mô hình thống kê đa cấp?

Mô hình đa cấp phù hợp khi dữ liệu có cấu trúc phân cấp tự nhiên. Các ví dụ phổ biến bao gồm học sinh trong trường học, bệnh nhân trong bệnh viện, công nhân trong công ty. Khi biến thiên giữa các nhóm là mục tiêu nghiên cứu quan trọng, mô hình này giúp phân tích hiệu quả. Đặc biệt hữu ích khi muốn tìm hiểu mối quan hệ thay đổi giữa các nhóm khác nhau.

Phần mềm nào hỗ trợ phân tích mô hình thống kê đa cấp?

MLwiN là phần mềm chuyên dụng hàng đầu cho phân tích mô hình đa cấp, được phát triển bởi nhóm nghiên cứu liên quan trực tiếp đến lý thuyết mô hình. Ngoài ra, nhiều gói phần mềm phổ biến hỗ trợ phân tích đa cấp. Các thuật toán IGLS, RIGLS và EM được tích hợp trong nhiều công cụ khác nhau. Sự đa dạng phần mềm giúp người nghiên cứu dễ dàng tiếp cận phương pháp này.

Mô hình thống kê đa cấp - Harvey Goldstein (Bristol) - Ấn bản lần 4

Trường đại học

Đại học Bristol

Chuyên ngành

Thống kê đa cấp

Người đăng

Ẩn danh

Thể loại

Sách tham khảo

2011

384

Phí lưu trữ

75 Point

Tóm tắt

I. Tổng quan về mô hình thống kê đa cấp

Mô hình thống kê đa cấp (multilevel statistical models) là phương pháp phân tích dữ liệu mạnh mẽ. Phương pháp này xử lý dữ liệu có cấu trúc phân cấp tự nhiên. Dữ liệu phân cấp xuất hiện ở khắp nơi. Học sinh được nhóm trong lớp học. Bệnh nhân nằm trong bệnh viện. Công nhân làm việc tại các nhà máy.

Mô hình này được Harvey Goldstein tại Đại học Bristol phát triển và trình bày chi tiết. Tác phẩm "Multilevel Statistical Models" đã trải qua nhiều lần tái bản. Phiên bản thứ tư được xuất bản năm 2011 bởi nhà xuất bản Wiley.

Đặc điểm cốt lõi là khả năng phân tích biến thể ở nhiều cấp độ cùng lúc. Mỗi cấp độ có phương sai riêng. Hiệu ứng cố định mô tả xu hướng trung bình. Hiệu ứng ngẫu nhiên nắm bắt sự biến thiên giữa các nhóm.

Mô hình tuyến tính truyền thống giả định các quan sát độc lập. Giả định này thường bị vi phạm trong dữ liệu phân cấp. Mô hình đa cấp giải quyết vấn đề này trực tiếp. Nó cung cấp ước lượng chính xác hơn. Sai số chuẩn được tính đúng hơn so với phương pháp truyền thống.

1.1. Định nghĩa và cấu trúc mô hình đa cấp

Mô hình thống kê đa cấp mở rộng mô hình hồi quy tuyến tính truyền thống. Mô hình này cho phép các tham số ngẫu nhiên thay đổi giữa các nhóm. Ví dụ, một mô hình hai cấp có thể xem xét học sinh ở cấp 1 và trường học ở cấp 2.

Phương trình cơ bản gồm hai phần rõ ràng. Phần hiệu ứng cố định mô tả mối quan hệ trung bình trong toàn bộ dữ liệu. Phần hiệu ứng ngẫu nhiên nắm bắt sự biến thiên giữa các nhóm cấp cao hơn.

Các mô hình này thuộc họ mô hình tuyến tính tổng quát. McCullagh và Nelder (1989) đã cung cấp nền tảng lý thuyết vững chắc cho phân tích dữ liệu đơn cấp. Mô hình đa cấp kế thừa và mở rộng nền tảng đó.

1.2. Lịch sử phát triển mô hình đa cấp

Lịch sử phát triển mô hình đa cấp gắn liền với nghiên cứu giáo dục. Các nhà nghiên cứu nhận ra rằng dữ liệu học sinh có cấu trúc phân cấp tự nhiên. Học sinh nằm trong lớp học. Lớp học nằm trong trường học.

Harvey Goldstein là người đi đầu trong lĩnh vực này. Tác phẩm "Multilevel Statistical Models" của ông là tài liệu tham khảo chuẩn. Sách đã qua bốn lần tái bản, mỗi phiên bản bổ sung nội dung mới.

Trước mô hình đa cấp, các nhà nghiên cứu phải dùng phương pháp gộp hoặc tách dữ liệu. Phương pháp gộp bỏ qua sự khác biệt giữa các nhóm. Phương pháp tách mất thông tin quan trọng. Mô hình đa cấp giải quyết cả hai vấn đề này một cách hiệu quả.

II. Vấn đề phân tích dữ liệu đa cấp trong nghiên cứu

Phân tích dữ liệu đa cấp đặt ra nhiều thách thức phương pháp luận. Vấn đề lớn nhất là sự tương quan giữa các quan sát trong cùng nhóm. Khi học sinh cùng lớp được giảng dạy bởi một giáo viên, điểm số có xu hướng tương tự nhau.

Bỏ qua cấu trúc đa cấp dẫn đến nhiều hệ quả nghiêm trọng. Sai số chuẩn của các hệ số hồi quy bị đánh giá thấp. Điều này làm tăng nguy cơ sai lầm loại I. Các kiểm định thống kê trở nên không đáng tin cậy.

Một vấn đề khác là biến thiên giữa các nhóm có thể là mục tiêu nghiên cứu quan trọng. Ví dụ, sự khác biệt về tỷ lệ tử vong giữa nam và nữ có thể thay đổi từ cộng đồng này sang cộng đồng khác. Mô hình đơn cấp không thể phát hiện được hiện tượng này.

Dữ liệu phân cấp cũng thường có dạng biến phân loại. Tỷ lệ tử vong và tỷ lệ mắc bệnh là những ví dụ điển hình. Các mô hình tuyến tính tổng quát đa cấp được phát triển để xử lý những loại dữ liệu phức tạp này.

2.1. Tác động của tương quan trong nhóm lên phân tích

Hệ quả thống kê của việc bỏ qua tương quan trong nhóm là rất đáng kể. Trong mô hình hồi quy thông thường, mỗi quan sát được coi là độc lập. Giả định này sai khi dữ liệu có cấu trúc phân cấp.

Hệ số nội tổ (intraclass correlation coefficient - ICC) đo lường mức độ tương quan giữa các quan sát trong cùng nhóm. Giá trị ICC cao cho thấy sự phụ thuộc mạnh mẽ giữa các cá nhân. Điều này làm giảm số lượng quan sát hiệu quả trong phân tích.

Khi ICC dương, sai số chuẩn bị đánh giá thấp nghiêm trọng. Điều này tạo ra ấn tượng sai lầm về độ chính xác của các ước lượng. Các khoảng tin cậy trở nên quá hẹp. Kết quả kiểm định giả thuyết trở nên không đáng tin cậy.

2.2. Các loại dữ liệu đa cấp phổ biến

Dữ liệu đa cấp xuất hiện trong nhiều lĩnh vực nghiên cứu khác nhau. Trong giáo dục, học sinh được nhóm trong lớp học và trường học. Trong y tế, bệnh nhân nằm trong bệnh viện và khu vực địa lý.

Mỗi cấp độ trong cấu trúc đa cấp có thể có các biến giải thích riêng. Biến cấp 1 mô tả đặc điểm cá nhân như tuổi tác, giới tính. Biến cấp 2 mô tả đặc điểm nhóm như quy mô và thành phần xã hội.

Dữ liệu đa cấp cũng có thể là dữ liệu lặp lại trên cùng cá nhân. Nhiều phép đo trên một người tạo thành cấu trúc hai cấp. Cá nhân là cấp 2. Các phép đo lặp lại là cấp 1. Đây là trường hợp đặc biệt quan trọng trong nghiên cứu lâm sàng.

III. Phương pháp ước lượng mô hình thống kê đa cấp

Nhiều phương pháp ước lượng đã được phát triển cho mô hình đa cấp. Phương pháp hợp lý cực đại (maximum likelihood - ML) là phổ biến nhất. Tuy nhiên, ML tạo ra ước lượng thiên lệch cho các tham số ngẫu nhiên. Thiên lệch này xuất hiện vì không tính đến biến thiên lấy mẫu của các tham số cố định.

Phương pháp hợp lý cực đại hạn chế (REML) khắc phục vấn đề thiên lệch. REML điều chỉnh bậc tự do để tạo ra ước lượng không thiên lệch. Điều này đặc biệt quan trọng trong mẫu nhỏ.

Thuật toán IGLS (Iterative Generalised Least Squares) là phương pháp lặp hiệu quả. Thuật toán này được sử dụng cho các mô hình phức tạp. Chương trình MLwiN tích hợp sẵn thuật toán IGLS. RIGLS là phiên bản hạn chế của IGLS, tương ứng với REML.

Thuật toán EM (Expectation-Maximization) là một lựa chọn thay thế. Bryk và Raudenbush (2002) đã mô tả chi tiết thuật toán này. EM được đánh giá cao về tính đơn giản trong tính toán. Nhiều gói phần mềm thống kê đã tích hợp thuật toán EM.

3.1. Ước lượng hợp lý cực đại và phiên bản hạn chế

Ước lượng hợp lý cực đại (ML) tìm giá trị tham số tối đa hóa hàm hợp lý. Hàm hợp lý đo lường khả năng dữ liệu quan sát được dưới các giá trị tham số cụ thể. ML cung cấp ước lượng nhất quán cho cả phần cố định và phần ngẫu nhiên.

Tuy nhiên, ML có nhược điểm trong mẫu nhỏ. Nó không điều chỉnh cho việc ước lượng các tham số cố định. Điều này dẫn đến ước lượng thiên lệch của phương sai ngẫu nhiên.

REML giải quyết vấn đề bằng cách tích hợp ra các tham số cố định. Phương pháp này tập trung vào phần ngẫu nhiên của mô hình. Ước lượng REML không thiên lệch ngay cả trong mẫu nhỏ. Giá trị RIGLS trong thuật toán IGLS cho kết quả tương đương với REML.

3.2. Thuật toán IGLS và các biến thể

Thuật toán IGLS hoạt động theo nguyên tắc lặp. Ban đầu, phương sai được ước lượng sơ bộ. Sau đó, các hệ số cố định được ước lượng bằng bình phương tối thiểu tổng quát. Quá trình lặp tiếp tục cho đến khi hội tụ hoàn toàn.

EGLS (Expected Generalised Least Squares) là biến thể của IGLS. Biến thể này tập trung vào các tham số phần cố định. Nó sử dụng ước lượng V từ lần lặp đầu tiên. Mục đích là thu được hệ số cố định nhất quán mà không cần lặp thêm.

Longford (1987) phát triển thuật toán dựa trên "Fisher scoring". Raudenbush (1994) chứng minh rằng thuật toán này tương đương chính thức với IGLS. Sự tương đương này đảm bảo tính nhất quán giữa các phương pháp khác nhau. Người nghiên cứu có thể chọn phương pháp phù hợp với dữ liệu cụ thể.

IV. Ứng dụng mô hình thống kê đa cấp trong thực tế

Mô hình thống kê đa cấp đã trở thành công cụ không thể thiếu trong nhiều lĩnh vực. Nghiên cứu giáo dục sử dụng mô hình này để phân tích hiệu quả trường học. Nghiên cứu y tế áp dụng để đánh giá biến thiên giữa các bệnh viện.

Trong dịch tễ học, mô hình đa cấp phân tích tỷ lệ tử vong theo cộng đồng. Mô hình cho phép kiểm tra xem các biến giải thích có giải thích được biến thiên giữa cộng đồng hay không. Mô hình cũng phát hiện sự khác biệt trong mối quan hệ giữa biến giữa các nhóm.

Mô hình tuyến tính tổng quát đa cấp mở rộng phạm vi ứng dụng đáng kể. Các biến đáp án nhị phân, đếm, phân loại thứ tự đều được xử lý hiệu quả. Chương 7 trình bày mô hình đa biến với hỗn hợp các loại đáp án khác nhau.

Phần mềm MLwiN là công cụ chuyên dụng hàng đầu cho phân tích đa cấp. Nhiều gói phần mềm thống kê phổ biến khác cũng hỗ trợ phân tích đa cấp. Sự phát triển liên tục của công nghệ phần mềm giúp mô hình này ngày càng dễ tiếp cận hơn.

4.1. Ứng dụng trong giáo dục và y tế

Trong giáo dục, mô hình đa cấp phân tích dữ liệu học sinh theo trường lớp. Mô hình giúp đánh giá ảnh hưởng của chất lượng giảng dạy đến kết quả học tập. Các biến cấp trường như cơ sở vật chất và sĩ số lớp được xem xét đồng thời.

Nghiên cứu y tế sử dụng mô hình đa cấp cho dữ liệu đa trung tâm. Bệnh nhân được nhóm trong bệnh viện và khu vực. Mô hình đánh giá sự khác biệt giữa các cơ sở y tế. Từ đó đưa ra cải thiện chất lượng chăm sóc sức khỏe.

Trong kinh tế, mô hình phân tích dữ liệu lao động phân cấp. Công nhân nằm trong công ty. Công ty nằm trong ngành công nghiệp. Mô hình giúp hiểu rõ yếu tố nào ảnh hưởng đến năng suất ở các cấp độ khác nhau.

4.2. Hướng phát triển tương lai của mô hình đa cấp

Sự phát triển của mô hình đa cấp đang hướng tới nhiều hướng mới. Mô hình phức tạp hơn với nhiều cấp độ và nhiều biến đáp án đang được nghiên cứu tích cực. Mô hình đa biến với hỗn hợp loại đáp án là hướng phát triển quan trọng.

Phần mềm phân tích ngày càng mạnh mẽ và dễ sử dụng hơn. MLwiN và các gói phần mềm khác liên tục được cập nhật tính năng mới. Điều này giúp mô hình đa cấp tiếp cận được nhiều đối tượng nghiên cứu hơn.

Tích hợp mô hình đa cấp với học máy là hướng nghiên cứu đầy tiềm năng. Sự kết hợp này có thể cải thiện khả năng dự đoán. Đồng thời giữ được ưu điểm phân tích cấu trúc phân cấp của mô hình truyền thống.

21/04/2026

Bạn đang xem trước tài liệu:

Multilevel statistical models

Tải đầy đủ

Trích đoạn nội dung tài liệu

P1: TIX/OSW P2: TIX FM JWST015-Goldstein August 18, 2010 19:8 Printer Name: Yet to Come P1: TIX/OSW P2: TIX FM JWST015-Goldstein August 18, 2010 19:8 Printer Name: Yet to Come Multilevel Statistical Models P1: TIX/OSW P2: TIX FM JWST015-Goldstein August 18, 2010 19:8 Printer Name: Yet to Come WILEY SERIES IN PROBABILITY AND STATISTICS Established by WALTER A. SHEWHART and SAMUEL S. WILKS Editors David J. Fitzmaurice, Harvey Goldstein, Iain M. Johnstone, Geert Molenberghs, David W. Tsay, Sanford Weisberg Editors Emeriti Vic Barnett, Ralph A. Teugels P1: TIX/OSW P2: TIX FM JWST015-Goldstein August 18, 2010 19:8 Printer Name: Yet to Come Multilevel Statistical Models 4th Edition Harvey Goldstein University of Bristol, UK A John Wiley and Sons, Ltd., Publication P1: TIX/OSW P2: TIX FM JWST015-Goldstein August 18, 2010 19:8 Printer Name: Yet to Come This edition first published 2011 © 2011 John Wiley & Sons, Ltd Registered offic John Wiley & Sons Ltd, The Atrium, Southern Gate, Chichester, West Sussex, PO19 8SQ, United Kingdom For details of our global editorial offices, for customer services and for information about how to apply for permission to reuse the copyright material in this book please see our website at www. The right of the author to be identified as the author of this work has been asserted in accordance with the Copyright, Designs and Patents Act 1988. All rights reserved. No part of this publication may be reproduced, stored in a retrieval system, or transmitted, in any form or by any means, electronic, mechanical, photocopying, recording or otherwise, except as permitted by the UK Copyright, Designs and Patents Act 1988, without the prior permission of the publisher. Wiley also publishes its books in a variety of electronic formats. Some content that appears in print may not be available in electronic books. Designations used by companies to distinguish their products are often claimed as trademarks. All brand names and product names used in this book are trade names, service marks, trademarks or registered trademarks of their respective owners. The publisher is not associated with any product or vendor mentioned in this book. This publication is designed to provide accurate and authoritative information in regard to the subject matter covered. It is sold on the understanding that the publisher is not engaged in rendering professional services. If professional advice or other expert assistance is required, the services of a competent professional should be sought. Library of Congress Cataloguing-in-Publication Data Goldstein, Harvey. Multilevel statistical models / Harvey Goldstein. Includes bibliographical references and index. Social sciences–Mathematical models. Social sciences–Research–Methodology. Educational tests and measurements–Mathematical models.5–dc22 2010023377 A catalogue record for this book is available from the British Library. Print ISBN: 978-0-470-74865-7 ePDF ISBN: 978-0-470-97340-0 oBook ISBN: 978-0-470-97339-4 Set in 10/12 Times by Aptara. P1: TIX/OSW P2: TIX FM JWST015-Goldstein August 18, 2010 19:8 Printer Name: Yet to Come This book is dedicated to Jon Rasbash who died in March 2010. Without his support, enthusiasm and insight, many of the things discussed in this book would not have happened. Harvey Goldstein June 2010 P1: TIX/OSW P2: TIX FM JWST015-Goldstein August 18, 2010 19:8 Printer Name: Yet to Come P1: TIX/OSW P2: TIX FM JWST015-Goldstein August 18, 2010 19:8 Printer Name: Yet to Come Contents Preface xv Acknowledgements xvii Notation xix A general classification notation and diagram xx Glossary xxiii 1 An introduction to multilevel models 1 1.1 Hierarchically structured data 1 1.3 Sample survey methods 5 1.4 Repeated measures data 5 1.5 Event history and survival models 6 1.6 Discrete response data 7 1.10 Cross classifications and multiple membership structures 9 1.11 Factor analysis and structural equation models 10 1.12 Levels of aggregation and ecological fallacies 10 1.14 The latent normal transformation and missing data 13 1.16 A caveat 14 2 The 2-level model 15 2.2 The 2-level model 17 2.1 The variance components model 19 2.2 The general 2-level model with random coefficients 21 2.4 Maximum likelihood estimation using iterative generalised least squares (IGLS) 22 2.5 Marginal models and generalised estimating equations (GEE) 25 P1: TIX/OSW P2: TIX FM JWST015-Goldstein August 18, 2010 19:8 Printer Name: Yet to Come viii CONTENTS 2.7 The adequacy of ordinary least squares estimates 27 2.8 A 2-level example using longitudinal educational achievement data 28 2.1 Checking for outlying units 30 2.2 Model checking using estimated residuals 31 2.9 General model diagnostics 32 2.10 Higher level explanatory variables and compositional effects 34 2.11 Transforming to normality 36 2.12 Hypothesis testing and confidence intervals 39 2.3 Hypothesis testing for non-nested models 42 2.4 Inferences for residual estimates 43 2.13 Bayesian estimation using Markov Chain Monte Carlo (MCMC) 45 2.2 Metropolis-Hastings (MH) sampling 48 2.3 Convergence of MCMC chains 48 2.14 Data augmentation 55 Appendix 2.1 The general structure and maximum likelihood estimation for a multilevel model 57 Appendix 2.2 Multilevel residuals estimation 60 2.2 Delta method estimators for the covariance matrix of residuals 61 Appendix 2.3 Estimation using profile and extended likelihood 63 Appendix 2.4 The EM algorithm 65 Appendix 2.2 Metropolis-Hastings (MH) sampling 70 2.4 Orthogonalisation of the explanatory variables and parameter expansion 72 3 3-level models and more complex hierarchical structures 73 3.1 Complex variance structures 73 3.1 Partitioning the variance and intra-unit correlation 79 3.2 Variances for subgroups defined at level 1 80 3.3 Variance as a function of predicted value 83 3.4 Variances for subgroups defined at higher levels 85 3.2 A 3-level complex variation model example 85 3.4 Weighting units 90 P1: TIX/OSW P2: TIX FM JWST015-Goldstein August 18, 2010 19:8 Printer Name: Yet to Come CONTENTS ix 3.1 Maximum likelihood estimation with weights 91 3.2 Weighted MCMC estimation 92 3.5 Robust (sandwich) estimators and jacknifing 93 3.1 The fully nonparametric bootstrap 95 3.2 The fully parametric bootstrap 95 3.3 The iterated parametric bootstrap and bias correction 96 3.4 The residuals bootstrap 98 3.7 Aggregate level analyses 101 3.1 Inferences about residuals from aggregate level analyses 103 3.1 Aggregate and mixed level analysis 106 3.2 Defining origin and scale 107 3.3 An example: meta analysis of class size data 107 3.4 Practical issues in meta analysis 108 3.9 Design issues 109 4 Multilevel models for discrete response data 111 4.1 Generalised linear models 111 4.2 Proportions as responses 112 4.1 A study of contraceptive use 115 4.2 Modelling school segregation 117 4.4 Models for multiple response categories 119 4.5 Models for counts 122 4.7 Mixed discrete-continuous response models 124 4.8 A latent normal model for binary responses 126 4.9 Partitioning variation in discrete response models 127 4.3 A binary linear model (Method C) 129 4.4 A latent variable approach (Method D) 129 4.5 An example of VPC calculations 130 Appendix 4.1 Multilevel generalised linear model estimation 132 4.1 Approximate quasilikelihood estimates 132 4.2 Differentials for some discrete response models 134 Appendix 4.2 Maximum likelihood estimation for multilevel generalised linear models 135 4.1 Simulated maximum likelihood estimation 135 4.3 Cross classifications and multiple membership models 139 4.5 Maximum likelihood estimation via quadrature 140 P1: TIX/OSW P2: TIX FM JWST015-Goldstein August 18, 2010 19:8 Printer Name: Yet to Come x CONTENTS Appendix 4.3 MCMC estimation for generalised linear models 142 4.1 Metropolis-Hastings (MH) sampling 142 4.2 Latent variable models for binary data 142 4.3 Proportions as responses 144 Appendix 4.4 Bootstrap estimation for multilevel generalised linear models 145 4.1 The iterated bootstrap 145 5 Models for repeated measures data 147 5.1 Repeated measures data 147 5.2 A 2-level repeated measures model 148 5.3 A polynomial model example for adolescent growth and the prediction of adult height 149 5.4 Modelling an autocorrelation structure at level 1 153 5.5 A growth model with autocorrelated residuals 154 5.6 Multivariate repeated measures models 156 5.7 Scaling across time 156 5.8 Cross-over designs 157 5.10 Longitudinal discrete response data 159 6 Multivariate multilevel data 161 6.2 The basic 2-level multivariate model 162 6.4 A rotation design example using Science Survey test scores 164 6.5 Informative response selection: subject choice in examinations 167 6.6 Multivariate structures at higher levels and future predictions 168 6.7 Multivariate responses at several levels 170 6.1 Fitting responses at several levels using random data augmentation 171 6.8 Principal components analysis 172 6.9 Multiple discriminant analysis 173 Appendix 6.1 MCMC algorithm for a multivariate normal response model with constraints 175 6.1 Constraints among parameters 176 7 Latent normal models for multivariate data 179 7.1 The normal multilevel multivariate model 179 7.2 Sampling binary responses 180 7.3 Sampling ordered categorical responses 180 7.4 Sampling unordered categorical responses 182 7.5 Sampling count data 182 7.6 Sampling continuous non-normal data 183 P1: TIX/OSW P2: TIX FM JWST015-Goldstein August 18, 2010 19:8 Printer Name: Yet to Come CONTENTS xi 7.7 Sampling the level 1 and level 2 covariance matrices 183 7.9 Partially ordered data 185 7.10 Hybrid normal/ordered variables 185 7.1 Ordered data with known thresholds 186 7.11 Discussion 187 8 Multilevel factor analysis, structural equation and mixture models 189 8.1 A 2-stage 2-level factor model 189 8.2 A general multilevel factor model 191 8.3 MCMC estimation for the factor model 192 8.1 A 2-level factor example 193 8.4 Structural equation models 195 8.5 Discrete response multilevel structural equation models 197 8.6 More complex hierarchical latent variable models 198 8.7 Multilevel mixture models 198 9 Nonlinear multilevel models 201 9.2 Nonlinear functions of linear components 201 9.3 Estimating population means 202 9.4 Nonlinear functions for variances and covariances 203 9.5 Examples of nonlinear growth and nonlinear level 1 variance 204 Appendix 9.1 Nonlinear model estimation 207 9.1 Modelling variances and covariances as nonlinear functions 208 10 Multilevel modelling in sample surveys 211 10.1 Sample survey structures 211 10.2 Finite population inference 213 10.3 Small area estimation 214 10.1 Information at domain level only 215 10.3 Multivariate responses 216 11 Multilevel event history and survival models 217 11.3 Hazard and survival functions 218 11.4 Parametric proportional hazard models 219 11.5 The semiparametric Cox model 220 11.6 Tied observations 221 P1: TIX/OSW P2: TIX FM JWST015-Goldstein August 18, 2010 19:8 Printer Name: Yet to Come xii CONTENTS 11.7 Repeated events proportional hazard models 222 11.8 Example using birth interval data 222 11.9 Log duration models 223 11.10 Examples with birth interval data and children’s activity episodes 227 11.11 The grouped discrete time hazards model 229 11.1 A 2-level discrete time event history model for repeated events 232 11.2 Partnership data example 234 11.3 General discrete time event history models 234 11.12 Discrete time latent normal event history models 237 11.3 Information about the timing of events in an interval 238 11.4 Modelling the threshold parameters and time varying covariates 239 11.5 An example using partnership durations 240 12 Cross-classifie data structures 243 12.1 Random cross classifications 243 12.2 A basic cross-classified model 245 12.3 Examination results for a cross classification of schools 247 12.4 Interactions in cross classifications 248 12.5 Cross classifications with one unit per cell 248 12.6 Multivariate cross-classified models 249 12.7 A general notation for cross classification 249 12.8 MCMC estimation in cross-classified models 250 Appendix 12.1 IGLS estimation for cross-classified data 252 12.1 An efficient IGLS algorithm 252 12.2 Computational considerations 253 13 Multiple membership models 255 13.1 Multiple membership structures 255 13.2 Notation and classifications for multiple membership structures 256 13.3 An example of salmonella infection 257 13.4 A repeated measures multiple membership model 258 13.5 Individuals as higher level units 259 13.1 Example of research grant awards 261 13.7 Missing identification models 263 Appendix 13.1 MCMC estimation for multiple membership models 265 14 Measurement errors in multilevel models 267 14.1 A basic measurement error model 267 P1: TIX/OSW P2: TIX FM JWST015-Goldstein August 18, 2010 19:8 Printer Name: Yet to Come CONTENTS xiii 14.2 Moment-based estimators 268 14.1 Measurement errors in level 1 variables 268 14.2 Measurement errors in higher level variables 269 14.3 A 2-level example with measurement error at both levels 271 14.6 Measurement errors for discrete explanatory variables 274 14.7 MCMC estimation for measurement error models 275 Appendix 14.1 Measurement error estimation 277 14.1 Moment based estimators for a basic 2-level model 277 14.

Nội dung được bảo vệ bản quyền — Tải xuống đầy đủ

Mô hình thống kê đa cấp - Harvey Goldstein (Bristol) - Ấn bản lần 4

I. Tổng quan về mô hình thống kê đa cấp

1.1. Định nghĩa và cấu trúc mô hình đa cấp

1.2. Lịch sử phát triển mô hình đa cấp

II. Vấn đề phân tích dữ liệu đa cấp trong nghiên cứu

2.1. Tác động của tương quan trong nhóm lên phân tích

2.2. Các loại dữ liệu đa cấp phổ biến

III. Phương pháp ước lượng mô hình thống kê đa cấp

3.1. Ước lượng hợp lý cực đại và phiên bản hạn chế

3.2. Thuật toán IGLS và các biến thể

IV. Ứng dụng mô hình thống kê đa cấp trong thực tế

4.1. Ứng dụng trong giáo dục và y tế

4.2. Hướng phát triển tương lai của mô hình đa cấp

THÔNG TIN CHI TIẾT

Tác giả: Harvey Goldstein

Trường học: Đại học Bristol

Chuyên ngành: Thống kê đa cấp

Đề tài: Multilevel Statistical Models

Loại tài liệu: Sách tham khảo

Năm xuất bản: 2011

Địa điểm: Chichester

Mô hình thống kê đa cấp - Harvey Goldstein (Bristol) - Ấn bản lần 4

I. Tổng quan về mô hình thống kê đa cấp

1.1. Định nghĩa và cấu trúc mô hình đa cấp

1.2. Lịch sử phát triển mô hình đa cấp

II. Vấn đề phân tích dữ liệu đa cấp trong nghiên cứu

2.1. Tác động của tương quan trong nhóm lên phân tích

2.2. Các loại dữ liệu đa cấp phổ biến

III. Phương pháp ước lượng mô hình thống kê đa cấp

3.1. Ước lượng hợp lý cực đại và phiên bản hạn chế

3.2. Thuật toán IGLS và các biến thể

IV. Ứng dụng mô hình thống kê đa cấp trong thực tế

4.1. Ứng dụng trong giáo dục và y tế

4.2. Hướng phát triển tương lai của mô hình đa cấp

TÀI LIỆU LIÊN QUAN

THÔNG TIN CHI TIẾT

Tác giả: Harvey Goldstein

Trường học: Đại học Bristol

Chuyên ngành: Thống kê đa cấp

Đề tài: Multilevel Statistical Models

Loại tài liệu: Sách tham khảo

Năm xuất bản: 2011

Địa điểm: Chichester