Mô hình hóa kết hợp khác gì so với phân tích hồi quy Cox truyền thống?

Phân tích hồi quy Cox truyền thống chỉ xem xét dữ liệu thời gian sự kiện với hiệp biến cố định. Mô hình hóa kết hợp bổ sung dữ liệu dọc, liên kết quá trình thay đổi biến sinh học theo thời gian với nguy cơ xảy ra sự kiện. Cách tiếp cận này xử lý dữ liệu bị thiếu, giảm thiểu sai lệch đo lường, và cung cấp ước lượng chính xác hơn về mối liên hệ giữa biomarker và kết cục lâm sàng.

Khi nào nên sử dụng mô hình hóa kết hợp thay vì phân tích riêng biệt?

Mô hình hóa kết hợp nên sử dụng khi nghiên cứu có cả dữ liệu dọc và thời gian sự kiện, đặc biệt khi quan tâm mối liên hệ giữa hai loại dữ liệu. Phương pháp hữu ích khi dữ liệu bị thiếu không ngẫu nhiên, khi hiệp biến dọc có sai số đo lường, hoặc khi muốn cải thiện độ chính xác ước lượng tác động của biomarker lên thời gian sự kiện.

Các phần mềm nào hỗ trợ phân tích mô hình hóa kết hợp?

Nhiều phần mềm hỗ trợ phân tích joint model. R có các gói JM, JMbayes và joineR. Stata có lệnh stjm. SAS sử dụng PROC NLMIXED kết hợp macro đặc biệt. Python có thư viện lifelines và statsmodels. Lựa chọn phụ thuộc vào loại mô hình, kích thước dữ liệu và phương pháp ước lượng. R và Stata là hai lựa chọn phổ biến nhất trong nghiên cứu học thuật hiện nay.

Mô hình hóa kết hợp dữ liệu dọc và thời gian sự kiện trong nghiên cứu thống kê

Trường đại học

University of California, Los Angeles

Chuyên ngành

Thống kê

Người đăng

Ẩn danh

Thể loại

Sách chuyên khảo

2017

262

Phí lưu trữ

55 Point

Tóm tắt

I. Tổng quan về mô hình hóa kết hợp dữ liệu dọc và thời gian sống

Mô hình hóa kết hợp (Joint Modeling) là phương pháp thống kê mạnh mẽ, được thiết kế để phân tích đồng thời hai loại dữ liệu: dữ liệu dọc (longitudinal data) và dữ liệu thời gian đến sự kiện (time-to-event data). Trong nghiên cứu y sinh học, cả hai loại dữ liệu thường được thu thập từ cùng một đối tượng. Ví dụ, trong nghiên cứu HIV/AIDS, nồng độ CD4 được đo lường nhiều lần theo thời gian, trong khi thời gian tử vong hoặc tiến triển bệnh được ghi nhận. Phương pháp truyền thống phân tích riêng biệt hai loại dữ liệu này, dẫn đến bỏ sót thông tin về mối liên hệ giữa chúng. Mô hình hóa kết hợp giải quyết vấn đề bằng cách xây dựng mô hình thống nhất, liên kết quá trình phát triển của biến số dọc với nguy cơ xảy ra sự kiện. Cách tiếp cận này cung cấp cái nhìn toàn diện về cơ chế sinh học, cải thiện độ chính xác trong ước lượng tham số, và xử lý hiệu quả dữ liệu bị thiếu không ngẫu nhiên.

1.1. Khái niệm dữ liệu dọc trong nghiên cứu

Dữ liệu dọc là tập hợp các phép đo lường được thực hiện nhiều lần trên cùng một đối tượng theo thời gian. Trong nghiên cứu y khoa, dữ liệu dọc thường bao gồm các chỉ số sinh học như nồng độ CD4 ở bệnh nhân HIV hoặc số lượng trứng đẻ hàng ngày ở ruồi giấm Địa Trung Hải. Đặc điểm quan trọng của dữ liệu dọc là sự tương quan nội tại giữa các phép đo trên cùng một cá thể. Mỗi cá thể có quỹ đạo phát triển riêng, được mô tả bởi các hiệu ứng ngẫu nhiên như hệ số chặn và hệ số góc cá thể. Việc mô hình hóa chính xác cấu trúc tương quan này là yếu tố then chốt để rút ra kết luận có ý nghĩa thống kê.

1.2. Đặc trưng dữ liệu thời gian đến sự kiện

Dữ liệu thời gian đến sự kiện ghi nhận thời điểm xảy ra một sự kiện quan tâm như tử vong, tái phát bệnh hoặc thất bại điều trị. Đặc trưng nổi bật là hiện tượng kiểm duyệt (censoring), trong đó thời gian sự kiện không được quan sát đầy đủ cho tất cả đối tượng. Phân tích thường sử dụng mô hình tỷ lệ nguy hiểm Cox hoặc mô hình thời gian hỏng加速 (accelerated failure time). Khi kết hợp với dữ liệu dọc, mối liên hệ giữa quá trình thay đổi biến số sinh học và nguy cơ xảy ra sự kiện trở thành trọng tâm phân tích, mang lại thông tin quý giá cho dự đoán và ra quyết định lâm sàng.

II. Thách thức trong phân tích dữ liệu dọc và thời gian sự kiện

Phân tích dữ liệu dọc và dữ liệu thời gian sự kiện riêng biệt tồn tại nhiều hạn chế nghiêm trọng. Thứ nhất, dữ liệu dọc thường chứa giá trị ngoại lai và phân phối không chuẩn của các hệ số cá thể. Ví dụ, trong nghiên cứu tế bào CD4, phân phối hệ số góc cá thể có thể không tuân theo phân phối chuẩn, đòi hỏi mô hình linh hoạt hơn. Thứ hai, dữ liệu thời gian sự kiện có thể vi phạm giả định tỷ lệ nguy hiểm tỷ lệ. Trong nghiên cứu khả năng sinh sản của ruồi giấm, mô hình Cox không phù hợp, dẫn đến sử dụng mô hình AFT thay thế. Thứ ba, dữ liệu thường bị thiếu hoặc không đầy đủ. Các đối tượng có thể bỏ nghiên cứu giữa chừng, tạo ra dữ liệu kiểm duyệt thông tin. Nếu bỏ qua mối liên hệ giữa quá trình dọc và cơ chế dropout, các ước lượng bị sai lệch đáng kể. Cuối cùng, kích thước mẫu lớn với cấu trúc hiệu ứng ngẫu nhiên phức tạp đặt ra thách thức tính toán lớn.

2.1. Vi phạm giả định phân phối chuẩn hiệu ứng ngẫu nhiên

Giả định phân phối chuẩn thường được sử dụng cho hiệu ứng ngẫu nhiên trong mô hình tuyến tính hỗn hợp. Tuy nhiên, dữ liệu thực tế cho thấy giả định này thường bị vi phạm. Trong nghiên cứu tế bào CD4, phân phối hệ số góc cá thể thể hiện dạng nhiều đỉnh (multimodal), không thể mô tả chính xác bằng phân phối chuẩn. Sự sai lệch dẫn đến ước lượng không chính xác các tham số mô hình và suy luận sai lệch về mối liên hệ giữa biến dọc và thời gian sự kiện. Các phương pháp phi tham số hoặc bán tham số cho phân phối hiệu ứng ngẫu nhiên trở nên cần thiết để xử lý vấn đề này hiệu quả.

2.2. Vấn đề dữ liệu bị thiếu và kiểm duyệt thông tin

Dữ liệu bị thiếu là thách thức phổ biến trong nghiên cứu dọc. Cơ chế dữ liệu bị thiếu phân loại thành thiếu hoàn toàn ngẫu nhiên (MCAR), thiếu ngẫu nhiên (MAR), và thiếu không ngẫu nhiên (MNAR). Phương pháp GEE yêu cầu dữ liệu bị thiếu tuân theo cơ chế MCAR, đây là giả định rất mạnh và thường không thỏa mãn trong thực tế. Khi dữ liệu bị thiếu theo cơ chế MNAR, xác suất thiếu phụ thuộc trực tiếp vào giá trị bị thiếu, sử dụng phương pháp thông thường dẫn đến ước lượng sai lệch. Mô hình hóa kết hợp giải quyết bằng cách mô hình hóa đồng thời quá trình dọc và cơ chế dropout.

III. Phương pháp mô hình hóa kết hợp longitudinal và survival

Mô hình hóa kết hợp sử dụng nhiều phương pháp tiếp cận để liên kết dữ liệu dọc với dữ liệu thời gian sự kiện. Cách tiếp cận phổ biến nhất liên kết mô hình tuyến tính hỗn hợp cho dữ liệu dọc với mô hình tỷ lệ nguy hiểm có điều kiện cho dữ liệu thời gian sự kiện. Các hiệu ứng ngẫu nhiên từ mô hình dọc đóng vai trò hiệp biến trong mô hình nguy hiểm, tạo cầu nối giữa hai quá trình. Về mặt ước lượng, phương pháp cận đúng dựa trên tuyến tính hóa được sử dụng rộng rãi do ưu điểm dễ triển khai và khả năng xử lý cấu trúc hiệu ứng ngẫu nhiên phức tạp. Tuy nhiên, phương pháp này có thể gây ra sai lệch do xấp xỉ tuyến tính. Phương pháp Bayes sử dụng kỹ thuật MCMC cung cấp cách tiếp cận thay thế, cho phép ước lượng trực tiếp phân phối hậu nghiệm. Phương pháp GEE cũng được áp dụng khi trọng tâm là giá trị trung bình biên, không yêu cầu đặc tả đầy đủ phân phối liên hợp.

3.1. Mô hình tuyến tính hỗn hợp cho dữ liệu dọc

Mô hình tuyến tính hỗn hợp (LMM) là nền tảng cho phần mô hình dọc trong joint model. LMM phân tích dữ liệu dọc bằng cách phân tách phương sai thành thành phần giữa cá thể và trong cá thể. Các hiệu ứng ngẫu nhiên bao gồm hệ số chặn ngẫu nhiên và hệ số góc ngẫu nhiên, mô tả sự biến thiên giữa các cá thể trong quá trình phát triển theo thời gian. Trong mô hình hóa kết hợp, các hiệu ứng ngẫu nhiên này được sử dụng làm hiệp biến trong mô hình thời gian sự kiện. Phương pháp tuyến tính hóa được áp dụng để xấp xỉ phân phối dữ liệu dọc, cho phép sử dụng kỹ thuật ước lượng tiêu chuẩn thông qua máxima verossimilhança.

3.2. Mô hình thời gian sự kiện trong framework kết hợp

Mô hình thời gian sự kiện trong joint model sử dụng hai dạng chính: mô hình tỷ lệ nguy hiểm Cox bán tham số và mô hình thời gian hỏng加速 (AFT) tham số đầy đủ. Mô hình Cox giả định tỷ lệ nguy hiểm tỷ lệ theo thời gian, trong khi mô hình AFT giả định biến đổi logarit của thời gian sự kiện theo phân phối cụ thể. Lựa chọn phụ thuộc vào đặc điểm dữ liệu. Trong nghiên cứu ruồi giấm, mô hình AFT được ưu tiên do vi phạm giả định tỷ lệ nguy hiểm tỷ lệ. Hàm nguy hiểm có điều kiện thường có dạng h(t) = h₀(t)exp(γ'M(t) + β'X), trong đó M(t) là giá trị dọc tại thời điểm t.

IV. Ứng dụng thực tiễn của mô hình hóa kết hợp trong nghiên cứu

Mô hình hóa kết hợp có ứng dụng rộng rãi trong nhiều lĩnh vực nghiên cứu. Trong y học lâm sàng, phương pháp đánh giá mối liên hệ giữa biomarker theo thời gian và kết cục lâm sàng như tử vong hoặc tái phát bệnh. Nghiên cứu HIV/AIDS sử dụng joint model phân tích mối quan hệ giữa nồng độ CD4 và thời gian sống, cung cấp thông tin quan trọng cho đánh giá hiệu quả điều trị. Trong nghiên cứu sinh học, dữ liệu về số lượng trứng đẻ hàng ngày của ruồi giấm Địa Trung Hải được phân tích kết hợp với thời gian sống để hiểu cơ chế sinh học. Phương pháp áp dụng trong nghiên cứu ung thư, nơi kích thước khối u theo thời gian liên kết với thời gian sống còn. Ưu điểm chính bao gồm khả năng xử lý dữ liệu bị thiếu không ngẫu nhiên, cải thiện độ chính xác ước lượng, và cung cấp framework thống nhất cho phân tích dữ liệu phức tạp với hiệu ứng ngẫu nhiên linh hoạt.

4.1. Ứng dụng trong nghiên cứu HIV AIDS và tế bào CD4

Trong nghiên cứu HIV/AIDS, mô hình hóa kết hợp cho phép đánh giá chính xác mối liên hệ giữa nồng độ tế bào CD4 và thời gian sống. Nồng độ CD4 được đo lường định kỳ, tạo thành dữ liệu dọc. Thời gian tử vong hoặc tiến triển AIDS là biến thời gian sự kiện. Joint model liên kết hai quá trình, đánh giá tác động của quá trình suy giảm CD4 lên nguy cơ tử vong. Mô hình cũng hỗ trợ phân phối linh hoạt cho hiệu ứng ngẫu nhiên, phù hợp với dữ liệu thực tế có phân phối không chuẩn. Kết quả có ý nghĩa quan trọng trong ra quyết định lâm sàng và đánh giá hiệu quả điều trị kháng retrovirus.

4.2. Ứng dụng trong nghiên cứu sinh học và lĩnh vực khác

Mô hình hóa kết hợp mở rộng sang nhiều lĩnh vực ngoài y học. Trong nghiên cứu sinh học quần thể, dữ liệu sinh sản ruồi giấm Địa Trung Hải gồm 251 ruồi cái, mỗi con theo dõi từ 22 đến 99 ngày, được phân tích để hiểu mối liên hệ giữa mẫu hình đẻ trứng và tuổi thọ. Trong kỹ thuật và công nghiệp, joint model dự đoán thời gian hỏng hóc thiết bị dựa trên dữ liệu giám sát thời gian thực. Trong tài chính, phương pháp phân tích mối liên hệ giữa biến động thị trường và thời gian vỡ nợ. Tính linh hoạt của framework cho phép tùy chỉnh phù hợp đặc điểm từng lĩnh vực.

21/04/2026

Bạn đang xem trước tài liệu:

Joint modeling of longitudinal and time to event data

Tải đầy đủ

Trích đoạn nội dung tài liệu

Joint Modeling of Longitudinal and Time-to-Event Data MONOGRAPHS ON STATISTICS AND APPLIED PROBABILITY General Editors F. Stochastic Population Models in Ecology and Epidemiology M. Monte Carlo Methods J. The Statistical Analysis of Series of Events D. Probability, Statistics and Time M. The Analysis of Contingency Tables B. Multivariate Analysis in Behavioural Research A. Stochastic Abundance Models S. Some Basic Theory for Statistical Inference E. Identification of Outliers D. Finite Mixture Distributions B. Distribution-Free Statistical Methods, 2nd edition J. Residuals and Influence in Regression R. Applications of Queueing Theory, 2nd edition G. Risk Theory, 3rd edition R. Pentikäinen and E. Analysis of Survival Data D. An Introduction to Latent Variable Models B. Stochastic Modelling and Control M. The Statistical Analysis of Composition Data J. Density Estimation for Statistics and Data Analysis B. Regression Analysis with Applications G. Sequential Methods in Statistics, 3rd edition G. Tensor Methods in Statistics P. Transformation and Weighting in Regression R. Asymptotic Techniques for Use in Statistics O. Bandorff-Nielsen and D. Analysis of Binary Data, 2nd edition D. Analysis of Infectious Disease Data N. Design and Analysis of Cross-Over Trials B. Empirical Bayes Methods, 2nd edition J. Symmetric Multivariate and Related Distributions K. Generalized Linear Models, 2nd edition P. Cyclic and Computer Generated Designs, 2nd edition J. Analog Estimation Methods in Econometrics C. Subset Selection in Regression A. Analysis of Repeated Measures M. Statistical Reasoning with Imprecise Probabilities P. Generalized Additive Models T. Inspection Errors for Attributes in Quality Control N. The Analysis of Contingency Tables, 2nd edition B. The Analysis of Quantal Response Data B. Longitudinal Data with Serial Correlation—A State-Space Approach R. Differential Geometry and Statistics M. Markov Models and Optimization M. Networks and Chaos—Statistical and Probabilistic Aspects O. Number-Theoretic Methods in Statistics K. Inference and Asymptotics O. Barndorff-Nielsen and D. Practical Risk Theory for Actuaries C. Pentikäinen and M. Predictive Inference—An Introduction S. Model-Free Curve Estimation M. An Introduction to the Bootstrap B. Nonparametric Regression and Generalized Linear Models P. Statistics for Long Memory Processes J. Nonlinear Models for Repeated Measurement Data M. Measurement Error in Nonlinear Models R. Analyzing and Modeling Rank Data J. Time Series Models—In Econometrics, Finance and Other Fields D. Local Polynomial Modeling and its Applications J. Multivariate Dependencies—Models, Analysis and Interpretation D. Statistical Inference—Based on the Likelihood A. Bayes and Empirical Bayes Methods for Data Analysis B. Hidden Markov and Other Models for Discrete-Valued Time Series I. Statistical Evidence—A Likelihood Paradigm R. Analysis of Incomplete Multivariate Data J. Multivariate Models and Dependence Concepts H. Theory of Sample Surveys M. Theory of Dispersion Models B. Mixed Poisson Processes J. Variance Components Estimation—Mixed Models, Methodologies and Applications P. Bayesian Methods for Finite Population Sampling G. Stochastic Geometry—Likelihood and computation O. Computer-Assisted Analysis of Mixtures and Applications—Meta-Analysis, Disease Mapping and Others D. Classification, 2nd edition A. Semimartingales and their Statistical Inference B. Statistical Aspects of BSE and vCJD—Models for Epidemics C. Set-Indexed Martingales G. The Theory of the Design of Experiments D. Complex Stochastic Systems O. Multidimensional Scaling, 2nd edition T. Algebraic Statistics—Computational Commutative Algebra in Statistics G. Analysis of Time Series Structure—SSA and Related Techniques N. Subjective Probability Models for Lifetimes Fabio Spizzichino (2001) 92. Empirical Likelihood Art B. Statistics in the 21st Century Adrian E. Tanner, and Martin T. Accelerated Life Models: Modeling and Statistical Analysis Vilijandas Bagdonavicius and Mikhail Nikulin (2001) 95. Subset Selection in Regression, Second Edition Alan Miller (2002) 96. Topics in Modelling of Clustered Data Marc Aerts, Helena Geys, Geert Molenberghs, and Louise M. Components of Variance D. Design and Analysis of Cross-Over Trials, 2nd Edition Byron Jones and Michael G. Extreme Values in Finance, Telecommunications, and the Environment Bärbel Finkenstädt and Holger Rootzén (2003) 100. Statistical Inference and Simulation for Spatial Point Processes Jesper Møller and Rasmus Plenge Waagepetersen (2004) 101. Hierarchical Modeling and Analysis for Spatial Data Sudipto Banerjee, Bradley P. Carlin, and Alan E. Diagnostic Checks in Time Series Wai Keung Li (2004) 103. Stereology for Statisticians Adrian Baddeley and Eva B. Gaussian Markov Random Fields: Theory and Applications Håvard Rue and Leonhard Held (2005) 105. Measurement Error in Nonlinear Models: A Modern Perspective, Second Edition Raymond J. Carroll, David Ruppert, Leonard A. Stefanski, and Ciprian M. Generalized Linear Models with Random Effects: Unified Analysis via H-likelihood Youngjo Lee, John A. Nelder, and Yudi Pawitan (2006) 107. Statistical Methods for Spatio-Temporal Systems Bärbel Finkenstädt, Leonhard Held, and Valerie Isham (2007) 108. Nonlinear Time Series: Semiparametric and Nonparametric Methods Jiti Gao (2007) 109. Missing Data in Longitudinal Studies: Strategies for Bayesian Modeling and Sensitivity Analysis Michael J. Daniels and Joseph W. Hidden Markov Models for Time Series: An Introduction Using R Walter Zucchini and Iain L. ROC Curves for Continuous Data Wojtek J. Krzanowski and David J. Antedependence Models for Longitudinal Data Dale L. Zimmerman and Vicente A. Mixed Effects Models for Complex Data Lang Wu (2010) 114. Intoduction to Time Series Modeling Genshiro Kitagawa (2010) 115. Expansions and Asymptotics for Statistics Christopher G. Statistical Inference: An Integrated Bayesian/Likelihood Approach Murray Aitkin (2010) 117. Circular and Linear Regression: Fitting Circles and Lines by Least Squares Nikolai Chernov (2010) 118. Simultaneous Inference in Regression Wei Liu (2010) 119. Robust Nonparametric Statistical Methods, Second Edition Thomas P. Hettmansperger and Joseph W. Statistical Inference: The Minimum Distance Approach Ayanendranath Basu, Hiroyuki Shioya, and Chanseok Park (2011) 121. Smoothing Splines: Methods and Applications Yuedong Wang (2011) 122. Extreme Value Methods with Applications to Finance Serguei Y. Dynamic Prediction in Clinical Survival Analysis Hans C. van Houwelingen and Hein Putter (2012) 124. Statistical Methods for Stochastic Differential Equations Mathieu Kessler, Alexander Lindner, and Michael Sørensen (2012) 125. Maximum Likelihood Estimation for Sample Surveys R. Steel, Suojin Wang, and A. Mean Field Simulation for Monte Carlo Integration Pierre Del Moral (2013) 127. Analysis of Variance for Functional Data Jin-Ting Zhang (2013) 128. Statistical Analysis of Spatial and Spatio-Temporal Point Patterns, Third Edition Peter J. Constrained Principal Component Analysis and Related Techniques Yoshio Takane (2014) 130. Randomised Response-Adaptive Designs in Clinical Trials Anthony C. Atkinson and Atanu Biswas (2014) 131. Theory of Factorial Design: Single- and Multi-Stratum Experiments Ching-Shui Cheng (2014) 132. Quasi-Least Squares Regression Justine Shults and Joseph M. Data Analysis and Approximate Models: Model Choice, Location-Scale, Analysis of Variance, Nonparametric Regression and Image Analysis Laurie Davies (2014) 134. Dependence Modeling with Copulas Harry Joe (2014) 135. Hierarchical Modeling and Analysis for Spatial Data, Second Edition Sudipto Banerjee, Bradley P. Carlin, and Alan E. Sequential Analysis: Hypothesis Testing and Changepoint Detection Alexander Tartakovsky, Igor Nikiforov, and Michèle Basseville (2015) 137. Robust Cluster Analysis and Variable Selection Gunter Ritter (2015) 138. Design and Analysis of Cross-Over Trials, Third Edition Byron Jones and Michael G. Introduction to High-Dimensional Statistics Christophe Giraud (2015) 140. Pareto Distributions: Second Edition Barry C. Bayesian Inference for Partially Identified Models: Exploring the Limits of Limited Data Paul Gustafson (2015) 142. Models for Dependent Time Series Granville Tunnicliffe Wilson, Marco Reale, John Haywood (2015) 143. Statistical Learning with Sparsity: The Lasso and Generalizations Trevor Hastie, Robert Tibshirani, and Martin Wainwright (2015) 144. Measuring Statistical Evidence Using Relative Belief Michael Evans (2015) 145. Stochastic Analysis for Gaussian Random Processes and Fields: With Applications Vidyadhar S. Mandrekar and Leszek Gawarecki (2015) 146. Semialgebraic Statistics and Latent Tree Models Piotr Zwiernik (2015) 147. Inferential Models: Reasoning with Uncertainty Ryan Martin and Chuanhai Liu (2016) 148. Perfect Simulation Mark L. State-Space Methods for Time Series Analysis: Theory, Applications and Software Jose Casals, Alfredo Garcia-Hiernaux, Miguel Jerez, Sonia Sotoca, and A. Hidden Markov Models for Time Series: An Introduction Using R, Second Edition Walter Zucchini, Iain L. MacDonald, and Roland Langrock (2016) 151. Joint Modeling of Longitudinal and Time-to-Event Data Robert M. Elashoff, Gang Li, and Ning Li (2016) Monographs on Statistics and Applied Probability 151 Joint Modeling of Longitudinal and Time-to-Event Data Robert M. Elashoff, Gang Li, and Ning Li UCLA Departments of Biostatistics and Biomathematics Los Angeles, California, USA CRC Press Taylor & Francis Group 6000 Broken Sound Parkway NW, Suite 300 Boca Raton, FL 33487-2742 © 2017 by Taylor & Francis Group, LLC CRC Press is an imprint of Taylor & Francis Group, an Informa business No claim to original U. Government works Printed on acid-free paper Version Date: 20160607 International Standard Book Number-13: 978-1-4398-0782-8 (Hardback) This book contains information obtained from authentic and highly regarded sources. Reasonable efforts have been made to publish reliable data and information, but the author and publisher cannot assume responsibility for the validity of all materials or the consequences of their use. The authors and publishers have attempted to trace the copyright holders of all material reproduced in this publication and apologize to copyright holders if permission to publish in this form has not been obtained. If any copyright material has not been acknowledged please write and let us know so we may rectify in any future reprint. Except as permitted under U. Copyright Law, no part of this book may be reprinted, reproduced, transmitted, or utilized in any form by any electronic, mechanical, or other means, now known or hereafter invented, including photocopying, microfilming, and recording, or in any information stor- age or retrieval system, without written permission from the publishers. For permission to photocopy or use material electronically from this work, please access www.com (http://www.com/) or contact the Copyright Clearance Center, Inc. (CCC), 222 Rosewood Drive, Danvers, MA 01923, 978-750-8400. CCC is a not-for-profit organization that pro- vides licenses and registration for a variety of users. For organizations that have been granted a photo- copy license by the CCC, a separate system of payment has been arranged. Trademark Notice: Product or corporate names may be trademarks or registered trademarks, and are used only for identification and explanation without intent to infringe. Visit the Taylor & Francis Web site at http://www.com and the CRC Press Web site at http://www.com To David and Michael - R.E To Yan, Victor, Sophia and Emily - G. To Yi and Eric - N. Contents Preface xvii 1 Introduction and Examples 1 1.1 Scleroderma Lung Study 1 1.2 Stroke Study: the NINDS rt-PA trial 3 1.3 ENABLE II Study 7 1.4 Milk Protein Trial 7 1.6 Medfly Fecundity Data 10 1.7 Bladder Cancer Study 11 1.8 Renal Graft Failure Study 13 1.11 AIDS Clinical Trial 15 2 Methods for Longitudinal Measurements with Ignorable Missing Data 17 2.2 Missing Data Mechanisms 17 2.3 Linear and Generalized Linear Mixed Effects Models 20 2.1 Linear Mixed Effects Models 20 General Form of Linear Mixed Effects Models 20 Estimation and Inference 21 xi xii CONTENTS 2.2 Generalized Linear Mixed Effects Models 26 Model Assumptions 27 Estimation and Inference 28 2.4 Generalized Estimating Equations 29 2.2 Weighted Generalized Estimating Equations 33 2.1 Multivariate Longitudinal Data Analysis 34 2.2 Pseudo-Likelihood Methods for Longitudinal Data 34 2.3 Missing Data Imputation 35 3 Methods for Time-to-Event Data 41 3.2 Survival Function and Hazard Function 42 3.3 Estimation of a Survival Function 43 3.1 The Kaplan–Meier Estimate 43 3.2 Asymptotic Inference 44 Confidence Intervals for S(t) 44 Transformation-Based Confidence Intervals for S(t) 44 Nonparametric Likelihood Ratio Confidence Intervals for S(t) 45 3.4 Cox’s Semiparametric Multiplicative Hazards Model 45 3.2 Partial Likelihood 47 Rt 3.3 Estimation of β and Λ0 (t) = 0 λ0 (s)ds 48 3.4 Prediction of a Conditional Survival Function 49 Time-Independent Covariates 49 Time-Dependent Covariates 49 3.5 Remark on Cox’s Model with Intermittently Measured Time-Dependent Covariates and Measurement Error 50 3.5 Accelerated Failure Time Models with Time-Independent Covariates 50 CONTENTS xiii 3.1 Parametric AFT Models 51 3.2 Semiparametric AFT Model 52 Synthetic Data Method 53 The Buckley–James Method 54 Linear Rank Method 55 3.6 Accelerated Failure Time Model with Time-Dependent Covari- ates 56 3.2 Rank-Based Estimation 57 3.7 Methods for Competing Risks Data 58 3.1 Basic Quantities for Competing Risks Data 59 3.2 Latent Variable Representation of Competing Risks Data 60 3.3 Estimation of the Cumulative Cause-Specific Hazard and Cumulative Incidence 61 3.4 Regression Models for a Cause-Specific Hazard 62 Multiplicative Cause-Specific Hazards Model 62 Accelerated Failure Time Model 63 3.5 Regression Models for Cumulative Incidence 63 Multiplicative Subdistribution Hazards Model 63 3.

Nội dung được bảo vệ bản quyền — Tải xuống đầy đủ

Mô hình hóa kết hợp dữ liệu dọc và thời gian sự kiện trong nghiên cứu thống kê

I. Tổng quan về mô hình hóa kết hợp dữ liệu dọc và thời gian sống

1.1. Khái niệm dữ liệu dọc trong nghiên cứu

1.2. Đặc trưng dữ liệu thời gian đến sự kiện

II. Thách thức trong phân tích dữ liệu dọc và thời gian sự kiện

2.1. Vi phạm giả định phân phối chuẩn hiệu ứng ngẫu nhiên

2.2. Vấn đề dữ liệu bị thiếu và kiểm duyệt thông tin

III. Phương pháp mô hình hóa kết hợp longitudinal và survival

3.1. Mô hình tuyến tính hỗn hợp cho dữ liệu dọc

3.2. Mô hình thời gian sự kiện trong framework kết hợp

IV. Ứng dụng thực tiễn của mô hình hóa kết hợp trong nghiên cứu

4.1. Ứng dụng trong nghiên cứu HIV AIDS và tế bào CD4

4.2. Ứng dụng trong nghiên cứu sinh học và lĩnh vực khác

THÔNG TIN CHI TIẾT

Tác giả: Robert M. Elashoff

Trường học: University of California, Los Angeles

Chuyên ngành: Thống kê

Đề tài: Joint Modeling of Longitudinal and Time-to-Event Data

Loại tài liệu: Sách chuyên khảo

Năm xuất bản: 2017

Địa điểm: Boca Raton

Mô hình hóa kết hợp dữ liệu dọc và thời gian sự kiện trong nghiên cứu thống kê

I. Tổng quan về mô hình hóa kết hợp dữ liệu dọc và thời gian sống

1.1. Khái niệm dữ liệu dọc trong nghiên cứu

1.2. Đặc trưng dữ liệu thời gian đến sự kiện

II. Thách thức trong phân tích dữ liệu dọc và thời gian sự kiện

2.1. Vi phạm giả định phân phối chuẩn hiệu ứng ngẫu nhiên

2.2. Vấn đề dữ liệu bị thiếu và kiểm duyệt thông tin

III. Phương pháp mô hình hóa kết hợp longitudinal và survival

3.1. Mô hình tuyến tính hỗn hợp cho dữ liệu dọc

3.2. Mô hình thời gian sự kiện trong framework kết hợp

IV. Ứng dụng thực tiễn của mô hình hóa kết hợp trong nghiên cứu

4.1. Ứng dụng trong nghiên cứu HIV AIDS và tế bào CD4

4.2. Ứng dụng trong nghiên cứu sinh học và lĩnh vực khác

TÀI LIỆU LIÊN QUAN

THÔNG TIN CHI TIẾT

Tác giả: Robert M. Elashoff

Trường học: University of California, Los Angeles

Chuyên ngành: Thống kê

Đề tài: Joint Modeling of Longitudinal and Time-to-Event Data

Loại tài liệu: Sách chuyên khảo

Năm xuất bản: 2017

Địa điểm: Boca Raton