Bitte benutzen Sie diese Referenz, um auf diese Ressource zu verweisen: doi:10.22028/D291-35023
Titel: Estimation of adjusted relative risks in log-binomial regression
VerfasserIn: Bekhit, Adam
Sprache: Englisch
Erscheinungsjahr: 2021
DDC-Sachgruppe: 004 Informatik
510 Mathematik
610 Medizin, Gesundheit
Dokumenttyp: Dissertation
Abstract: **Problem statement:** For binary outcome data, the relative risk (RR) is an essential measure of association, which can be estimated directly for prospective studies. Calculating the odds ratio (OR) can overestimate and magnify the risk heavily, especially if dealing with a disease outcome of high incidence. In such cases OR should be avoided and RR can be used. The log-binomial model is a straightforward statistical approach in the case of risk adjustment and estimation, also it is much easier to interpret. However, the log-binomial model might fail or have difficulties maximizing log-likelihood function due to numerical instability, implicit parameter constraints, or naïve starting value, which leads to a dramatic increase of the required number of iterations therefore convergence failure. **Approach:** In this study, a modified Newton-type algorithm was developed for solving the maximum likelihood estimation problem under linear constraints. Moreover, a new system of linear inequality constraints on the number of covariates was imposed. In this approach, the log-likelihood function of the log-binomial regression model is maximized sequentially. The modified-newton-type algorithm proceeds iteratively by generating a sequence of estimates which solves the quadratic sub-problems obtained from a second-order Taylor approximation and converges under the linear inequality constraints. **Monte Carlo Simulation design:** For validation and evaluation purposes, a large full-factorial simulation study was conducted in order to study the behavior of the method "squadP" compared with other methods investigated in this research such as Fisher scoring, EM-type, BFGS, and Nelder-Mead. Assessment of coverage probability, model accuracy, and model bias were the primary objectives, while at the same time allowing for many different scenarios (varying number of events, sample size, and number of covariates). The 12 underlying covariates were generated via copula package in R with a specified correlation structure between all variables. In total, 104800 data sets were generated and analyzed for 108 scenarios. The complete simulation study including pseudo-random number generator using L'Ecuyer algorithm was conducted using parallel processing in R 3.5. Additionally, the running time of the six methods was computed. **Results:** The proposed modified Newton-type algorithm SquadP generally showed a significantly higher convergence rate than EM-type, Fisher-scoring, BFGS, and Nelder-Mead particularly in scenarios with small samples and small event probabilities. SquadP and Poisson(log) showed a similar convergence rate in most scenarios with significant excel of SquadP error measurements. EM-type and SquadP showed similar bias, coverage probabilities, and error measurements in most cases with an insignificant difference however EM-type had in most scenarios the smallest convergence rate. Furthermore, SquadP converged always faster than EM-type algorithm with a highly significant difference.
**Problemstellung:** Für binäre Ergebnisdaten ist das relative Risiko (RR) ein wesentliches Assoziationsmaß, das für prospektive Studien direkt geschätzt werden kann. Die Berechnung des Odds Ratio (OR) kann das Risiko stark überschätzen und vergrößern, insbesondere wenn es sich um ein Krankheitsergebnis mit hoher Inzidenz handelt. In solchen Fällen sollte OR vermieden werden und RR kann verwendet werden. Das Log-Binomial-Modell ist ein einfacher statistischer Ansatz für die Risikoanpassung und -schätzung und auch viel einfacher zu interpretieren. Das Log-Binomial-Modell kann jedoch Schwierigkeiten haben und die Log-Likelihood-Funktion aufgrund numerischer Instabilität, impliziter Parameterbeschränkungen oder naiven Startwerts nicht maximieren, was zu einer dramatischen Zunahme der Anzahl der erforderlichen Iterationen führt, weshalb die Konvergenz fehlschlägt. **Ansatz:** In dieser Studie wurde ein modifizierter Newton-Algorithmus entwickelt, um das Problem der Schätzung der maximalen Wahrscheinlichkeit unter linearen Bedingungen zu lösen. Wir haben auch ein neues System linearer Ungleichheitsbeschränkungen für die Anzahl der Kovariaten eingeführt. Bei diesem Ansatz maximieren wir die Log-Wahrscheinlichkeit des log-binomialen Regressionsmodells nacheinander. Der Algorithmus vom modifizierten Newton-Typ geht iterativ vor, indem eine Folge von Schätzungen erzeugt wird, die die quadratischen Unterprobleme löst, die aus einer Taylor-Näherung zweiter Ordnung erhalten werden, und unter den linearen Ungleichungsbeschränkungen konvergiert. **Monte-Carlo-Simulationsdesign:** Zu Validierungs- und Bewertungszwecken wurde eine große vollfaktorielle Simulationsstudie durchgeführt, um das Verhalten der Methode (squadP) im Vergleich zu anderen in dieser Studie untersuchten Methoden wie Fisher Scoring, EM-type, BFGS und Nelder-Mead. Die Bewertung der Abdeckungswahrscheinlichkeit, der Modellgenauigkeit und der Modellverzerrung waren die Hauptziele, wobei gleichzeitig viele verschiedene Szenarien berücksichtigt wurden (unterschiedliche Anzahl von Ereignissen, Stichprobengröße und Anzahl von Kovariaten). Die 12 zugrunde liegenden Kovariaten wurden über ein Copula-Paket in R mit einer festgelegten Korrelationsstruktur zwischen allen Variablen generiert. Insgesamt wurden 104800 Datensätze generiert und für 108 Szenarien analysiert. Die vollständige Simulationsstudie einschließlich Zufallszahlengenerator unter Verwendung des L'Ecuyer-Algorithmus wurde unter Verwendung der Parallelverarbeitung in R 3.5 durchgeführt. Zusätzlich wurde die Laufzeit der sechs Methoden berechnet. **Ergebnisse:** Das vorgeschlagene modifizierte Newton-Algorithmus SquadP zeigte im Allgemeinen eine signifikant höhere Konvergenzrate als EM-Typ, Fisher-Scoring, BFGS und Nelder-Mead, insbesondere in Szenarien mit kleinen Stichproben und kleinen Ereigniswahrscheinlichkeiten. SquadP und Poisson(log) zeigten in den meis- ten Szenarien eine ähnliche Konvergenzrate mit einer signifikanten Überlegenheit der SquadP-Fehlermessungen. EM-Typ und SquadP zeigten in den meisten Fällen ähnliche Verzerrungen, Abdeckungswahrscheinlichkeiten und Fehlermessungen mit unbedeutendem Unterschied, jedoch hatte EM-Typ in den meisten Szenarien die geringste Konvergenzrate. Darüber hinaus konvergierte SquadP immer schneller als ein EM-Algorithmus mit einem sehr signifikanten Unterschied.
Link zu diesem Datensatz: urn:nbn:de:bsz:291--ds-350232
hdl:20.500.11880/32091
http://dx.doi.org/10.22028/D291-35023
Erstgutachter: Wagenpfeil, Stefan
Tag der mündlichen Prüfung: 5-Okt-2021
Datum des Eintrags: 21-Dez-2021
Fakultät: M - Medizinische Fakultät
Fachrichtung: M - Medizinische Biometrie, Epidemiologie und medizinische Informatik
Professur: M - Prof. Dr. Stefan Wagenpfeil
Sammlung:SciDok - Der Wissenschaftsserver der Universität des Saarlandes

Dateien zu diesem Datensatz:
Datei Beschreibung GrößeFormat 
BEKHIT_PhD_Thesis.pdfDoctoral thesis (Main article)5 MBAdobe PDFÖffnen/Anzeigen


Alle Ressourcen in diesem Repository sind urheberrechtlich geschützt.