Développement et validation d’un modèle d’apprentissage automatique pour la détection précise des erreurs d’identite chez les patients hospitalisés.

Auteurs: Tortosa-Carreres J, Vañó-Bellver A, Martínez-Cerezuela A, Fuster-Lluch Ó, García-Ruiz L, Rodríguez-Romero E, Sierra-Rivera A, Comes-Raga A, Cátedra C, Tadeo-Garisto V, Igumnova-Dubovikova A, Gisbert-Criado R, Sahuquillo-Frias L, Laiz-Marro B
Journal: Clin Chem Lab Med
Date de publication: 2026-02-24
PMID: 41147432
DOI: 10.1515/cclm-2025-0564

Résumé

OBJECTIFS : Développer et valider un modèle d'apprentissage automatique basé sur des paramètres biochimiques et hématologiques de routine disponibles pour détecter les erreurs de mauvais sang dans le tube (WBIT) chez les patients hospitalisés.
MÉTHODES : Une étude rétrospective multicentrique incluant une cohorte interne (IC) and deux cohortes de validation externe (EVC, EVC2). L'IC était équilibrée (50 % correct, 50 % WBIT ; 25 % réel, 25 % simulé), tandis qu'EVC (n=800) et EVC2 (n=460) représentaient des scénarios plus réalistes (95 % correct, 5 % WBIT ; également répartis entre réel et simulé). Les paramètres présents dans ≥ 95 % des demandes ont été sélectionnés, et leur variation normalisée par rapport au résultat immédiatement précédent a été calculée. L'IC a été divisée en un ensemble d'entraînement (IC-TS, n=324) et un ensemble de validation interne (IC-VS, n=108). La sélection des caractéristiques a été affinée avec Elastic Net avant l'entraînement d'un modèle XGBoost. Les performances ont été évaluées dans IC-VS, EVC, et EVC2. Pour l'étalonnage, la capacité discriminante du modèle a également été comparée à une approche multivariée basée sur Mahalanobis et aux contrôles delta univariés au sein d'IC-TS/IC-VS.
RÉSULTATS : Seize des 25 variables candidates ont été retenues. Le modèle a atteint des valeurs ROC-AUC de 0,98-0,99 et des valeurs PR-AUC de 0,93-0,99 dans toutes les cohortes de validation. Le recalibrage a amélioré la valeur prédictive positive et le bénéfice net en réduisant les faux positifs, avec une légère diminution de la sensibilité, bien que toutes les valeurs soient restées ≥90 %. Les spécificités variaient de 98 à 99 %. Le modèle a systématiquement surpassé à la fois l'approche multivariée de Mahalanobis et les contrôles delta univariés au sein de la cohorte interne.
CONCLUSIONS : Ce modèle d'apprentissage automatique, exploitant des paramètres de laboratoire de routine largement disponibles, montre un fort potentiel d'intégration dans les flux de travail cliniques, améliorant la détection WBIT et la sécurité des patients.

Abstract (original)

OBJECTIVES: To develop and validate a machine-learning model based on routinely available biochemical and hematological parameters for detecting wrong blood in tube (WBIT) errors in hospitalized patients.
METHODS: A retrospective multicenter study including one internal cohort (IC) and two external validation cohorts (EVC, EVC2). The IC was balanced (50 % correct, 50 % WBIT; 25 % real, 25 % simulated), while EVC (n=800) and EVC2 (n=460) represented more realistic scenarios (95 % correct, 5 % WBIT; equally distributed between real and simulated). Parameters present in ≥ 95 % of requests were selected, and their normalized variation from the immediately preceding result was calculated. The IC was divided into a training set (IC-TS, n=324) and an internal validation set (IC-VS, n=108). Feature selection was refined with Elastic Net before training an XGBoost model. Performance was assessed in IC-VS, EVC, and EVC2. For benchmarking, the model's discriminative ability was also compared with a multivariate Mahalanobis-based approach and with univariate delta checks within IC-TS/IC-VS.
RESULTS: Sixteen of 25 candidate variables were retained. The model achieved ROC-AUC values of 0.98-0.99 and PR-AUC values of 0.93-0.99 across all validation cohorts. Recalibration improved positive predictive value and net benefit by reducing false positives, with a slight decrease in sensitivity, although all values remained ≥90 %. Specificities ranged from 98 to 99 %. The model consistently outperformed both the multivariate Mahalanobis approach and univariate delta checks within the internal cohort.
CONCLUSIONS: This machine-learning model, leveraging widely available routine laboratory parameters, shows strong potential for integration into clinical workflows, enhancing WBIT detection and improving patient safety.

Sous-famille

BIOLOGIE CLINIQUE

Mots-clés

delta check machine learning preanalytical errors wrong blood in tube

Termes MeSH

Humans Machine Learning Retrospective Studies Female Hospitalization Male Medical Errors Middle Aged ROC Curve

Voir sur PubMed Accéder via DOI

Retour aux articles PubMed