banner
Centre d'Information
Qualité et performance sont les maîtres mots de nos produits.

Apprentissage automatique

Jun 13, 2023

Rapports scientifiques volume 13, Numéro d'article : 7749 (2023) Citer cet article

320 accès

Détails des métriques

Un système intelligent artificiel intelligent (SAIS) pour le dénombrement de la densité d'Acinetobacter (AD) dans les plans d'eau représente une stratégie inestimable pour éviter les routines répétitives, laborieuses et chronophages associées à sa détermination. Cette étude visait à prédire la MA dans les plans d'eau à l'aide de l'apprentissage automatique (ML). Les données AD et les variables physicochimiques (PV) de trois rivières surveillées via des protocoles standard dans une étude d'un an ont été ajustées à 18 algorithmes ML. Les performances des modèles ont été évaluées à l'aide de mesures de régression. Le pH moyen, EC, TDS, salinité, température, TSS, TBS, DO, DBO et AD étaient de 7,76 ± 0,02, 218,66 ± 4,76 µS/cm, 110,53 ± 2,36 mg/L, 0,10 ± 0,00 PSU, 17,29 ± 0,21 °C, 80,17 ± 5,09 mg/L, 87,51 ± 5,41 NTU, 8,82 ± 0,04 mg/L, 4,00 ± 0,10 mg/L et 3,19 ± 0,03 log UFC/100 mL respectivement. Alors que les contributions des PV différaient en valeurs, AD a prédit la valeur par XGB [3,1792 (1,1040–4,5828)] et Cubist [3,1736 (1,1012–4,5300)] a surpassé les autres algorithmes. En outre, XGB (MSE = 0,0059, RMSE = 0,0770 ; R2 = 0,9912 ; MAD = 0,0440) et Cubist (MSE = 0,0117, RMSE = 0,1081, R2 = 0,9827 ; MAD = 0,0437) se sont classés respectivement premier et deuxième pour prédire la MA. La température était la caractéristique la plus importante pour prédire la MA et se classait au premier rang pour 10/18 algorithmes ML représentant une perte moyenne de RMSE de 43,00 à 83,30 % après 1 000 permutations. La dépendance partielle des deux modèles et la sensibilité des diagnostics résiduels ont révélé leurs précisions de pronostic AD efficaces dans les plans d'eau. En conclusion, une application SAIS XGB/Cubist/XGB-Cubist entièrement développée pour la surveillance de la DA dans les plans d'eau pourrait être déployée pour raccourcir le délai d'exécution pour décider de la qualité microbiologique des plans d'eau pour l'irrigation et à d'autres fins.

Les espèces d'Acinetobacter appartiennent au groupe des bactéries Gram-négatives aérobies qui sont des coccobacilles encapsulés non mobiles, non fermentatifs, catalase positive, oxydase négative, ayant une teneur en ADN G+C de 39 à 47 mol1,2. Sur le plan taxonomique, les scientifiques ont identifié 68 espèces validées dans le genre Acinetobacter, et de nombreuses autres doivent encore être délimitées en espèces3,4,5. De nombreuses espèces d'Acinetobacter se trouvent naturellement dans différents environnements, notamment le sol, l'eau, l'air, les eaux usées, les fomites, la peau humaine, les animaux et même les plantes6,7,8. Certaines espèces peuvent utiliser différents substrats, tels que les acides aminés, les glucides, les acides organiques et les hydrocarbures, tandis que certaines peuvent sécréter des enzymes industrielles comme la lipase et la protéase9,10. Cependant, peu d'espèces sont des pathogènes opportunistes pour l'homme. Par exemple, Acinetobacter baumannii est une espèce notoire bien connue en milieu hospitalier qui provoque des infections potentiellement mortelles telles que la pneumonie, les infections des voies respiratoires et urinaires, la septicémie et les infections des plaies, entre autres, en particulier chez les patients immunodéprimés11,12,13.

Les espèces d'Acinetobacter sont largement propagées via le milieu environnemental et peuvent propager de manière alarmante des gènes de résistance aux antimicrobiens dans l'environnement14,15. De plus, il a été rapporté que les usines de traitement des eaux usées (WWTP) alimentées par les afflux d'eaux usées des hôpitaux et des municipalités contribuent à la présence d'isolats d'Acinetobacter multirésistants (MDR) et extrêmement résistants aux médicaments (XDR) dans leurs effluents recevant des plans d'eau par rapport à d'autres sources15,16. Le rejet d'effluents de stations d'épuration augmente la prévalence d'Acinetobacter dans les cours d'eau récepteurs et favorise la résistance aux antimicrobiens et la transmission aux légumes irrigués15. La transmission d'Acinetobacter spp. (en particulier A. baumannii) - avec une résistance aux antimicrobiens et un taux de létalité élevés - sur des produits frais a été démontré et examiné par Carvalheira et al.17. Des espèces d'Acinetobacter avec différentes capacités de résistance allant de MDR à XDR ont été isolées dans des fruits et légumes frais (pommes, choux, melons, choux-fleurs, poivrons, champignons, laitue, concombres, bananes, radis, maïs sucré, carottes, pommes de terre, pêche, poire, fraise, pomme, céleri, tomate et radis) à une densité allant jusqu'à 50-1000 UFC/g18 à Hong Kong19, France20, Nigéria21, Liban22, Portugal23 et environnement agricole en Algérie24. En outre, les masses d'eau, en particulier les rivières rurales, par exemple, favorisent une utilisation récréative à des niveaux considérablement élevés par des personnes ignorant l'afflux/les apports d'effluents de station d'épuration et l'afflux d'agents pathogènes multirésistants préoccupants pour la santé publique, notamment Acinetobacter25.

La détermination et l'identification expérimentales de routine des espèces d'Acinetobacter et d'autres bactéries dans toutes les matrices (eau, aliments et échantillons cliniques, etc.) à l'aide du nombre le plus probable, du comptage direct sur plaque, des tests d'adénosine triphosphate et des méthodes de filtration sur membrane sont généralement laborieuses, répétitives, chronophages (période d'incubation) et coûteuses, nécessitant des connaissances spécialisées qui pourraient ne pas être facilement disponibles dans la plupart des contextes. Par conséquent, il existe un besoin urgent de moyens rapides, fiables et rentables qui ne nécessitent pas ou peu de savoir-faire technique pour évaluer la densité d'Acinetobacter (AD) dans les plans d'eau et d'autres matrices afin d'assurer un délai d'exécution court nécessaire pour prendre des décisions éclairées en matière de qualité microbiologique. Il est émis l'hypothèse que la DA dans les plans d'eau pourrait être prédite avec précision et fiabilité en utilisant des cadres d'intelligence d'apprentissage automatique qui dépendent de la relation dynamique entre la DA basée sur les méthodes de détermination ci-dessus et les variables physicochimiques du plan d'eau et d'autres matrices de manière peu coûteuse et rapide. Ainsi, un système d'intelligence artificielle pour la détermination de la DA dans les plans d'eau recevant les effluents des stations d'épuration, qui sont ensuite utilisés comme eaux de source d'irrigation (ISW), serait une option préventive inestimable pour les défis de santé publique immédiats et futurs.

Les principaux mérites des modèles ML résident dans leur capacité à surmonter les problèmes associés aux modèles statistiques traditionnels dans la capture et la prédiction d'interactions multidimensionnelles dans des données volumineuses en « apprenant » des modèles profonds26. Les frameworks ML et SAIS permettent une gestion proactive des événements plutôt que réactive. Ainsi, les ML et les SAIS trouvent des applications croissantes dans de nombreux secteurs, notamment la médecine, l'agriculture de précision, la gestion de l'environnement, la purification de l'eau, l'abondance de Vibrio sur les microplastiques, le traitement des eaux usées, les typologies de bassins versants et la qualité des eaux pluviales et la prédiction épidémiologique26,27,28,29,30 et l'application se développe sans cesse quotidiennement.

Par conséquent, la présente étude visait à prédire/déterminer la MA dans les plans d'eau (recevant les effluents des hôpitaux, des municipalités et des stations d'épuration) en utilisant ML sans les routines de laboratoire répétitives, laborieuses, coûteuses et chronophages pour réduire le délai d'exécution essentiel pour prendre des décisions éclairées en matière de qualité microbiologique (par exemple, pour l'irrigation et à d'autres fins).

Des échantillons d'eau ont été prélevés à l'aide d'une technique d'échantillonnage ponctuel dans la Great Fish River, la Keiskamma River et la Thyume River, servant de masses d'eau réceptrices pour les effluents d'eaux usées municipales et hospitalières (MHWE) en un ou plusieurs points le long de leur parcours dans la province du Cap oriental, en Afrique du Sud. Au moins cinq sites d'échantillonnage stratégiques basés sur l'importance socio-économique (par exemple, pêche, baignade, proximité des stations d'épuration, agriculture, pâturage, irrigation, barrage, etc.) de chaque rivière ont été sélectionnés pour la collecte d'échantillons. Sur les sites d'échantillonnage, la température de l'eau (TEMP), le pH, le total des solides dissous (TDS), la conductivité électrique (EC), la salinité (SAL) et l'oxygène dissous (DO) ont été déterminés in situ à l'aide d'un protocole instrumental standard à plusieurs paramètres (Hanna, modèle HI 9828). De plus, la turbidité des rivières (TBS) a été évaluée à l'aide d'un turbidimètre (HACH, modèle 2100P). Pour l'analyse microbiologique et la mesure de la demande biochimique en oxygène (DBO), des échantillons d'eau intermédiaires (25 à 30 cm de profondeur) ont été prélevés sur les mêmes sites d'échantillonnage en trois répétitions dans des bouteilles stériles en verre et en ambre, respectivement et stockés dans des glacières et transportés au laboratoire pour analyse avec 6 h de collecte31. Après cinq jours d'incubation des échantillons dans des flacons ambrés, la DBO des échantillons a été déterminée à l'aide d'un compteur de demande biochimique en oxygène (HACH, HQ 40 jours)31. La stratégie d'échantillonnage détaillée, la description des points d'échantillonnage et les cartes de la zone d'étude étaient telles que décrites dans notre étude précédente32.

La densité des espèces d'Acinetobacter dans les échantillons d'eau a été estimée par filtration membranaire31. En bref, 100 ml d'échantillons d'eau dilués en série ont été filtrés en trois itérations indépendantes à l'aide d'une membrane de cellulose à pores de 0,45 μm de Ø47 mm31. Ces membranes ont été placées aseptiquement sur des plaques Acinetobacter CHROMagar fraîchement préparées contenant des suppléments sélectifs (CHROMagar, Paris, France) selon les instructions du fabricant. Les plaques ont été incubées à 37°C pendant 24h. Toutes les colonies d'Acinetobacter présentées sous forme de coloration rouge sur les plaques CHROMagar après incubation ont été comptées et transformées en log (log UFC/100 mL). Tous les isolats ont été purifiés, validés comme négatifs à l'oxydase et évalués par une réaction en chaîne par polymérase spécifique à Acinetobacter. Cinquante pour cent (50 %) des stocks de glycérol de la culture pure ont été préparés et conservés à – 80 °C.

Les jeux de données ont d'abord été soumis à une corrélation de Pearson explicative et bivariée (r) [Eq. (1)] analyses. L'estimation des intervalles de confiance à 95 % (IC à 95 %) de la valeur r dans l'analyse de corrélation bivariée était basée sur la transformation r à z de Fisher avec ajustement du biais [Eq. (2)]. Pour éviter la multicolinéarité, où la valeur r entre deux variables ≥ 0,99, l'une d'entre elles a été abandonnée au hasard dans les modèles suivants (voir tableau 2). Chacune des deux variables peut être utilisée dans la mise en œuvre des modèles. De plus, pour la mise en œuvre des modèles, les ensembles de données ont été mis à l'échelle centrale de sorte que la moyenne = 0 et la racine carrée de la variance = 1 pour les variables. L'ensemble de données pour DTR n'a pas été mis à l'échelle.

où r est un coefficient de corrélation de Pearson avec des valeurs possibles de − 1 à 1 inclus. Ici, u et w représentent une paire de PV et h est la taille de l'échantillon.

La densité d'Acinetobacter (AD) a été modélisée comme une variable dépendante des variables physico-chimiques (PV) des rivières. Par conséquent, la valeur AD attendue conditionnelle (CE) aux instances de PV consistant en un vecteur de TEMP, DO, DBO, TSS, SAL et pH est dérivée comme \({\mathrm{CE}}_{AD|PVs}(AD)\). Ainsi, l'estimation de la moyenne AD peut être construite comme Eq. (3).

L'équation (1) a été implémentée via 18 algorithmes ML de régression qui ont la capacité robuste d'ajuster des variables multidimensionnelles de résultats ordinaux/continus, y compris la régression linéaire avec sélection pas à pas (LRSS), un RF, XGB, SVR, une régression linéaire (LR), une machine à gradient boosté (GBM), un réseau de neurones (NNT) (réseau 6–6–1 avec 49 poids multiples ; décroissance = 0,1), un KNN (k plus proche voisin), M5P, un arbre de régression (BRT), une régression cubiste, un arbre de décision (DTR), des splines de régression adaptative multivariée (MARS), ANN [avec une couche cachée à 6 nœuds (ANN6), une machine d'apprentissage extrême (ELM), deux couches cachées à 4 et 2 nœuds (ANN42) et deux couches cachées à 3 et 3 nœuds (ANN33) et un filet élastique (ENR)]. L'ensemble de données (540 observations, 6 variables après sélection des caractéristiques explicatives) a été divisé en un sous-ensemble d'apprentissage (70 %) pour l'estimation des coefficients des modèles et un sous-ensemble de validation (30 %) pour la justification du modèle. Dans toutes les implémentations ML de l'Eq. (1), dix paires d'ensembles de données de validation d'apprentissage différentes ont été générées via une validation croisée décuplée accompagnée de 3 répétitions et de 10 longueurs de mélodie. Les hyper-paramètres optimaux ont été dérivés et sélectionnés à l'aide d'un algorithme de recherche de grille. Les hyper-paramètres des modèles sont fournis en détail dans le matériel supplémentaire. Une discussion détaillée sur les forces et les faiblesses et l'application précédente des différents algorithmes peut être trouvée ailleurs et leur documentation.

La restitution explicative de toutes les contributions des variables dans les modèles était conforme à l'Eq. (4):

où t(j, w.) désigne la jème mesure de contribution de la variable à la prédiction du modèle à l'instance w et t0 est la prédiction moyenne du modèle33.

Les performances du modèle d'algorithmes MLI ont été déterminées par rapport à des données expérimentales basées sur les équations. (5)–(8) :

où h = numéro de l'échantillon ; f0() : modèle de base ; ri : résidu pour la ième observation, U : matrice des PV ; \(\underline{w}\) : vecteur de AD ; \(f\left(\widehat{\underline{\theta }},\underline{U}\right):\) modèle basé sur l'ensemble de données d'entraînement ; \(\widehat{\underline{\theta }} :\) valeurs estimées des coefficients du modèle ; et \({\widehat{\underline{w}}}_{i} :\) la prédiction du modèle équivalente à \({\mathrm{w}}_{i}\).

La RMSE a également été utilisée pour évaluer la perte moyenne d'abandon pour une importance variable après 1000 permutations34,35.

Des diagnostics résiduels et des profils de dépendance partielle des PV sur la DA prédite ont été générés pour évaluer la sensibilité du modèle. Le profil de dépendance partielle d'un modèle f() (c'est-à-dire la valeur AD anticipée/prédite à une instance par le modèle) et la variable de résultat Uj fixée à s (sur la distribution empirique/marginale de Uj (h), c'est-à-dire la distribution collective de tous les autres PV sans Uj) est créé selon les équations. (9) et (10):

L'implémentation de tous les modèles a été réalisée dans le logiciel R v.4.1.2.

Un résumé descriptif des variables physicochimiques et de la densité d'Acinetobacter des plans d'eau est présenté dans le tableau 1. Le pH moyen, l'EC, le TDS et le SAL des plans d'eau étaient de 7,76 ± 0,02, 218,66 ± 4,76 µS/cm, 110,53 ± 2,36 mg/L et 0,10 ± 0,00 PSU, respectivement. Alors que les moyennes TEMP, TSS, TBS et DO des rivières étaient de 17,29 ± 0,21 °C, 80,17 ± 5,09 mg/L, 87,51 ± 5,41 NTU et 8,82 ± 0,04 mg/L, respectivement, les DO5, DBO et AD correspondantes étaient de 4,82 ± 0,11 mg/L, 4,00 ± 0,10 mg/L. L et 3,19 ± 0,03 log UFC/100 mL respectivement.

La corrélation bivariée entre les PV appariés variait significativement d'une corrélation positive ou négative très faible à parfaite/très forte (tableau 2). De la même manière, la corrélation entre les différents PV et AD varie. Par exemple, une corrélation négligeable mais positive très faible existe entre AD et pH (r = 0,03, p = 0,422) et SAL (r = 0,06, p = 0,184) ainsi qu'une très faible corrélation inverse (négative) entre AD et TDS (r = − 0,05, p = 0,243) et EC (r = − 0,04, p = 0,339). Une corrélation significativement positive mais faible se produit entre AD et DBO (r = 0,26, p = 4,21E-10), et TSS (r = 0,26, p = 1,09E-09) et TBS (r = 0,26, 1,71E-09) alors que AD avait une faible corrélation inverse avec DO5 (r = -0,39, p = 1,31E-21). Alors qu'il y avait une corrélation positive modérée entre TEMP et AD (r = 0,43, p = 3,19E-26), une corrélation modérée mais inverse s'est produite entre AD et DO (r = -0,46, 1,26E-29).

La DA prédite par les modèles de régression de 18 ML variait à la fois en valeur moyenne et en couverture (gamme), comme le montre la Fig. 1. La DA prédite moyenne variait de 0,0056 unités logarithmiques par M5P à 3,2112 unités logarithmiques par SVR. La prédiction AD moyenne a diminué de SVR [3,2112 (1,4646–4,4399)], DTR [3,1842 (2,2312–4,3036)], ENR [3,1842 (2,1233–4,8208)], NNT [3,1836 (1,1399–4,2936)], BRT [3,1833 (1. 6890–4.3103)], RF [3.1795 (1.3563–4.4514)], XGB [3.1792 (1.1040–4.5828)], MARS [3.1790 (1.1901–4.5000)], LR [3.1786 (2.1895–4.7951)], LRSS [3. 1786 (2.1622–4.7911)], GBM [3.1738 (1.4328–4.3036)], Cubiste [3.1736 (1.1012–4.5300)], ELM [3.1714 (2.2236–4.9017)], KNN [3.1657 (1.4988–4.5001 )], ANET6 [0,6077 (0,0419–1,1504)], ANET33 [0,6077 (0,0950–0,8568)], ANET42 [0,6077 (0,0692–0,8568)] et M5P [0,0056 (− 0,6024–0,6916)]. Cependant, en termes de couverture de gamme, XGB [3,1792 (1,1040–4,5828)] et Cubist [3,1736 (1,1012–4,5300)] surpassent les autres modèles car ces modèles surestiment et sous-estiment AD à des valeurs inférieures et supérieures respectivement par rapport aux données brutes [3,1865 (1–4,5611)].

Comparaison de la DA prédite par le modèle ML dans les plans d'eau. Valeur AD brute/empirique RAW.

La figure 2 représente les contributions explicatives des PV à la prédiction AD par les modèles. Le sous-parcelle AR donne la magnitude absolue (représentant l'importance du paramètre) par laquelle une instance PV modifie la prédiction AD par chaque modèle à partir de sa valeur moyenne présentée sur l'axe vertical. Dans le LR, un changement absolu par rapport à la valeur moyenne du pH, de la DBO, du TSS, de l'OD, du SAL et de la TEMP correspondait à un changement absolu de 0,143, 0,108, 0,069, 0,0045, 0,04 et 0,004 unités dans la réponse/valeur de prédiction AD du LR. De plus, un flux de réponse absolu de 0,135, 0,116, 0,069, 0,057, 0,043 et 0,0001 dans la valeur de prédiction AD a été attribué au pH, DBO, TSS, OD. SAL et TEMP changent, respectivement, par LRSS. De même, le changement absolu de DO, DBO, TEMP, TSS, pH et SAL atteindrait 0,155, 0,061. 0,099, 0,144 et 0,297 changements de réponse de prédiction AD par KNN. De plus, la PV la plus contributive ou la plus importante dont le changement a largement influencé la réponse de prédiction AD était TEMP (diminue ou diminue les réponses jusqu'à 0,218) en RF. En résumé, les changements de réponse de prédiction AD étaient les plus élevés et les plus significativement influencés par la DBO (0,209), le pH (0,332), le TSS (0,265), la TEMP (0,6), le TSS (0,233), le SAL (0,198), le DBO (0,127), le DBO (0,11), le DO (0,028), le pH (0,114), le pH (0,14), le SAL (0,91) et le pH (0,427). ) dans XGB, BTR, NNT, DTR, SVR, M5P, ENR, ANET33, ANNET64, ANNET6, ELM, MARS et Cubist, respectivement.

Contribution spécifique au PV à dix-huit modèles ML prédisant la capacité de la DA dans les masses d'eau réceptrices MHWE. La valeur de référence moyenne de PV dans le ML est présentée sur l'axe des ordonnées. Les barres vertes/rouges représentent la valeur absolue de chaque contribution PV dans la prédiction de la MA.

Le tableau 4 présente les performances des dix-huit algorithmes de régression prédisant la DA compte tenu des PV des masses d'eau. En termes de MSE, RMSE et R2, XGB (MSE = 0,0059, RMSE = 0,0770 ; R2 = 0,9912) et Cubist (MSE = 0,0117, RMSE = 0,1081, R2 = 0,9827) se sont classés respectivement premier et deuxième, pour surpasser les autres modèles dans la prédiction de la MA. Alors que les mesures MSE et RMSE ont classé ANET6 (MSE = 0,0172, RMSE = 0,1310), ANRT42 (MSE = 0,0220, RMSE = 0,1483), ANET33 (MSE = 0,0253, RMSE = 0,1590), M5P (MSE = 0,0275, RMSE = 0,1657) et RF (MSE = 0,0282, RMSE = 0,1679) en position 3, 4, 5, 6 et 7 parmi les ML pour prédire AD, M5P (R2 = 0,9589 et RF (R2 = 0,9584) ont enregistré de meilleures performances en termes de métrique R au carré et ANET6 (MAD = 0,0856) et M5P (MAD = 0,086 3) en terme de métrique MAD parmi les 5 modèles.Mais cubiste (MAD = 0.0437) XGB (MAD = 0.0440) en terme de métrique MAD.

L'importance des caractéristiques de chaque PV par rapport au rééchantillonnage permutationnel sur la capacité prédictive des modèles ML pour prédire la MA dans les plans d'eau est présentée dans le tableau 3 et la figure S1. Les variables importantes identifiées se classent différemment d'un modèle à l'autre, la température étant classée en première position par 10/18 des modèles. Dans les 10 algorithmes/modèles, la température était responsable de la perte de décrochage RMSE moyenne la plus élevée, la température dans RF, XGB, Cubist, BRT et NNT représentant 0,4222 (45,90 %), 0,4588 (43,00 %), 0,5294 (50,82 %), 0,3044 (44,87 %) et 0,2424 (68,77 %) respectivement, tandis que 0 0,1143 (82,31 %), 0,1384 (83,30 %), 0,1059 (57,00 %), 0,4656 (50,58 %) et 0,2682 (57,58 %) La perte d'abandon RMSE a été attribuée à la température dans ANET42, ANET10, ELM, M5P et DTR respectivement. La température s'est également classée deuxième dans les modèles 2/18, y compris ANET33 (0,0559, 45,86 %) et GBM (0,0793, 21,84 %). La DBO était une autre variable importante dans la prévision de la DA dans les plans d'eau et s'est classée première dans 3/18 et deuxième dans 8/18 modèles. Alors que la DBO s'est classée comme la première variable importante dans la prédiction AD dans MARS (0,9343, 182,96%), LR (0,0584, 27,42%) et GBM (0,0812, 22,35%), elle s'est classée deuxième dans KNN (0,2660, 42,69%), XGB (0,4119, 38,60); BRT (0,2206, 32,51 %), ELM (0,0430, 23,17 %), SVR (0,1869, 35,77 %), DTR (0,1636, 35,13 %), ENR (0,0469, 21,84 %) et LRSS (0,0669, 31,65 %). SAL se classe premier sur 2/18 (KNN : 0,2799 ; ANET33 : 0,0633) et deuxième sur 3/18 (Cubiste : 0,3795 ; ANET42 : 0,0946 ; ANET10 : 0,1359) des modèles. DO s'est classé premier dans 2/18 (ENR [0,0562 ; 26,19 %] et LRSS [0,0899 ; 42,51 %]) et deuxième dans 3/18 (RF [0,3240, 35,23 %], M5P [0,3704, 40,23 %], LR [0,0584, 27,41 %]) des modèles.

La figure 3 montre les diagrammes de diagnostic résiduels des modèles comparant les valeurs AD réelles et prévues par les modèles. Les résultats observés ont montré que l'AD réel et la valeur AD prédite dans le cas de LR (A), LRSS (B), KNN (C), BRT 9F), GBM (G), NNT (H), DTR (I), SVR (J), ENR (L), ANET33 (M), ANER64 (N), ANET6 (O), ELM (P) et MARS (Q) étaient asymétriques, et la tendance lissée ne se chevauchait pas. Cependant, les valeurs AD réelles et prévues AD ont connu plus d'alignement et une tendance lissée à peu près superposée a été observée dans RF (D), XGB (E), M5P (K) et Cubist (R). Parmi les modèles, RF (D) et M5P (K) ont tous deux surestimé et sous-estimé la MA prédite à des valeurs inférieures et supérieures, respectivement. Alors que XGB et Cubist ont tous deux surestimé la valeur AD à une valeur inférieure, XGB étant plus proche de la tendance lissée que Cubist. Généralement, une tendance lissée chevauchant la ligne de gradient est souhaitable car elle montre qu'un modèle s'adapte à toutes les valeurs avec exactitude/précision.

Comparaison entre la MA réelle et prédite par les dix-huit modèles ML.

La comparaison des profils de dépendance partielle des PV sur la prédiction AD par les 18 modes en utilisant un modèle unitaire par présentation des PV pour plus de clarté est illustrée sur les Fig. S2–S7. Les profils de dépendance partielle existaient en i. une forme où une augmentation moyenne de la prédiction de la DA s'accompagne d'une augmentation de la PV (tendance à la hausse), (ii) une tendance inverse, où une augmentation de la PV entraîne une baisse de la prédiction de la DA, (iii) une tendance horizontale, où l'augmentation/la diminution de la PV n'a produit aucun effet sur la prédiction de la DA, et (iv) une tendance mixte, où la forme bascule entre 2 ou plus de i–iii. La réponse des modèles variait avec un changement dans l'un des PV, en particulier les changements au-delà des points de rupture qui pourraient diminuer ou augmenter la réponse de prédiction AD.

Le profil de dépendance partielle (PDP) de DO pour les modèles a une tendance à la baisse soit depuis le début, soit après un ou plusieurs points de rupture de nature ii et iv, sauf pour ELM qui a eu une tendance à la hausse (i, Fig. S2). TEMP PDP avait une tendance à la hausse (i et iv) et, dans la plupart des cas, rempli d'un ou plusieurs points de rupture, mais avait une tendance horizontale dans LRSS (Fig. S3). SAL avait un PDP d'une tendance à la baisse typique (ii et iv) dans tous les modèles (Fig. S4). Alors que le pH affichait un PDP de tendance à la baisse typique dans LR, LRSS, NNT, ENR, ANN6, une tendance à la baisse remplie de différents points de rupture a été observée dans RF, M5P et SVR ; d'autres modèles ont montré une tendance à la hausse typique (i et iv) remplie de points de rupture (Fig. S5). Le PDP de TSS a montré une tendance à la hausse qui est revenue à un plateau (DTR, ANN33, M5P, GBM, RF, XFB, BRT), après un dernier point de rupture ou une tendance à la baisse (ANNT6, SVR ; Fig. S6). Le BOD PDP avait généralement une tendance à la hausse remplie de points de rupture dans la plupart des modèles (Fig. S7).

La présente enquête a étudié la valeur inestimable des LM dans la détermination de la DA dans les plans d'eau pour raccourcir le délai d'exécution impliqué dans la détermination de routine de l'agent pathogène émergent avec une priorité de santé publique importante et un taux de létalité élevé. Jiang et al. précédemment démontré que les modèles ML prédisaient et offraient des options d'évaluation des risques rentables pour Vibrio spp. abondances relatives des microplastiques dans le milieu estuarien basées sur des variables environnementales faciles à mesurer30.

Le pH des plans d'eau (5,05–9,11) ne satisfaisait pas aux directives sud-africaines sur l'eau à des fins d'irrigation et d'utilisation récréative d'une plage de pH de 6,5–8,4 et 6,5–8,5, respectivement36 mais le pH moyen (7,76 ± 0,02) des plans d'eau répondait aux critères de la FAO37. En ce qui concerne l'agent pathogène, Acinetobacter spp. sont connus pour posséder et survivre dans une large plage de pH (5–10) et de température (− 20 à 44 °C) avec une température de survie optimale à long terme de 4–22 °C, quelle que soit la disponibilité des nutriments38.

La CE observée (47,00–561,00 µS/cm) des masses d'eau satisfaisait généralement les directives de l'OMS pour 2500 μS/cm dans les eaux de surface39, et la moyenne (218,66 ± 4,76 μS/cm) était dans les limites acceptées de 400 µS/cm et 700 à 3000 µS/cm standard de l'OMS et de la FAO pour l'eau d'irrigation37. La CE des masses d'eau se situait également dans les catégories Classe I (excellent : ≤ 250 µS/cm) et Classe II (bon : 250–750 µS/cm) classification des limites CE de l'eau d'irrigation40. Les concentrations d'EC des masses d'eau auront généralement un impact négatif sur la pêche, car une plage d'EC de 0,15 à 0,50 μS/cm est nécessaire pour soutenir la pêche selon l'USEPA (United States Environmental Protection Agency)41.

Les TDS résumaient les substances organiques et inorganiques dans les plans d'eau, mais ne dépassaient généralement pas la limite maximale autorisée par l'OMS de 1 000 mg/L de TDS dans l'eau potable39. Le TDS (23,00–279,00 mg/L) des plans d'eau a suivi la norme de l'Organisation mondiale de la santé d'un TDS < 300 mg/L (excellent) et sa moyenne (110,53 ± 2,36 mg/L) ne dépasse pas la limite de l'USEPA et de l'OMS pour l'eau potable (500 mg/L)41,42.

Cependant, les valeurs moyennes du TBS des masses d'eau dépassaient la recommandation de l'OMS de 5 NTU39. Les EC, TDS et TBS plus élevés dans les eaux de surface sont généralement attribués aux apports d'eaux usées et d'activités anthropiques43. De plus, des niveaux élevés d'EC, de TDS et de TBS sont connus pour nuire à la visibilité, à la propreté, à la sécurité, à l'esthétique et à l'utilisation récréative des eaux fluviales44. Le TSS moyen (80,17 ± 5,09 mg/L) des plans d'eau dépassait la limite de rejet des eaux usées de l'OMS (2006) de 60 mg/L et dépassait les limites recommandées par l'Australie et la Nouvelle-Zélande (2000) (TSS < 0,03 mg/L) de la qualité de l'eau pour l'aquaculture45,46. De plus, la teneur moyenne en DBO (4,00 ± 0,10 mg/L) des plans d'eau respecte la limite de tolérance de 5 mg/L dans les eaux de surface pour la vie aquatique47. Un niveau plus élevé de DBO dans les plans d'eau épuise l'OD disponible pour les organismes aquatiques48 et a généralement des impacts négatifs sur la pêche et la récolte de poisson.

La DA moyenne (3,19 ± 0,03 log UFC/100 mL) obtenue dans cette étude est comparable à la DA signalée par les plans d'eau touchés par les eaux usées des hôpitaux, les stations d'épuration, les établissements informels et les effluents des cliniques vétérinaires le long du cours de la rivière Umhlangane à Durban en Afrique du Sud49. La DO (8,82 ± 0,04 mg/L) et la DBO (4,00 ± 0,10 mg/L) observées suggèrent toutes deux les caractéristiques aérophiles facultatives d'Acinetobacter et une composition relativement élevée en éléments nutritifs des rivières probables provenant des effluents d'eaux usées. La CE moyenne dans les plans d'eau était de 218,66 ± 4,76 µS/cm. Cela montre un niveau élevé de carbone organique (DOC) dans les rivières. L'EC est un indicateur indirect de DOC25,50,51 et s'est avéré avoir des associations avec l'ARG spécifique d'Acinetobacter et l'abondance d'autres ARG25,52,53. Généralement, A. baumannii dans l'environnement peut survivre quel que soit le niveau de DO54.

Les résultats de cette étude ont révélé que la MA était négligeable - positive mais très faible - corrélée au pH (r = 0, 03) et au SAL ( r = 0, 06) et - négativement - au TDS ( r = - 0, 05) et à la CE ( r = - 0, 04) (tableau 2). Ces résultats peuvent être attribués à la capacité de l'Acinetobacter à survivre dans un large éventail de conditions environnementales difficiles. Une corrélation significativement positive entre la DA et la DBO (r = 0,26), le TSS (r = 0,26) et le TBS (r = 0,26) a indiqué une augmentation considérable de la DA avec une augmentation de la pollution par les nutriments et le COD dans les milieux aquatiques (Fig. S7). De plus, les résultats ont montré une corrélation positive modérée entre TEMP et AD (r = 0,43), suggérant que l'AD s'améliore en abondance avec une augmentation de la température38 jusqu'à des points de rupture spécifiques. AD modérément et inversement corrélé à DO (r = − 0,46), indiquant que l'abondance d'Acinetobacter augmente avec une condition anaérobie ou un faible niveau d'oxygène.

Les valeurs moyennes et étendues AD prédites par les modèles 18 ML différaient. Les résultats de la présente étude suggèrent que la limite inférieure/supérieure et la tendance générale caractéristique de la prédiction sont beaucoup plus importantes que la prédiction moyenne uniquement. La plupart des algorithmes avaient des prédictions moyennes plus élevées, mais surestimaient ou sous-estimaient les valeurs AD aux limites inférieure et supérieure, respectivement. Ainsi, les algorithmes autres que XGB et Cubist ne conviennent pas pour prédire la DA dans les plans d'eau. Alors que les performances de la plupart des algorithmes ML, tels que RF, DTR et MARS43,55, ont été saluées en termes de prédictions moyennes et de mesures de régression, la plupart des études négligent la prise en compte de la limite inférieure/supérieure et de la tendance générale caractéristique de leurs prédictions, qui sont de loin significatives lorsqu'il s'agit d'organismes infectieux/poison qui pourraient avoir une faible dose/puissance d'infectiosité à une très faible concentration. Plusieurs chercheurs ont également signalé la supériorité de XGB par rapport à plusieurs algorithmes ML en termes de performances prédictives en termes de prédiction moyenne et de sensibilité43,55. Bien qu'une étude précédente ait montré que les modèles RF atteignaient un niveau de précision plus élevé que XGB, SVR et ENR pour prédire le Vibrio spp. l'abondance relative sur les microplastiques, les caractéristiques réelles de la tendance, y compris les limites inférieures/supérieures, n'ont pas été signalées30. La différence dans la couverture des tendances des modèles et les caractéristiques des limites dans les prévisions AD sont attribuables à la capacité des modèles à capturer les interactions complexes des niveaux/changements de cooccurrence dans différentes variables environnementales à différents degrés ou concentrations. La performance de Cubist [3,1736 (1,1012–4,5300)] s'est également avérée comparable à celle de XGB [3,1792 (1,1040–4,5828)] en termes de caractéristiques de tendance et de limites, les deux modèles surpassant les autres modèles. Un problème typique avec la plupart des algorithmes observés dans cette étude était la surestimation et la sous-estimation de la MA à des concentrations inférieures et supérieures, respectivement. Ces limitations suggèrent que les modèles pourraient déclencher une fausse alerte de risque élevé à une DA plus faible ainsi que saper un risque plus élevé à des concentrations plus élevées de DA. Une indication que ces modèles ne pouvaient pas saisir les relations complexes non linéaires entre la DA, les PV et les apports anthropiques sous-jacents.

Néanmoins, les contributions absolues du changement de PV individuel à la prédiction de la MA par les modèles à partir de leurs modèles attribués à des valeurs moyennes variaient (Fig. 2). Les comportements pourraient être interprétés en termes d'interactions complexes entre les PV couplées aux flux anthropiques dominants dans les masses d'eau. Plusieurs PV subissent des fluctuations co-concurrentes contrairement aux comportements dans les modèles dans lesquels d'autres PV sont maintenus constants pour évaluer les effets d'un PV particulier sur la variable de résultat (AD). Ces interactions sont capturées dans une large mesure par les algorithmes, ce qui entraîne des différences dans le classement des contributions des PV aux prédictions AD par les algorithmes. De plus, les caractéristiques intrinsèques des algorithmes distincts et le bruit des données sont les principales causes des différences dans les contributions observées des variables dans les modèles ML30.

Compte tenu des performances globales de 18 modèles basés sur l'IA testés dans cette étude à l'aide de quatre métriques, XGB (MSE = 0,0059, RMSE = 0,0770 ; R2 = 0,9912 ; MAD = 0,0440) et Cubist (MSE = 0,0117, RMSE = 0,1081, R2 = 0,9827 ; MAD = 0,0437) étaient les meilleurs modèles se classant respectivement en première et deuxième position, pour surpasser les autres dans la prédiction de la DA dans les plans d'eau (tableau 4). XGB a la réputation d'être les algorithmes ML les plus performants dans la plupart des études de régression microbiologique par rapport aux autres30. Il a été démontré que Cubist surpassait les moindres carrés partiels, RF et MARS dans la prédiction des propriétés du sol, y compris l'azote total du sol, le carbone organique, le soufre total, l'argile calcique échangeable ; capacité d'échange de sable et de cations, pH et RF, arbres de classification et de régression, SVM et KNN prédisant le NH4–N et la DCO dans les effluents des zones humides artificielles souterraines56,57. En prévoyant la diffusion quotidienne de la vaccination contre le COVID-19, Cubist a surpassé les algorithmes ENR, Gaussian Process, Slab (SPIKES) et Spikes ML58. En outre, il a été démontré que Cubist surpassait XGB dans la prédiction des pressions, des volumes et des contraintes ventriculaires gauches59. Un ensemble de XGB et Cubist pourrait être davantage exploité pour une meilleure performance dans la prévision de la DA dans les masses d'eau. Cependant, il a été démontré que ANN (R2 = 0,953) présentait un coefficient prédictif supérieur au modèle cubiste (R2 = 0,946) et LR (R2 = 0,481) lors du dosage de la teneur en coliformes fécaux dans les eaux usées traitées à des fins de réutilisation60. En règle générale, alors que XGB impliquait un ensemble d'arbres qui capturent les interactions/relations multidimensionnelles, Cubist combinait les forces des équations de régression linéaire et d'un comité de nœuds structurels basés sur un arbre pour capturer efficacement les relations multidimensionnelles linéaires et non linéaires entre les variables et l'événement de résultat56. Les résultats montrent que ANET6, ANRT42, ANET33, M5P et RF avaient MSE et RMSE qui les plaçaient en position 3, 4, 5, 6 et 7 parmi les ML pour prédire la MA, leurs performances sont à éviter pour la prévision pratique de la MA à des fins préventives.

TEMP était le PV le plus important pour prédire la MA dans les plans d'eau et classé par 10/18 algorithmes ML, y compris RF, XGB, Cubist, BRT et NNT, représentant 45,90 %, 43,00 %, 50,82 %, 44,87 % et 68,77 % dans les modèles respectifs, ainsi que 82,31 %, 83,30 %, 57,00 %, 50,58 % et 57,58 % de perte d'abandon RMSE dans ANET42, ANET10, ELM, M5P et DTR respectivement. Les résultats observés peuvent être expliqués en termes d'influence directe et indirecte de la TEMP sur les autres PV et AD dans les plans d'eau. L'OD diminue avec l'augmentation de la température, favorisant le mode de vie aérobie facultatif d'Acinetobacter. En outre, la température augmente la décomposition des matières organiques dans les plans d'eau, entraînant ainsi une teneur élevée en DBO fournissant plus de nutriments pour la MA et d'autres vies microbiennes. L'augmentation résultante du COD dans les plans d'eau est un indicateur indirect de l'EC25,50,51 et s'avère avoir des associations avec l'abondance d'ARG spécifique à Acinetobacter dans les plans d'eau25,52,53. La DBO était une autre caractéristique importante identifiée dans la prévision de la DA dans les plans d'eau et classée première dans 3/18 [MARS (182,96%), LR (27,42%) et GBM (22,35%)] et deuxième dans 8/18 modèles [KNN (42,69%), XGB (38,60%); BRT (32,51 %), ELM (23,17 %), SVR (35,77 %), DTR (35,13 %), ENR (21,84 %) et LRSS (31,65 %)]. La DBO est une mesure de la pollution par les nutriments provenant des apports anthropiques tels que les effluents d'eaux usées, les activités agricoles et les événements environnementaux tels que les ruissellements d'eau de pluie, entre autres. La DBO influence également l'EC, le TDS et le TBS dans les eaux de surface43 Alors que le SAL a été identifié comme la première caractéristique importante dans les modèles 2/18 (KNN, ANET33) et le deuxième dans les modèles 3/18 (Cubist, ANET42, ANET6), Acinetobacter ne peut survivre qu'à un SAL relativement élevé sans améliorer sa densité de population (Fig. S4). Contrairement à Vibrio spp, dont la densité élevée est liée à une salinité élevée30 car elle favorise l'expression des gènes et des protéines fonctionnelles61 et la croissance et la reproduction éventuelles du vibrion62, une SAL élevée ne convient pas à la MA car elle inhibe l'expression des gènes liés à la croissance.

Les analyses de sensibilité des 18 modèles prédictifs ML de la MA utilisant les diagrammes de diagnostic résiduel ont révélé que LR (A), LRSS (B), KNN (C), BRT (F), GBM (G), NNT (H), DTR (I), SVR (J), ENR (L), ANET33 (M), ANER64 (N), ANET6 (O), ELM (P) et MARS (Q) ne correspondaient pas de manière optimale aux données. Cela implique que les modèles ne sont pas adaptés à la prévision de la DA dans les plans d'eau. Pendant ce temps, des modèles tels que RF (D), XGB (E), M5P (K) et Cubist (R) ont ajusté les données avec plus d'alignement et une tendance lissée à peu près superposée entre les valeurs AD réelles et prévues, RF (D) et M5P (K) AD sur-prédit et sous-prédit aux extrémités inférieures et supérieures, respectivement. Ainsi, cela pourrait être interprété comme une prévision du risque exagéré (DA) à un niveau probablement inoffensif tout en affaiblissant le risque réel aux membres supérieurs. De tels modèles ne conviennent pas pour évaluer les événements réels de la MA dans les plans d'eau. Bien que XGB et Cubist aient prédit une valeur AD légèrement supérieure à la valeur réelle aux extrémités inférieures, XGB avait une tendance lissée plus proche que Cubist. Comparé à d'autres modèles testés dans cette étude, le duo est le meilleur et pourrait être appliqué à la conception de systèmes intelligents AD AI pour la surveillance de la qualité de l'eau. Un modèle empilé de XGB et Cubist peut surpasser et surmonter la limitation des deux modèles à l'extrémité inférieure de la valeur AD.

Le résumé global des PDP des PV sur la prédiction AD par les 18 modes (Fig. S2 à S7), a révélé que tout degré de changement / flux dans un PV particulier, en particulier les changements au-delà de ses points de rupture, attirait une réponse variée correspondante dans AD qui pourrait diminuer ou augmenter la réponse de prédiction AD. Les différentes formes de profils de dépendance partielle, comme expliqué dans la section précédente, ont également montré les interactions directes/indirectes/complexes entre un PV et AD couplées à la sensibilité d'un modèle à cartographier les relations. En résumé, l'augmentation du niveau AD (PDP) dans la plupart des modèles équivaut à une tendance à la baisse de DO et SAL, en particulier après son ou ses points de rupture à l'exclusion de l'ELM où DO avait une tendance à la hausse (i ; Figs. S2 et S4). Ces modèles ont révélé une relation non linéaire entre AD et les PV. Une relation quasi augmentation par augmentation existe entre TEMP et AD dans la plupart des modèles couplés à un ou plusieurs points de rupture. LRSS a révélé une relation nulle entre AD et TEMP indiquant son incapacité à cartographier la relation entre eux. Bien qu'il ait été démontré qu'Acinetobacter avait une large plage de pH, un PDP de tendance à la baisse typique du pH par LR, LRSS, NNT, ENR, ANN6 - rempli de points de rupture dans RF, M5P et SVR tandis que d'autres modèles ont montré une tendance à la hausse typique - est révélateur de la faiblesse des modèles car l'augmentation du pH de 5,02 à 10 favorise la croissance d'Acinetobacter38. Les réponses de prédiction de la MA alignées sur une augmentation générale de la DBO, quel que soit le ou les points de rupture dans la plupart des modèles, ont révélé des éléments nutritifs importants pour la densité de population d'Acinetobacter dans les plans d'eau.

En outre, les points forts de cette étude actuelle ont été les premiers à évaluer la DA dans les plans d'eau recevant des effluents d'eaux usées hospitalières et municipales le long de leur parcours, deux algorithmes ML prédisent de manière optimale et précise la DA, se sont avérés être des candidats prometteurs pour développer le SAIS pour la détermination de la DA et ainsi raccourcir le délai d'exécution et réduire le travail impliqué dans les approches expérimentales. En outre, les ML ont pu capturer des interactions multidimensionnelles complexes non linéaires entre AD et PV ainsi que leurs carburants anthropiques inhérents que les modèles mathématiques conventionnels ne pouvaient pas cartographier de manière robuste63. De plus, les LM peuvent être améliorées et peuvent être utilisées dans plusieurs paysages de gestion de l'eau. Cependant, la lacune de la présente étude réside dans le manque de covariables spatio-temporelles qui pourraient améliorer les prédictions des modèles ML, car les distributions stochastiques des agents pathogènes d'origine hydrique sont régies à la fois par l'extension spatiale et la durée temporelle à travers la profondeur dans les colonnes d'eau. Les études futures devraient rechercher des données provenant d'un large éventail d'activités/zones socio-économiques et inclure des entrées spatio-temporelles et géospatiales dans l'élaboration d'un cadre prédictif basé sur l'IA pour la détermination de la DA.

La présente étude a prouvé que le SAIS était une stratégie fondée sur des données probantes pour raccourcir le délai d'exécution impliqué dans l'évaluation de la DA dans les plans d'eau ; minimisant ainsi l'exposition. Les meilleurs modèles (XGB/Cubist) identifiés dans cette étude pourraient être développés en SAIS autonomes (XGB/Cubist, ensemble XGB-Cubist ou application Web) ou intégrés dans des instruments existants pour l'estimation PV dans les plans d'eau afin d'améliorer la prise de décision en temps opportun sur les qualités microbiologiques des plans d'eau pour l'irrigation et à d'autres fins. L'étude a également révélé que la température et la DBO étaient des candidats importants pour prédire la MA dans les plans d'eau dans la plupart des modèles. Enfin, la DA dans les plans d'eau pourrait être prédite avec précision et fiabilité via des systèmes intelligents basés sur l'IA qui s'appuient sur la dynamique des variables physicochimiques des plans d'eau de manière peu coûteuse et rapide.

Toutes les données générées ou analysées au cours de cette étude sont incluses dans cet article publié et ses fichiers d'informations supplémentaires.

Densité d'Acinetobacter

Réseau neuronal artificiel

Demande biochimique d'oxygène

Arbre de régression boosté

Régression cubiste

Régression d'arbre de décision

Oxygène dissous

Régression nette élastique

Conductivité électrique

Très résistant aux médicaments

Régression accélérée par gradient extrême

Machine d'apprentissage extrême

Machine boostée en dégradé

Eaux de source d'irrigation

K-plus proches voisins

Régression linéaire

Régression linéaire avec sélection pas à pas

Apprentissage automatique

Erreur quadratique moyenne

Écart absolu médian

Multirésistant

Splines de régression adaptative multivariée

Effluents municipaux et hospitaliers

Réseau neuronal

Variables physicochimiques

Forêt aléatoire

Erreur quadratique moyenne

Salinité

Système intelligent artificiel intelligent

Prise en charge de la régression vectorielle

Température

Solides totaux dissous

Turbidité

Les stations d'épuration des eaux usées

Sofia, C., Angela, R., Luminiţa, SI, Raluca, F. & Iuliana, T. Caractéristiques culturelles et biochimiques d'Acinetobacter spp. souches isolées des unités hospitalières. J. Préc. Méd. 12(3–4), 35–42 (2004).

Google Scholar

Krizova, L., Maixnerova, M., Sedo, O. & Nemec, A. Acinetobacter bohemicus sp. nov. répandu dans les écosystèmes naturels du sol et de l'eau en République tchèque. Syst. Appl. Microbiol. 37, 467–473 (2014).

Article PubMed Google Scholar

Gundi, VA, Dijkshoorn, L., Burignat, S., Raoult, D. et La Scola, B. Validation de l'analyse partielle de la séquence du gène rpoB pour l'identification d'espèces d'Acinetobacter cliniquement importantes et émergentes. Microbiol. 155, 2333-2341 (2009).

Article CAS Google Scholar

Nemec, A. et al. Caractérisation génotypique et phénotypique du complexe Acinetobacter calcoaceticus-Acinetobacter baumannii avec la proposition d'Acinetobacter pittii sp. nov. (anciennement l'espèce génomique 3 d'Acinetobacter) et Acinetobacter nosocomialis sp. nov. (anciennement l'espèce génomique Acinetobacter 13TU). Rés. Microbiol. 162, 393–404 (2011).

Article CAS PubMed Google Scholar

Nemec, A. et al. Acinetobacter seifertii sp. nov., un membre du complexe Acinetobacter calcoaceticus-Acinetobacter baumannii isolé à partir d'échantillons cliniques humains. Int. J. Syst. Évol. Microbiol. 65(Partie 3), 934–942. https://doi.org/10.1099/ijs.0.000043 (2015).

Article CAS PubMed Google Scholar

Choi, JY et al. Isolats d'espèces d'Acinetobacter à partir d'une gamme d'environnements : enquête sur les espèces et observations de la résistance aux antimicrobiens. Diag. Microbiol. Infect Dis. 74, 177-180 (2012).

Article CAS PubMed Google Scholar

Choi, JY et al. Acinetobacter kookii sp. nov., isolé du sol. Int. J. Syst. Évol. Microbiol. 63, 4402–4406 (2013).

Article CAS PubMed Google Scholar

Maravić, A. et al. L'environnement fluvial urbain est une source d'Acinetobacter spp. Environ. Sci. Pollution. Rés. 23, 3525–3535 (2016).

Article Google Scholar

Bhuyan, S. Études sur les biosurfactants/bioémulsifiants par les espèces de génotypes Acinetobacter et Brevibacterium halotolerans isolés des environnements marins. Thèse de doctorat, Université de Pune, Inde (2012).

Luo, QJ et al. Isolement et caractérisation d'Acinetobacter sp. souche Y2. Ann. Microbiol. 6(2), 633–640 (2013).

Article Google Scholar

Peleg, AY, Seifert, H. & Paterson, DL Acinetobacter baumannii : Émergence d'un agent pathogène réussi. Clin. Microbiol. Rév. 21, 538–582. https://doi.org/10.1128/CMR.00058-07 (2008).

Article CAS PubMed PubMed Central Google Scholar

Adegoke, AA, Mvuyo, T. & Okoh, AI Espèces omniprésentes d'Acinetobacter en tant que commensaux bénéfiques, mais progressivement renforcées par des gènes de résistance aux antibiotiques. J. Basic Microbiol. 52, 620–627 (2012).

Article CAS PubMed Google Scholar

Mujumdar, AS & Balu, C. Isolement, biotypage, caractérisation biochimique et physiologique des Acinetobacter marins isolés de la côte ouest de l'Inde. Int. J. Curr. Microbiol. Appl. Sci. 2, 277–301 (2015).

Google Scholar

Palavecino, E., Greene, SR & Kilic, A. Caractérisation des gènes de carbapénèmase et résistance aux antibiotiques chez Acinetobacter baumannii résistant aux carbapénèmes entre 2019 et 2022. Infect. Dis. 54(12), 951–953. https://doi.org/10.1080/23744235.2022.2113137 (2022).

Article CAS Google Scholar

Hubeny, J. et al. Caractérisation de la résistance aux carbapénèmes dans des échantillons environnementaux et Acinetobacter spp. isolats des eaux usées et de l'eau des rivières en Pologne. Sci. Environ. 822, 153–437 (2022).

Article Google Scholar

Eze, EC, El Zowalaty, ME & Pillay, M. Résistance aux antibiotiques et formation de biofilms d'Acinetobacter baumannii isolés des eaux usées à haut risque dans les hôpitaux tertiaires d'Afrique du Sud. J. Global Antimicrob. Résister. 27, 82–90 (2021).

Article CAS Google Scholar

Ana, C., Joana, S. & Paula, T. Acinetobacter spp. dans les aliments et l'eau potable : un bilan. Microbiol Alimentaire. 95, 103675. https://doi.org/10.1016/j.fm.2020.103675 (2021).

Article CAS Google Scholar

Berlau, J., Aucken, HM, Houang, E. & Pitt, TL Isolement d'Acinetobacter spp. y compris un Baumannii de légumes : Implications pour les infections nosocomiales. J.Hosp. Infecter. 42, 201–204. https://doi.org/10.1053/jhin.1999.0602 (1999).

Article CAS PubMed Google Scholar

Houang, ET et al. Épidémiologie et implications du contrôle des infections d'Acinetobacter spp à Hong Kong. J.Clin. Microbiol. 39, 228-234 (2001).

Article CAS PubMed PubMed Central Google Scholar

Ruimy, R. et al. Les fruits et légumes biologiques et conventionnels contiennent un nombre équivalent de bactéries Gram-négatives exprimant une résistance aux agents antibactériens. Environ. Microbiol. 12, 608–615 (2010).

Article CAS PubMed Google Scholar

Dahiru, M. & Enabulele, O. Incidence d'Acinetobacter dans la carotte fraîche (Daucus carota subsp. Sativus). Int. J. Biol. Biomol. Agric. Biotechnologie alimentaire. Ing. 9, 1203-1207 (2015).

Google Scholar

Al Atrouni, A. et al. Premier signalement d'Acinetobacter calcoaceticus producteur d'oxa-72 au Liban. Nouveau microb. Nouvelle infection. 9, 11-12 (2016).

Article CAS Google Scholar

Carvalheira, A., Silva, J. & Teixeira, P. La laitue et les fruits comme source d'Acinetobacter spp. multirésistant. Microbiol Alimentaire. 64, 119-125 (2017).

Article CAS PubMed Google Scholar

Zekar, FM et al. Des fermes aux marchés : bactéries Gram-négatives résistantes aux céphalosporines de troisième génération dans les fruits et légumes d'une région d'Afrique du Nord. Devant. Microbiol. 8, 1569 (2017).

Article Google Scholar

Murphy, A., Barich, D., Fennessy, MS & Slonczewski, JL Une rivière pittoresque de l'État de l'Ohio présente des gènes de résistance aux antibiotiques élevés, notamment la résistance à la tétracycline et aux macrolides d'Acinetobacter, en aval des effluents de la station d'épuration des eaux usées. Microbiol. Spectre. 9, e00941-e1021. https://doi.org/10.1128/Spectrum.00941-21 (2021).

Article CAS PubMed PubMed Central Google Scholar

Yang, X. et al. Évaluation assistée par apprentissage automatique des biochars potentiels pour l'élimination pharmaceutique de l'eau. Environ. Rés. 214, 113953. https://doi.org/10.1016/j.envres.2022.113953 (2022).

Article CAS PubMed Google Scholar

Liu, F., Jiang, X. & Zhang, M. Analyse de la charge mondiale et prédiction AutoGluon de l'empoisonnement accidentel au monoxyde de carbone par étude de la charge mondiale de morbidité 2019. Environ. Sci. Pollution. Rés. Int. 29(5), 6911–6928 (2022).

Article PubMed Google Scholar

Forrest, IS et al. Marqueur basé sur l'apprentissage automatique pour la maladie coronarienne : dérivation et validation dans deux cohortes longitudinales. Lancette 401, 215–225. https://doi.org/10.1016/S0140-6736(22)02079-7 (2023).

Article PubMed Google Scholar

Guzman, CB et al. Comparaison de la qualité des eaux pluviales et des typologies des bassins versants aux États-Unis : une approche d'apprentissage automatique. Eau Rés. 216, 118283. https://doi.org/10.1016/j.watres.2022.118283 (2022).

Article CAS Google Scholar

Jiang, J. et al. Apprentissage automatique pour prédire les changements dynamiques de Vibrio spp. abondance sur les microplastiques en milieu marin. Environ. Pollution. 305, 119257. https://doi.org/10.1016/j.envpol.2022.119257 (2022).

Article CAS PubMed Google Scholar

Association américaine de santé publique (APHA). Méthodes standard d'examen de l'eau et des eaux usées 21e éd. (APHA, 2005).

Google Scholar

Adewoyin, MA, Ebomah, KE & Okoh, AI Profil d'antibiogramme d'Acinetobacter baumannii récupéré à partir de ressources d'eau douce sélectionnées dans la province du Cap oriental, en Afrique du Sud. Agents pathogènes 10(9), 1110 (2021).

Article CAS PubMed PubMed Central Google Scholar

Biecek, P. & Burzykowski, T. Analyse du modèle explicatif : Explorer (Chapman et Hall/CRC, 2021).

Réserver Google Scholar

Namkung, J. Méthodes d'apprentissage automatique pour les études sur le microbiome. J. Microbiol. 58(3), 206–216 (2020).

Article PubMed Google Scholar

Hansen, LK Apprentissage linéaire stochastique : tests exacts et moyennes des erreurs de formation. Réseau neuronal. 6(3), 393–396 (1993).

Article Google Scholar

DWAF (Direction des Eaux et Forêts). Recommandations pour la qualité de l'eau Vol. 8, 2–68 (Direction des Eaux et Forêts, 1996).

Google Scholar

Ayers, RS & Westcott, DW Qualité de l'eau pour l'agriculture ; Document de la FAO sur l'irrigation et le drainage, n° 29 (FAO, 1985).

Google Scholar

Dekic, S., Hrenovic, J., Ivankovic, T. & van Wilpe, E. Survie du pathogène ESKAPE Acinetobacter baumannii dans de l'eau à différentes températures et pH. Sci de l'eau. Technol. 78(5–6), 1370–1376 (2018).

Article PubMed Google Scholar

Organisation Mondiale de la Santé. Recommandations pour la qualité de l'eau potable (Organisation mondiale de la santé, 2017).

Google Scholar

Abbas, H., Khan, MZ, Begum, F., Raut, N. & Gurung, S. Propriétés physicochimiques de l'eau d'irrigation dans l'ouest de l'Himalaya, au Pakistan. après Supply 20, 3368–3379 (2020).

Article CAS Google Scholar

USEPA. Règlement national sur l'eau potable primaire EPA 816-F-09–004 (USEPA, 2009).

Google Scholar

OMS. Recommandations pour la qualité de l'eau potable, 4e édition. https://www.who.int/publications/i/item/9789241548151 (2011).

Ibrahim, B. et al. Modélisation de la concentration d'arsenic dans plusieurs sources d'eau : une comparaison de différentes méthodes d'apprentissage automatique. Solw. Soutenir. Dév. 17, 100745 (2022).

Article Google Scholar

Santé Canada. Recommandations pour la qualité des eaux récréatives au Canada. Dans : Bureau de l'eau, de l'air et des changements climatiques, Direction générale de la santé environnementale et de la sécurité des consommateurs, 3e éd. (Santé Canada, 2012).

Organisation Mondiale de la Santé. Directives pour l'utilisation sûre des eaux usées, des excréta et des eaux ménagères dans l'agriculture et l'aquaculture. (Organisation mondiale de la santé, 2006). https://apps.who.int/iris/handle/10665/78265.

Directives australiennes et néo-zélandaises pour la qualité des eaux douces et marines. Les Lignes directrices : Volume 1. (2000). https://www.waterquality.gov.au/anz-guidelines/resources/previous-guidelines/anzecc-armcanz-2000.

Bhatnagar, A. & Devi, P. Lignes directrices sur la qualité de l'eau pour la gestion des poissons d'étang Culture. Int. J. Environ. Sci. 5, 1980–2009 (2013).

Google Scholar

Pleto, JVR, Migo, VP & Arboleda, MDM Évaluation préliminaire de la qualité de l'eau et des sédiments du système fluvial Marilao-Meycauayan-Obando à Bulacan, Philippines J. Santé Pollution. 10, 200609 (2020).

Article PubMed PubMed Central Google Scholar

Govender, R., Amoah, ID, Kumari, S., Bux, F. & Astenström, T. Détection d'isolats environnementaux multirésistants d'Acinetobacter et de Stenotrophomonas maltophilia : une menace possible pour les infections acquises dans la communauté ?. J. Environ. Sci. Santé. A 56(2), 213–225. https://doi.org/10.1080/10934529.2020.1865747 (2021).

Article CAS Google Scholar

Monteiro, MTF et al. Concentration de carbone organique dissous et sa relation avec la conductivité électrique dans les eaux d'un cours d'eau dans un bassin versant d'eaux noires amazoniennes boisées. Écol. Plongeurs. 7, 205–213. https://doi.org/10.1080/17550874.2013.820223 (2014).

Article Google Scholar

Ye, LL, Wu, XD, Liu, B., Yan, DZ & Kong, FX Dynamique du carbone organique dissous dans le lac eutrophe Taihu et ses affluents et leurs implications pour l'abondance bactérienne en automne et en hiver. J. Freshw. Écol. 30, 129–142. https://doi.org/10.1080/02705060.2014.939108 (2015).

Article CAS Google Scholar

Garner, E. et al. Caractérisation métagénomique des gènes de résistance aux antibiotiques dans les systèmes de distribution d'eau récupérée à grande échelle et les systèmes d'eau potable correspondants. Environ. Sci. Technol. 52, 6113–6125. https://doi.org/10.1021/acs.est.7b05419 (2018).

Article ADS CAS PubMed Google Scholar

Wang, C. & Hong, P.-Y. Métagénomique résolue par le génome et analyse des gènes de résistance aux antibiotiques dans les systèmes de distribution d'eau récupérée. Eau 12, 3477 (2020).

Article Google Scholar

Dekic, S., Jasna, H., van Erna, W., Chantelle, V. & Ivana, G.-B. Survie du pathogène émergent Acinetobacter baumannii dans un environnement aquatique exposé à différentes conditions d'oxygène. Sci de l'eau. Technol. 80(8), 1581-1590. https://doi.org/10.2166/wst.2019.408 (2019).

Article CAS PubMed Google Scholar

Zhuang, X. & Zhou, S. La prédiction de la capacité d'auto-guérison du béton à base de bactéries à l'aide d'approches d'apprentissage automatique. Calcul. Mater. Continua 59, 1–10 (2019).

Google Scholar

Clingensmith, CM & Grunwald, S. Prédiction des propriétés du sol et interprétation des modèles vis-NIR de l'ensemble des États-Unis continentaux. Capteurs 22, 3187. https://doi.org/10.3390/s22093187 (2022).

Article ADS CAS PubMed PubMed Central Google Scholar

Nguyen, XC et al. Développer une nouvelle approche pour l'aide à la conception de zones humides construites souterraines à l'aide d'algorithmes d'apprentissage automatique. J. Environ. Géré. 301, 113868. https://doi.org/10.1016/j.jenvman.2021.113868 (2022).

Article CAS Google Scholar

Oyewola, DO, Dada, EG & Misra, S. Apprentissage automatique pour optimiser la diffusion quotidienne du vaccin COVID-19 pour lutter contre la pandémie. Technol. Santé 12, 1277-1293. https://doi.org/10.1007/s12553-022-00712-4 (2022).

Article Google Scholar

Dabiri, Y. et al. Prédiction de la mécanique ventriculaire gauche à l'aide de l'apprentissage automatique. Devant. Phys. https://doi.org/10.3389/fphy.2019.00117 (2019).

Article PubMed PubMed Central Google Scholar

Sbahi, S., Ouazzani, N., Hejjaj, A. & Mandi, L. Réseau de neurones et algorithmes cubistes pour prédire la teneur en coliformes fécaux dans les eaux usées traitées par un système multicouche pour une réutilisation potentielle. J. Environ. Qual. 50, 144–157. https://doi.org/10.1002/jeq2.20176 (2021).

Article CAS PubMed Google Scholar

Naughton, LM, Blumerman, SL, Carlberg, M. & Boyd, EF Osmoadaptation parmi les espèces de Vibrio et caractéristiques génomiques uniques et réponses physiologiques de Vibrio parahaemolyticus. Appl. Environ. Microbiol. 75(9), 2802–2810. https://doi.org/10.1128/AEM.01698-08 (2009).

Article ADS CAS PubMed PubMed Central Google Scholar

Whitaker, WB, Parent, MA & Naughton, LM Modulation des réponses de Vibrio parahaemolyticus O3:K6 aux contraintes de pH et de température par croissance à différentes concentrations de sel. Appl. Environ. Microbiol. 76(14), 4720–4729. https://doi.org/10.1128/AEM.00474-10 (2010).

Article ADS CAS PubMed PubMed Central Google Scholar

Long, B. et al. Culture d'algues semi-continue basée sur l'apprentissage automatique et la biologie synthétique pour libérer la productivité des carburants renouvelables. Nat. Commun. 13(1), 1–11 (2022).

Article ADS MathSciNet Google Scholar

Télécharger les références

La National Research Foundation, Afrique du Sud, est reconnue pour la subvention avec la subvention unique n ° 135441. Adewoyin a apprécié la fondation de l'Académie mondiale des sciences, Italie (NRF / TWAS) avec les numéros de subvention 99767 et 116387. Ekundayo a remercié le Réseau afro-allemand d'excellence en science (AGNES), le ministère fédéral de l'Éducation et de la Recherche (BMBF) et la Fondation Alexander von Humboldt (AvH) pour leur soutien financier.

SAMRC Microbial Water Quality Monitoring Centre, Université de Fort Hare, Alice, Eastern Cape, Afrique du Sud

Temitope C. Ekundayo, Mary A. Adewoyin, Etinosa O. Igbinosa et Anthony I. Okoh

Département de biotechnologie et des sciences alimentaires, Université de technologie de Durban, Steve Biko Campus, Steve Biko Rd, Musgrave, Berea, 4001, Durban, Afrique du Sud

Temitope C. Ekundayo & Oluwatosin A. Ijabadeniyi

Département de microbiologie, Université des sciences médicales d'Ondo, Ondo, Nigéria

Temitope C. Ekundayo

Département des sciences biologiques, Faculté des sciences naturelles, appliquées et de la santé, Anchor University, Ayobo Road, Ipaja, PMB 001, Lagos, Nigéria

Mary A. Adewoyin

Département de Microbiologie, Faculté des Sciences de la Vie, Université du Bénin, Private Mail Bag 1154, Benin City, 300283, Nigeria

Etinosa O. Igbinosa

Département des sciences de la santé environnementale, Collège des sciences de la santé, Université de Sharjah, PO Box 27272, Sharjah, Émirats arabes unis

Anthony I. Okoh

Vous pouvez également rechercher cet auteur dans PubMed Google Scholar

Vous pouvez également rechercher cet auteur dans PubMed Google Scholar

Vous pouvez également rechercher cet auteur dans PubMed Google Scholar

Vous pouvez également rechercher cet auteur dans PubMed Google Scholar

Vous pouvez également rechercher cet auteur dans PubMed Google Scholar

Conceptualisation : TCE ; AMA ; Enquête : TCE ; AMA ; Analyse logicielle et formelle : TCE ; Ressources : AIO ; Rédaction—préparation du projet original et interprétations : TCE ; AMA ; AIO ; déclaration d'intérêt ; OAI ; Supervision : AIO ; Acquisition de financement : AIO ; revue critique des contenus intellectuels : TCE ; AMA ; AIO ; déclaration d'intérêt ; OAI ; Tous les auteurs ont contribué à la rédaction, à la révision et à l'édition, et ont approuvé la version finale du manuscrit pour publication.

Correspondance à Temitope C. Ekundayo.

Les auteurs ne déclarent aucun intérêt concurrent.

Springer Nature reste neutre en ce qui concerne les revendications juridictionnelles dans les cartes publiées et les affiliations institutionnelles.

Libre accès Cet article est sous licence Creative Commons Attribution 4.0 International, qui autorise l'utilisation, le partage, l'adaptation, la distribution et la reproduction sur tout support ou format, à condition que vous accordiez le crédit approprié à l'auteur ou aux auteurs originaux et à la source, fournissez un lien vers la licence Creative Commons et indiquez si des modifications ont été apportées. Les images ou tout autre matériel de tiers dans cet article sont inclus dans la licence Creative Commons de l'article, sauf indication contraire dans une ligne de crédit au matériel. Si le matériel n'est pas inclus dans la licence Creative Commons de l'article et que votre utilisation prévue n'est pas autorisée par la réglementation légale ou dépasse l'utilisation autorisée, vous devrez obtenir l'autorisation directement du détenteur des droits d'auteur. Pour voir une copie de cette licence, visitez http://creativecommons.org/licenses/by/4.0/.

Réimpressions et autorisations

Ekundayo, TC, Adewoyin, MA, Ijabadeniyi, OA et al. Détermination guidée par apprentissage automatique de la densité d'Acinetobacter dans les plans d'eau recevant des effluents d'eaux usées municipales et hospitalières. Sci Rep 13, 7749 (2023). https://doi.org/10.1038/s41598-023-34963-6

Télécharger la citation

Reçu : 06 mars 2023

Accepté : 10 mai 2023

Publié: 12 mai 2023

DOI : https://doi.org/10.1038/s41598-023-34963-6

Toute personne avec qui vous partagez le lien suivant pourra lire ce contenu :

Désolé, aucun lien partageable n'est actuellement disponible pour cet article.

Fourni par l'initiative de partage de contenu Springer Nature SharedIt

En soumettant un commentaire, vous acceptez de respecter nos conditions d'utilisation et nos directives communautaires. Si vous trouvez quelque chose d'abusif ou qui ne respecte pas nos conditions ou directives, veuillez le signaler comme inapproprié.