Pilier 6
Analyse computationnelle, modélisation et résultats évolutifs (CAMEO)
La surveillance des eaux usées (SEU) est un outil épidémiologique et de santé publique important pour le suivi des agents pathogènes à l’échelle d’un bâtiment, d’un quartier, d’une ville ou d’une région. La SEU a été largement adoptée au niveau mondial pendant la pandémie de SRAS-CoV-2 pour estimer les niveaux d’infection de la communauté par qPCR. Le séquençage des gènes ou des génomes des agents pathogènes dans les eaux usées fournit des informations sur la diversité génétique des agents pathogènes, qui peuvent être utilisées pour identifier des lignées virales (y compris des variants préoccupants) qui circulent dans une population locale. La saisie de la diversité génétique par séquençage de SEU n’est pas simple, car les échantillons d’eaux usées contiennent souvent un mélange varié de lignées virales avec des mutations réelles et des erreurs de séquençage, qui doivent être déconvoluées à l’aide d’ordinateurs à partir de courtes lectures de séquençage. Dans cette étude, nous évaluons neuf outils informatiques différents qui ont été récemment mis au point pour relever ce défi. Nous avons simulé 100 échantillons de séquences d’eaux usées comprenant les lignées SRAS-CoV-2 BA.1, BA.2 et Delta, dans divers mélanges, ainsi qu’un recombinant Delta-Omicron et une lignée synthétique « nouvelle ». La plupart des outils ont permis d’identifier les véritables lignées présentes et d’estimer leur abondance relative, et ces résultats ont été généralement fiables face aux variations de la profondeur de séquençage et de la longueur des lectures. Si de nombreux outils ont permis d’identifier des lignées présentes jusqu’à une fréquence de 1 %, les résultats étaient plus fiables au-delà d’un seuil de 5 %. La présence d’une lignée synthétique inconnue, qui représente une lignée de SRAS-CoV-2 non répertoriée, augmente le risque d’erreur dans les estimations de l’abondance relative des autres lignées, mais l’ampleur de cet effet était faible pour la plupart des outils. Les outils varient également dans leur manière d’identifier les nouvelles lignées synthétiques et les recombinants. Bien que notre ensemble de données simulé ne représente qu’un des nombreux cas d’utilisation possibles de ces méthodes, nous espérons qu’il aidera les utilisateurs à comprendre les sources potentielles de bruit ou de biais dans les données de séquençage des eaux usées et à évaluer les points communs et les différences entre les méthodes.
Tracking SARS-CoV-2 variants of concern in wastewater: an assessment of nine computational tools using simulated genomic data (Détection des variants préoccupants du SRAS-CoV-2 dans les eaux usées : évaluation de neuf outils informatiques à l’aide de données génomiques simulées). Steven G. Sutcliffe, Susanne A. Kraemer, Isaac Ellmen, Jennifer J. Knapp, Alyssa K. Overton, Delaney Nash, Jozef I. Nissimov, Trevor C. Charles, David Dreifuss, Ivan Topolsky, Pein I. Baykal, Lara Fuhrmann, Kim P. Jablonski, Niko Beerenwinkel, Joshua I. Levy, Abayomi S. Olabode, Devan G. Becker, Gopi Gugan, Erin Britnell, Art F. Y. Poon, Renan Valieris, Rodgrigo D. Drummond, Alexandre Defelicibus, Emmanuel Dias-Neto, Rafael A. Rosales, Israel Tojal da Silva, Aspasia Orfanou, Foti Psomopoulos, Nikolaos Pechlivanis, Lenor Pipes, Zihao Chen, Jasmijn A. Baaijens, Michael Baym, B. Jesse Shapiro. biorxiv. 2023.12.20.572426; https://www.biorxiv.org/content/10.1101/2023.12.20.572426v1