
Plateforme canadienne de génomique et de santé de précision
Offrir de meilleurs résultats aux Canadiens en facilitant l'obtention de découvertes fondées sur l'IA à travers des réseaux de données dans les domaines des neurosciences, de l'oncologie, des maladies rares, des maladies infectieuses, des soins de santé, de l'agriculture et au-delà.
Résumé du projet
Mis à jour le 3 janvier 2025
Le problème
Pour faire des découvertes, les scientifiques et les décideurs ont besoin de données. Ces ensembles de données sont actuellement répartis dans de nombreux systèmes institutionnels, régionaux et nationaux différents, ce qui rend impossible de tirer parti de leur pouvoir collectif pour obtenir des informations. L'approche traditionnelle du « partage de données » centralisé - où les ensembles de données sont combinés en les téléchargeant et en les analysant en un seul endroit - ne convient pas aux ensembles de données sensibles, car la colocalisation des données est inefficace, non sécurisée, non évolutive ni conforme à la réglementation, et n'autorise pas les données. intendants pour garder le contrôle sur les données.
Comment nous le résolvons
La technologie développée tout au long de ce projet permettra des « informations fédérées » préservant la confidentialité, où les informations peuvent être dérivées à travers des ensembles de données distribués sans les déplacer. Toutes les données restent en place et ainsi, au lieu de « déplacer les données vers la question », cette nouvelle approche « déplace les questions vers les données ». Ceci est plus efficace, sécurisé, évolutif, conforme et permet aux dépositaires de garder le contrôle sur les données. Le CP4GPH sera utilisé pour former des modèles alimentés par l'IA à travers des réseaux fédérés de données dans les domaines des neurosciences, de l'oncologie, des maladies rares, des maladies infectieuses, des soins de santé, de l'agriculture et au-delà.
L'objectif du projet est de démocratiser l'accès aux technologies de pointe pour les groupes de clients de l'écosystème de la génomique et de la santé de précision afin de pouvoir créer, développer et tirer parti des réseaux d'apprentissage fédérés. Pour aider à atteindre ces objectifs, le projet créera un menu de nouveaux logiciels et de services connexes pouvant être concédés sous licence aux générateurs de données (tels que les sociétés de séquençage, les hôpitaux, les initiatives de santé de précision, les groupes de défense des patients et les bailleurs de fonds) qui souhaitent accroître l'impact de leurs données, et aux consommateurs de données (tels que les ministères de la santé et les sociétés pharmaceutiques) qui souhaitent extraire des informations à partir de données partagées.
Le projet cultivera un écosystème d'innovation ouvert auquel d'autres parties prenantes pourront se connecter et commercialisera à terme des solutions de pointe pour gérer, partager, analyser et traduire les informations issues de la génomique et des données de santé. Cela placera le Canada à l'avant-garde de la santé de précision : stimuler l'innovation, créer des emplois et favoriser la recherche et la découverte de haut calibre.
*Financement redirigé par Autism Speaks, PacBio et Roche pour financer DNAstack, McGill, Holland Bloorview, l'Université du Nouveau-Brunswick (UNB) et SickKids. DNAstack supervisera la gestion et la distribution de ce fonds pour le compte d'Autism Speaks, PacBio et Roche.
Le Résultat
L'objectif principal du projet CP4GPH était de démocratiser l'accès aux technologies de pointe pour les groupes de clients de l'écosystème de la génomique et de la santé de précision afin de pouvoir créer, développer et tirer parti des réseaux d'apprentissage fédérés. La réalisation de cet objectif s'est concrétisée par de multiples lancements commerciaux de nouveaux produits, services et partenariats par les partenaires du consortium au cours du projet :
Lancement d'Omics AI
En septembre 2023, DNAstack a lancé publiquement son IA omique Suite logicielle. Ensemble, les produits logiciels inclus dans Omics AI peuvent être utilisés pour créer des réseaux fédérés conformes aux normes et permettre l'exécution d'analyses fédérées sur des données connectées. La suite logicielle de bout en bout est conforme aux normes ouvertes développées par la Global Alliance for Genomics and Health et peut être déployée sur plusieurs plates-formes cloud ainsi que sur site.
Lancement du pipeline de variantes WGS et du marché des workflows
En octobre 2023, PacBio a annoncé la sortie du Pipeline de variantes WGS – une méthode de calcul complète et standardisée pour l’analyse des données de séquençage du génome entier (WGS) HiFi, ce qui en fait le pipeline d’analyse secondaire WGS humain le plus complet disponible à ce jour. En parallèle, DNAstack a lancé sa place de marché Workflows pour unifier l’analyse omique et permettre aux scientifiques de découvrir et d’exécuter plus facilement et en toute sécurité des pipelines de calcul fiables, de haute qualité et reproductibles pour l’analyse des données omiques. La place de marché comprend une collection organisée de pipelines de meilleures pratiques pour le traitement des données des fabricants d’instruments de séquençage les plus populaires, dont PacBio.
Partenariats
En raison des progrès réalisés par Integrate.ai, ils ont été sélectionnés comme partenaire technologique d'apprentissage fédéré pour alimenter l'un des plus grands consortiums de santé de précision au monde. Leur partenariat avec l'Institut de recherche Terry Fox pour fournir le Plateforme de santé et de découverte numérique (DHDP) fera progresser les soins de santé au Canada grâce à une technologie d’IA de pointe et à un cadre d’accès et de gouvernance des données de premier ordre.
Version MSSNG DB7
Grâce à tous les travaux réalisés par les partenaires du consortium — DNAstack, Autism Speaks et SickKids Hospital —, Autism Speaks a étendu son réseau. MSNG base de données, le plus grand ensemble de données sur le génome entier de l'autisme au monde, avec sortie de DB7; en ajoutant 2,300 13,500 séquences de génomes entiers ainsi que des données phénotypiques associées, ce qui porte le nombre total d'échantillons dans MSSNG à 700 XNUMX. En plus des échantillons MSSNG, XNUMX échantillons du Qatar seront inclus dans la version, ce qui est essentiel pour des soins de santé personnalisés pour les communautés sous-représentées. Cette avancée contribuera à l'objectif de fournir aux chercheurs les meilleures ressources pour permettre l'identification des sous-types d'autisme, ce qui ouvrira la voie à de meilleurs diagnostics, ainsi qu'à des traitements personnalisés et plus précis.
Chef de projet
Partenaires du projet
-
« Nous croyons que la prochaine génération de découvertes, d’essais cliniques et de soins de santé sera rendue possible par la mise en œuvre de systèmes de santé apprenants en réseau qui fonctionnent ensemble pour fournir des informations plus approfondies et de meilleurs résultats aux personnes et aux familles plus rapidement que jamais auparavant. Le projet CP4GPH a accéléré notre capacité à incuber, valider et commercialiser des produits logiciels aux côtés de partenaires animés par la même mission de faire progresser la santé de précision. Ce projet a favorisé une percée dans notre capacité collective à développer un Internet pour les sciences omiques et la recherche en santé au Canada et au-delà de nos frontières. »