Voir la traduction automatique
Ceci est une traduction automatique. Pour voir le texte original en anglais cliquez ici
#Actualités du secteur
{{{sourceTextContent.title}}}
IA, intégrité des données et sciences de la vie : N'attendons pas que quelqu'un meure
{{{sourceTextContent.subTitle}}}
L'idée de machines capables de penser est devenue le sujet de la science-fiction au début du XXe siècle et a donné lieu à des lectures intéressantes. La science a rattrapé son retard et le terme "intelligence artificielle" (IA) a été inventé par John McCarthy au Dartmouth Summer Research Project on Artificial Intelligence (DSRPAI) en 1956, où le premier programme d'IA, le Logic Theorist, fut présenté par Allen Newell, Cliff Shaw et Herbert Simon.
{{{sourceTextContent.description}}}
La recherche sur l'IA a prospéré au cours des premières années jusqu'à ce qu'elle soit ralentie par les limites de la puissance de calcul, mais elle a été revigorée dans les années 1980 à la fois par les outils informatiques et les investissements lorsque John Hopfield et David Rumelhart ont popularisé des techniques d'apprentissage approfondi qui ont permis aux ordinateurs d'apprendre par l'expérience.1 La prochaine limite à la progression en IA était le stockage informatique, qui, à la fin des années 90, ne posait plus problème, les progrès en stockage donnant des solutions économiques et ubiquistes. Dans notre monde moderne, nous portons dans notre vie quotidienne des appareils qui dépassent la capacité de stockage des supercalculateurs d'il y a quelques décennies seulement. L'IA s'est maintenant généralisée, quittant les laboratoires et entrant dans nos salons avec des assistants intelligents (Alexa et Siri) et des téléviseurs intelligents. L'IA est aux nouvelles et dans nos langues, car il ne se passe pas une semaine sans qu'une publicité télévisée ou quelqu'un dans nos cercles sociaux ne mentionne l'IA. Mais qu'est-ce que l'intelligence artificielle et quel impact pourrait-elle avoir sur notre vie lorsqu'elle est appliquée aux sciences de la vie ?
Entrée et sortie des ordures
Pour les besoins de cette discussion, nous pouvons convenir que l'IA peut donner lieu à des prédictions, à des classifications et à des décisions à partir d'analyses informatiques de grands ensembles de données fondées sur l'apprentissage machine à partir de sources de données représentatives et mieux éclairées par ces données et les résultats connexes. Dans ce contexte, l'IA peut, par exemple, présenter un potentiel important d'amélioration de l'efficacité des activités de recherche et de développement, par exemple en permettant de discerner des cibles médicamenteuses viables à étudier plus avant. Ou encore, l'IA peut offrir une plus grande capacité de fabrication en réduisant le risque de défauts et en accélérant l'examen, la mise en circulation et l'élimination des produits pour l'expédition par la chaîne d'approvisionnement. Cependant, ce potentiel de grande récompense comporte toujours un grand risque, car les erreurs ou les pertes causées par de mauvais résultats d'IA pourraient avoir des répercussions négatives sur la santé publique
Aujourd'hui, l'un des défis de l'IA consiste à développer et à gérer le blanchiment d'argent et l'IA pour traiter le grand volume de données disparates et non normalisées qui est disponible. L'IA est rapidement adoptée dans nos vies, comme en témoignent les exemples de l'électronique grand public. Karan Bedi, COO de Blaupunkt Televisions India, rapporte que " les entreprises de biens de consommation ne négligent aucun effort pour doter leurs produits de technologies numériques et d'IA " et que " de nombreux fabricants d'appareils ménagers intègrent l'Internet des objets (IdO) et l'IA dans leurs produits domestiques ".2 Un exemple courant est la télévision intelligente, dont la part unitaire mondiale est passée de 55 % en 2015 à plus de 70 % en 20183
Considérez comment de mauvaises données pourraient affecter l'expérience de l'IA. L'intégrité et la qualité des données jouent un rôle clé dans les résultats de l'IA. Une entrée de mauvaise qualité peut produire une sortie AI inattendue ou erronée. Prenons, par exemple, l'utilisation d'un téléviseur intelligent où les données de Netflix ont été entrées de façon négligente (p. ex. programmes d'intérêt choisis au hasard) ou l'ouverture d'un compte Hulu a été entrée par un invité interne. Lorsqu'un algorithme utilisé pour la publicité ciblée ou la programmation suggérée dans l'un ou l'autre de ces services est appliqué à l'ensemble de données, les résultats peuvent n'avoir aucune pertinence pour l'utilisateur actuel. Bien que cela puisse être irritant ou inutile, ce n'est pas dangereux pour la vie.
Toutefois, une saisie imprudente des données ou des ensembles de données incorrects liés aux applications des sciences de la vie pourraient avoir des conséquences qui incluent la mortalité. "Les algorithmes d'apprentissage machine sont très dépendants de données d'apprentissage précises, propres et bien étiquetées pour en tirer des leçons afin de pouvoir produire des résultats précis ", explique Ron Schmelzer.4 Au cours de ML, des entrées biaisées ou erronées peuvent entraîner des résultats inexacts ou erronés qui n'ont aucune pertinence pour le patient en question. Bien qu'il soit peu probable qu'il y ait des erreurs, l'acceptabilité d'une erreur diminue considérablement lorsqu'on tient compte des répercussions négatives sur la santé des patients et la sécurité publique. Regarder des publicités de programmation de Netflix qui ne présentent aucun intérêt est une chose - être dosé avec le mauvais médicament en est une autre.
Commencez par la fin en tête
Un marché est apparu pour les solutions de préparation de données (y compris ClearStory Data, Datameer, Datawatch, Melissa Data, Oracle, Paxata, SAP, SAS, TIBCO Software, Trifacta et Unifi Software) qui effectuent des querelles de données, le nettoyage et la préparation des données pour permettre la ML et AI. En fait, " la grande majorité du temps des projets d'apprentissage machine " est consacrée à ces activités.4 Cependant, au rythme où les données sont créées, il est probable que la capacité de préparer les données sera dépassée par l'accumulation de données à préparer.
La préparation des données continue d'exiger un certain niveau d'interaction humaine. Au minimum, un humain doit configurer la spécification pour la transformation des données pendant l'ETL (extraction, transformation et chargement) lors de la collecte de données à partir de sources multiples ou de la migration de données vers une base de données centrale. Pourtant, les querelles de données représentent potentiellement une plus grande implication humaine, car le contexte peut être nécessaire pour effectuer un traitement avancé pour la transformation de données robustes
Que les solutions de préparation des données puissent suivre ou non, l'argument demeure en faveur de l'amélioration de l'intégrité et de la qualité des données au fur et à mesure qu'elles sont créées, plutôt que d'essayer de les nettoyer plus tard alors qu'elles sont préparées pour le blanchiment et l'IA. Cela se fait en grande partie grâce à la gestion des données et à la gouvernance de l'information, où l'intégrité et la qualité des données sont des principes fondamentaux. Il incombe à ceux qui créent des solutions d'IA pour les sciences de la vie d'accorder la plus grande attention à l'intégrité et à la qualité des données afin d'atténuer le risque d'impact négatif sur la santé des patients et la sécurité publique. L'IA pour les solutions en sciences de la vie est tenue à un niveau plus élevé que dans les autres secteurs de l'industrie.
L'intégrité des données : un facteur critique de succès
L'intégrité et la qualité des données sont des facteurs critiques de succès pour les solutions d'IA dans les sciences de la vie. Les normes et la vérification de l'intégrité et de la qualité des données doivent être élevées pour les ensembles de données pour lesquels le blanchiment d'argent et le financement du terrorisme sont censés être appliqués. La simple validation des systèmes informatiques (CSV) ou la gestion des systèmes informatiques dans les conditions du CGMP ne suffit pas pour assurer l'intégrité et la qualité des données.
L'intégrité et la qualité des données doivent être des thèmes communs dans un système de gestion de la qualité parvenu à maturité et être intégrées de manière proactive dans la gestion des données et la gouvernance de l'information en tant qu'activité principale. Nous constatons que lorsque les entreprises comprennent que l'intégrité et la qualité des données sont des facteurs critiques de succès, il en résulte un avantage concurrentiel. Moins d'erreurs humaines peuvent se produire et les enquêtes peuvent être terminées plus rapidement et avec plus de succès lorsqu'elles le sont. Les activités de fusions et acquisitions sont rendues plus efficaces et efficientes, car la diligence raisonnable est plus facile à faciliter et l'évaluation est plus claire avec des données défendables et des ressources humaines qui peuvent les comprendre et les expliquer. Ces facteurs de succès conduisent à de meilleurs résultats d'IA, à une meilleure capacité à fournir des produits aux patients et à une valeur accrue pour les propriétaires et les actionnaires.
Maintenant que l'IA est de plus en plus répandue, on nous pose très directement des questions pratiques et éthiques, car nous " permettons à l'IA de s'améliorer et de devenir de plus en plus fou dans la société ".1 Quand un résultat d'IA fondé sur de mauvaises données finira-t-il par entraîner des blessures humaines ou même la mort ? À quel moment l'intention malveillante aura-t-elle pour effet d'influencer les résultats de l'IA et d'entraîner des blessures ou la mort ? Souvenez-vous des " meurtres de Tylenol de 1981 " et comment les mesures réglementaires et industrielles qui en ont résulté ont changé à jamais la façon dont nous emballons les médicaments.5 Nous comporterons-nous de manière réactive, en attendant qu'un " événement au niveau du Tylenol " nous force à nous gouverner et que les mauvaises données que nous transmettons à la GA ? Ou allons-nous agir de manière proactive pour gérer avec ferveur nos données afin de prévenir les effets négatifs sur la santé des patients et la vie humaine ?