Il y a quelque chose d’un peu surréaliste à avoir des dizaines de processeurs et des gigaoctets de mémoire à portée de main. C’est pourtant l’essence même du calcul haute performance (HPC) : en centralisant les serveurs dans les centres de données et en ouvrant des canaux de communication sécurisés avec l’utilisateur, les installations HPC ont considérablement réduit la charge d’achat et de maintenance des superordinateurs. Pour les utilisateurs, cela a rendu plus facile que jamais l’accès à ces ressources ; n’importe quel ordinateur portable, tablette ou même smartphone peut le faire sans tracas. Les plateformes de cloud computing, telles qu’AWS d’Amazon, GCP de Google ou Azure de Microsoft, sont les choix les plus populaires, mais la plupart des instituts de recherche et des entreprises ont leur propre centre de données et suivent les mêmes principes.

Du côté positif, de tels développements informatiques ont permis des découvertes telles que la première image directe d’un trou noir à 55 millions d’années-lumière, des prévisions météorologiques plus précises que jamais et la découverte de milliers de variantes génétiques liées à la maladie. Pour mesurer l’ampleur de l’utilisation du HPC, nous pouvons examiner les statistiques d’utilisation de XSEDE, Extreme Science and Engineering Discovery Environment, un réseau de centres de données des universités américaines utilisés pour la recherche scientifique. En 2020, chaque heure, un million d’heures de calcul ont été effectuées sur le réseau, pour un total de neuf milliards d’heures de calcul.

Quel est le problème avec ça ? Après tout, cela conduit à des découvertes révolutionnaires. Il nécessite également des montagnes de matériel et d’électricité pour l’alimenter, ce qui a un coût environnemental important, bien que largement ignoré. On estime que les centres de données ont une empreinte carbone annuelle de 100 mégatonnes de CO2e à partir de la seule production d’électricité, semblable à l’ensemble du secteur de l’aviation commerciale des États-Unis. Comme prévu, cela ne fera qu’augmenter dans les années à venir, 2 à 9 fois au cours de la prochaine décennie, selon certaines études.

READ  Un homme d'Apple Valley est sorti de l'hôpital, 1 sur 10 qui a eu un COVID lors d'un barbecue familial dans la cour à Fontana

Une variété d’impacts environnementaux

Les grandes installations informatiques affectent l’environnement de nombreuses manières : production d’énergie, fabrication de matériel informatique, gestion du stockage à long terme, refroidissement, maintenance, etc.

L’utilisation de l’énergie est peut-être l’aspect le plus discuté dans les médias. Le coût environnemental de l’alimentation des datacenters dépend directement de l’empreinte carbone de la production d’énergie, qui varie fortement avec le mix énergétique du pays où se situe le datacenter. Par exemple, la production de 1 kWh d’électricité en Suisse (alimentée principalement par l’hydroélectricité) émet 12 gCO2e en moyenne, mais 253 gCO2e au Royaume-Uni et 880 gCO2e en Australie (où le charbon est la principale source d’énergie). Par conséquent, cela signifie que la même tâche aura une empreinte carbone 73 fois plus élevée en Australie qu’en Suisse.

Cependant, c’est loin d’être le seul inconvénient. La fabrication de matériel informatique est notoirement nocive pour l’environnement en raison de l’extraction de métaux précieux. Pour les appareils grand public, 70 à 80 % de l’empreinte carbone totale provient de la fabrication, l’utilisation et l’élimination étant uniquement responsables des 20 à 30 % restants. Cela montre à quel point il est important d’essayer d’entretenir, de réparer et de réutiliser nos appareils autant que possible. Dans les centres de données, il est également important de considérer l’impact environnemental dans le cycle de renouvellement du matériel.

Intelligence artificielle : grands modèles, énorme empreinte carbone

« L’entraînement d’un seul modèle d’IA peut émettre autant de carbone que cinq voitures au cours de sa vie. » Ce titre est apparu à la une de tous les journaux technologiques à l’été 2019, de Examen de la technologie du MIT pour Nouveau scientifique. Cela a continué un article qui étudie l’empreinte carbone des algorithmes essayer de comprendre le langage naturel, une tâche extrêmement difficile dans laquelle les algorithmes s’exécutent souvent pendant des jours, voire des semaines. Des préoccupations similaires ont été soulevées dans des articles tels que « IA verte‘ et ‘Sur les dangers des perroquets stochastiques : les modèles de langage peuvent-ils être trop gros ?« où les chercheurs discutent de la question de l’accessibilité (qu’advient-il de la recherche si seule une poignée d’entreprises technologiques peuvent se permettre de développer de tels modèles ?) et des risques que posent ces technologies. Ils notent notamment que les populations qui souffrent le plus du coût environnemental de l’IA bénéficient également moins d’innovations comme Siri d’Apple ou Alexa d’Amazon. Malgré les problèmes éthiques qui se posent si ces entreprises technologiques sont les seules à encadrer les modèles linguistiques qui sous-tendent de nombreux aspects de la société. Presque pour illustrer ce point, Google a dissous le IA éthique team, qui a participé à la rédaction de l’article sur les perroquets stochastiques peu après sa parution.

READ  La structure sphéroïdale nouvellement développée reproduit le microenvironnement des tumeurs.

Ces différentes études ont conduit au développement de plusieurs outils visant spécifiquement à estimer l’empreinte carbone des modèles d’apprentissage automatique, comme le Impact ML CO2 et le Suivi de l’impact des expériences.

L’IA peut être l’arbre qui cache la forêt

Les besoins informatiques croissants de l’intelligence artificielle sont une véritable source de préoccupation, mais il ne faut pas oublier tous les autres domaines de la science qui reposent eux aussi fortement sur le calcul. Comme évoqué au début, les algorithmes complexes sont partout, de la génomique à la physique en passant par l’astronomie. Cette compréhension que l’empreinte carbone doit être prise en compte par tous les scientifiques utilisant des algorithmes, et pas seulement l’IA, est ce qui a conduit au développement d’une vaste initiative : le projet Green Algorithms. C’est un Cadre théorique (Un autre !) Pour estimer l’empreinte carbone de tout calcul, mais surtout, un calculateur en ligne pour une estimation facile. Cela a permis de faire la lumière sur le empreinte carbone de la bioinformatique par exemple, lorsque des outils de génomique ou des simulations moléculaires émettent des kilogrammes de CO2e à chaque utilisation.