Microsoft envoie un nouveau type de processeur AI dans le nuage
Microsoft est devenu dominant dans les années 80 et 90 grâce au succès de son système d’exploitation Windows fonctionnant sur les processeurs Intel, une relation cosy surnommée » « .Wintel”.
Maintenant, Microsoft espère qu’une autre combinaison matériel-logiciel l’aidera à récupérer ce succès et à rattraper ses rivaux Amazon et Google dans la course pour fournir une intelligence artificielle de pointe à travers le cloud.
Microsoft espère étendre la popularité de son Plate-forme nuageuse azur avec un nouveau type de puce informatique conçu pour l’âge de l’IA. À partir d’aujourd’hui, Microsoft fournit aux clients d’Azure l’accès aux puces fabriquées par la startup britannique. Graphcore.
Graphcore, fondée à Bristol, au Royaume-Uni, en 2016, a attiré l’attention des chercheurs en IA – et plusieurs centaines de millions de dollars d’investissement – sur la promesse que ses puces accéléreront les calculs nécessaires pour que l’IA fonctionne. Jusqu’à présent, il n’a pas rendu les puces accessibles au public et n’a pas présenté les résultats des essais auxquels ont participé les premiers testeurs.
Microsoft, qui a investi son propre argent dans Graphcore en décembre dernier dans le cadre d’une ronde de financement de 200 millions de dollars, est à la recherche de matériel qui rendra ses services cloud plus attractifs pour le nombre croissant de clients pour les applications AI.
Contrairement à la plupart des puces utilisées pour l’IA, les processeurs de Graphcore ont été conçus de toutes pièces pour supporter les calculs qui aident les machines à reconnaître les visages, comprendre le discours, langage analytique, voitures motriceset robots de train. Graphcore s’attend à ce qu’il plaise aux entreprises qui effectuent des opérations critiques sur l’intelligence artificielle, telles que les démarrages automobiles, les sociétés de commerce et les opérations qui traitent de grandes quantités de vidéo et d’audio. Ceux qui travaillent sur les algorithmes d’intelligence artificielle de la prochaine génération pourraient également être intéressés à explorer les avantages de la plate-forme.
Microsoft et Graphcore ont publié aujourd’hui des benchmarks qui suggèrent que la puce correspond ou dépasse les performances des principales puces AI de Nvidia et Google en utilisant des algorithmes écrits pour ces plateformes rivales. Le code écrit spécifiquement pour le matériel de Graphcore peut être encore plus efficace.
Les sociétés affirment que certaines tâches de traitement d’image fonctionnent beaucoup plus rapidement sur les puces de Graphcore, par exemple, que sur celles de ses concurrents utilisant du code existant. Ils disent aussi qu’ils ont été en mesure de former un modèle d’IA populaire pour le traitement du langage, appelé BERT, à des taux correspondant à ceux de tout autre matériel existant.
L’ORET est devenu extrêmement important pour les applications d’intelligence artificielle impliquant la langue. Google a récemment déclaré qu’elle utilise l’ORET pour son activité principale de recherche. Microsoft dit qu’elle utilise maintenant les puces de Graphcore pour ses projets internes de recherche en intelligence artificielle impliquant le traitement du langage naturel.
Karl Freundqui suit le marché des puces AI chez Moor Insights, affirme que les résultats montrent que la puce est à la fine pointe de la technologie tout en restant flexible. Une puce hautement spécialisée pourrait surpasser celle de Nvidia ou de Google, mais ne serait pas suffisamment programmable pour permettre aux ingénieurs de développer de nouvelles applications. « Ils ont fait du bon travail en le rendant programmable, dit-il. « Ils ont toujours dit qu’ils feraient une bonne performance à l’entraînement et à l’inférence, mais c’est très, très difficile. »
Freund ajoute que l’accord avec Microsoft est crucial pour l’activité de Graphcore, car il fournit une rampe d’accès pour les clients pour essayer le nouveau matériel. La puce peut être supérieure au matériel existant pour certaines applications, mais il faut beaucoup d’efforts pour redévelopper le code AI d’une nouvelle plate-forme. À quelques exceptions près, dit M. Freund, les points de repère de la puce ne sont pas assez révélateurs pour attirer les entreprises et les chercheurs loin du matériel et des logiciels qu’ils sont déjà à l’aise d’utiliser.
Graphcore a créé un framework logiciel appelé Poplar, qui permet de porter les programmes d’IA existants sur son matériel. Beaucoup d’algorithmes existants peuvent encore être mieux adaptés à des logiciels qui fonctionnent sur du matériel concurrent, cependant. Google Tensorflow Le framework logiciel d’IA est devenu la norme de facto pour les programmes d’IA ces dernières années, et il a été écrit spécifiquement pour les puces Nvidia et Google. Nvidia devrait également sortir une nouvelle puce d’IA l’an prochain, qui devrait être plus performante.
Nigel Toon, cofondateur et PDG de Graphcore, explique que les deux sociétés ont commencé à travailler ensemble un an après le lancement de son entreprise, par le biais de Microsoft Research Cambridge au Royaume-Uni. Les puces de son entreprise sont particulièrement bien adaptées aux tâches qui impliquent de très grands modèles d’IA ou des données temporelles, dit-il. Un client de la finance aurait vu ses performances multipliées par 26 dans un algorithme utilisé pour analyser les données du marché grâce au matériel de Graphcore.
Une poignée d’autres petites entreprises ont également annoncé aujourd’hui qu’elles travaillent avec des puces Graphcore via Azure. Il s’agit notamment Citadellequi utilisera les puces pour analyser les données financières, et Qwantun moteur de recherche européen qui veut que le matériel exécute un algorithme de reconnaissance d’image connu sous le nom de ResNext.
Le boom de l’intelligence artificielle a déjà secoué le marché des puces informatiques ces dernières années. Les meilleurs algorithmes effectuent des calculs mathématiques parallèles, ce qui peut être fait plus efficacement sur des puces graphiques (ou GPU) qui ont des centaines de cœurs de traitement simples par opposition aux puces conventionnelles (CPUs) qui ont quelques cœurs de traitement complexes.
Le fabricant de GPU Nvidia a monté la vague de l’IA vers la richesse, et Google a annoncé en 2017 qu’il allait développer sa propre puce, l’unité de traitement Tensor, dont l’architecture est similaire à celle d’un GPU mais optimisée pour Tensorflow.
Les puces de Graphcore, qu’il appelle des unités de traitement du renseignement (IPU), ont beaucoup plus de cœurs que les GPU ou TPU. Ils disposent également d’une mémoire sur la puce elle-même, ce qui élimine un goulot d’étranglement qui accompagne le transfert des données sur une puce pour traitement et suppression.
Facebook travaille également sur ses propres puces d’IA. Microsoft a précédemment vanté des puces reconfigurables fabriquées par Intel et personnalisées par ses ingénieurs pour les applications AI. Il y a un an, Amazon a révélé qu’il était aussi se lancer dans la fabrication de pucesmais avec un processeur plus polyvalent optimisé pour les services cloud d’Amazon.
Plus récemment, le boom de l’intelligence artificielle a déclenché une vague d’entreprises de quincaillerie en démarrage pour développer des puces plus spécialisées. Certaines de ces caméras sont optimisées pour des applications spécifiques telles que la conduite autonome ou les caméras de surveillance. Graphcore et quelques autres offrent des puces beaucoup plus flexibles, cruciales pour le développement d’applications AI mais aussi beaucoup plus difficiles à produire. La dernière ronde d’investissement de la société lui a donné une évaluation de 1,7 milliard de dollars.
Les puces de Graphcore pourraient d’abord trouver un écho auprès des meilleurs experts en intelligence artificielle qui sont capables d’écrire le code nécessaire pour exploiter leurs avantages. Plusieurs éminents chercheurs en IA ont investi dans Graphcore, dont Demis Hassabis, cofondateur de DeepMind, Zoubin Ghahramaniprofesseur à l’Université de Cambridge et directeur du laboratoire d’IA d’Uber, et Peiter Abbeel, professeur à l’Université de Berkeley qui se spécialise en IA et en robotique. Dans une interview avec WIREDEn décembre dernier, Geoffrey Hinton, visionnaire de l’IA, a discuté du potentiel des puces Graphcore pour faire avancer la recherche fondamentale.
D’ici peu, les entreprises peuvent aussi être tentées d’essayer les dernières nouveautés. Comme le dit Toon, PDG de Graphcore, « Tout le monde essaie d’innover, de trouver un avantage. »
Cette histoire est parue à l’origine sur wired.com.
Liste des images par Graphcore