Un laboratoire basé en Nouvelle-Zélande entend développer des modèles d’assistants virtuels et les doter d'une véritable intelligence artificielle particulièrement évolutive et capable de reproduire des comportements humains. Mais pas que. Il a déjà élaboré des humanoïdes répondant à d’autres fonctions, moins commerciales. Ce laboratoire, c’est celui qui a été fondé en 2012 par le célèbre ingénieur Mark Sagar, également co-fondateur de Soul Machines, une société qui a récemment fait parler d’elle après avoir conclu un partenariat avec l'OMS, au début de la pandémie de la Covid-19, afin de développer une assistante virtuelle intelligente censée aider les fumeurs à quitter le tabagisme.  

Du cinéma à l’IA

Tout a commencé au printemps 2010, lorsque l’informaticien Mark Sagar a écrit un e-mail étonnant à son patron de l’époque, le réalisateur Peter Jackson. Sagar avait été le superviseur des projets d’effets spéciaux pour le film phare de Jackson sorti en 2005, King Kong, reconnu pour la technologie déployée, permettant la capture des mouvements du visage et qui a permis au grand singe d’étonner les cinéphiles du monde entier.  

Avec deux prix scientifiques et d'ingénierie de l'Académie des arts et des sciences du cinéma en poche, Sagar semblait avancer dans une carrière prometteuse dans le 7ème art. La technologie qu'il avait aidé à inventer – "un système d'animation de personnages basé sur l'expression", comme l'avait dit l'académie - avait joué un rôle indispensable dans la réalisation du film le plus rentable de tous les temps, Avatar de James Cameron.

Mais l'ingénieur élaborait en même temps un plan plus ambitieux. Pour qu'un personnage soit vraiment réaliste, pensait Sagar, ses expressions doivent venir de l'intérieur de sa composition numérique et être le produit d’une réponse à un éventail de processus internes comparables à ceux d'une créature vivante. Plutôt que de se contenter de créer des singes générés par ordinateur, Sagar a préféré imaginer la possibilité de créer des entités qui apprendraient, ressentiraient, se souviendraient et interagiraient avec les gens de la même manière que nous interagissons les uns avec les autres. Il voulait construire un humain numérique. Dans l'e-mail à Jackson, il a présenté son idée comme un outil de narration immersive - des mondes remplis d'êtres numériques qui pourraient fonctionner de manière semi-autonome. "Plutôt que de regarder une histoire de manière passive, imaginez être face à face avec un personnage vivant et que chaque petite action que vous faites affecte [son comportement]", a-t-il écrit. "Pour cela, le personnage doit avoir des sens, a poursuivi Sagar dans son texte, et un cerveau qui vous répond".

En fait, grâce à une formation en biologie computationnelle (ou biologie numérique), il avait créé des modèles numériques de l'œil et du cœur destinés au secteur médical. Sagar a donc pensé qu'il pourrait utiliser la même approche pour construire un "cerveau" numérique. "Je pense que la technologie en est au stade où nous pouvons le faire", écrivait-il à Jackson. Le résultat serait "un tout nouveau moyen d'interaction sociale avec des personnages numériques, des histoires qui s'écrivent elles-mêmes, avec des chemins virtuellement infinis". Jackson, lui, n'a pas tout à fait compris la démarche, étant conscient de la certitude partagée par les neuroscientifiques selon laquelle notre compréhension du cerveau humain est encore beaucoup trop limitée pour que l’on puisse envisager de construire un cerveau numérique authentique. Toujours est-il que le réalisateur n'a jamais daigné lui répondre.

Sagar est alors passé à autre chose. Il a, selon OneZero, fini par trouver un public plus réceptif à son argumentaire au sein du département d'informatique de l'Université d'Auckland, où il avait obtenu son doctorat en ingénierie. L'école lui a rapidement mis en place un bureau et un petit budget de recherche. Et au prix d’une réduction de salaire, il a eu la liberté totale d’explorer sa vision. C’est comme cela que Sagar a mis en place le "Laboratoire des technologies d'animation" et formé une équipe de recherche. Quelques années plus tard, Chris Liu d'Horizons Ventures - la société de capital-risque basée à Hong Kong connue pour ses investissements dans DeepMind, Siri, Impossible Foods – lui a rendu visite. En novembre 2016, Horizons a investi 7,5 millions de dollars pour aider Sagar à lancer une startup, Soul Machines, dans le but de poursuivre des recherches du même type.

Soul Machines: une immense machine à fabriquer des machines visuelles

Aujourd’hui, Soul Machines est devenu un pionnier mondial de l'IA générale (AGI), et se consacre à fournir des outils rendant possible la collaboration machines/humains d'une manière réactive et fiable. Composée de certains des meilleurs chercheurs en IA, de neuroscientifiques et de psychologues, l'entreprise explore à fond le potentiel de la technologie en créant des personnes numériques interactives et émotionnellement réactives pouvant nous parler en face à face. Soul Machines a déployé les premiers "Digital People" pour de grandes entreprises opérant dans les secteurs des services financiers, de la technologie, de l'automobile, de la santé, du divertissement et de l'éducation. La société néo-zélandaise compte actuellement plus de 120 employés avec des bureaux à San Francisco, Los Angeles, New York, Londres, Tokyo, Melbourne et Auckland… Au cours des trois dernières années, elle a pu élaborer une série d'avatars virtuels destinés à plusieurs grandes entreprises friandes de ce type de technologies pour perfectionner leurs services.

Elle entend aller toujours plus loin, en développant notamment des humanoïdes dotés de l’apparence de célébrités ou de personnages historiques. D'autres seront personnalisables à l'infini pour ressembler à ce que leurs utilisateurs désirent avoir pour "compagnons". On peut penser ici au personnage holographique de Joi, petite amie virtuelle du personnage principal campé par Ryan Gosling dans Blade Runner 2049... Mais dans la réalité actuelle, qui n’en est évidemment pas encore là, la plupart de ces assistants numériques seront probablement d’abord enrôlés dans le secteur des relations client, celui des ressources humaines internes, ou encore dans le conseil en investissement ou les assurances. Les experts du secteur estiment qu’environ 85 % des relations clients seront gérées via une interaction non humaine dans les prochaines années. Les chatbots et les systèmes de réponse vocale interactive (dispositifs non visuels) prédomineront bien sûr. Mais c’est sur le marché des robots visuellement accessibles que Soul Machines est déterminée à se tailler la part du lion.

Le grand avantage du déploiement d'un avatar visuel, selon Greg Cross, directeur commercial et co-fondateur de Soul Machines, est qu'il permet aux utilisateurs de communiquer avec la manière pour laquelle nous humains avons été conçus et habitués depuis la naissance: parler en face à face. "Vous n'entendez pas simplement une voix ou ne lisez pas un flux de texte, explique-t-il. Vous avez beaucoup plus de contexte, l'expression, les gestes, le lien émotionnel". Reste à savoir si les humains numériques deviendront plus qu'un gadget marketing amusant, même si de l’avis de tous les observateurs, les résultats ne sont jusqu’ici impressionnants que d’un point de vue graphique.

Des clients de divers domaines

Sagar attribue à la gamme des avatars que son équipe a construits - des algorithmes qui cherchent à recréer les fonctions d'un cerveau, d'un système nerveux et des aspects connexes de l'anatomie humaine – la possibilité de mieux imiter nos gestes, expressions et autres mouvements subtils. Mais un visage réaliste n'est qu'une partie du plan de l'entreprise. Sagar affirme que son objectif ultime est de créer une "machine d'apprentissage générale", une "intelligence artificielle autonome", dont une machine dotée de capacités cognitives que nous attribuons généralement aux êtres humains. Et "l'idée qu'une petite startup en Nouvelle-Zélande, un monde loin des géants de la Silicon Valley, pourrait un jour y parvenir […] est un signe de l'ambition vertigineuse de Sagar, et peut-être aussi son auto-illusion", commente OneZero.

La grande société australienne de gestion de créances Collection House Ltd a en tout cas rapidement été tentée par l’offre de la startup néo-zélandaise. Elle avait d’abord lancé un portail Web mettant en vedette deux chatbots répondant avec des textes de dessin animé. Nommés Kash et Kara, ces agents conversationnels invitent de manière apaisée les débiteurs à connaître leurs options, à partager les détails de leur situation financière et à convenir d'une solution. Le PDG de Collection House Ltd, Anthony Rivas, explique au magazine OneZero que cette nouvelle approche a eu un tel succès que la société a récemment décidé d’engager Soul Machines pour créer une version virtuelle interactive de Kash. "Kash sera doté de beaucoup plus d'humanité", promet-il. "Les gens se sentiront en sécurité avec lui, comme s'ils parlaient face à face avec une personne qui ne les jugera pas". Il ne faut effectivement pas oublier que les agents de recouvrement de créances sont souvent vus avec un œil inquiet et peu confiant par les débiteurs… Raison pour laquelle Rivas est ravi de savoir que ses futurs agents conversationnels interagiront en utilisant des outils de reconnaissance émotionnelle qui peuvent déduire l'humeur d'un client à partir de ses expressions faciales et de ses intonations vocales. "Si un client accepte d'allumer sa webcam, nous pourrons détecter sa réaction émotionnelle. Nous pouvons savoir si les offres que nous proposons le satisfont".

Kash rejoindra un groupe d'assistants numériques déjà déployés par Soul Machines. Au Festival international de la créativité de Cannes de 2019, Soul Machines a présenté Yumi, un "influenceur beauté", adopté par la société japonaise de soins de la peau SK-II. Ou encore Jamie, disponible 24h/24 et 7j/7 pour aider les clients potentiels à ouvrir un compte auprès de la banque néo-zélandaise ANZ Bank.

Actuellement, les capacités conversationnelles des humains numériques de Soul Machines sont rendues possibles grâce à des outils de traitement du langage naturel conçus par IBM, Google, ou encore Amazon. Des limites sont toutefois attendues, car la communication humaine n'est que partiellement basée sur le langage verbal. C'est donc dans d'autres aspects, plus subtils, de l’expression humaine que Sagar a concentré les efforts de son équipe, avec des résultats assez étonnants. Soul Machines affirme avoir développé des modèles mathématiques des différentes régions du cerveau humain - hippocampe, cervelet, corps calleux, hypothalamus, etc. Le laboratoire a également façonné des émulateurs de systèmes biologiques qui interagissent avec le cerveau, comme le cœur et les poumons. Ainsi, si Holly, l’un des humains numériques créés par Soul Machine, semble respirer en parlant, "c'est parce qu'elle est dotée d'un fac-similé codé d'un système respiratoire, contrôlé par des circuits dans son cerveau simulé qui [sont censés] réguler son apport en ‘oxygène’, ou son équivalent numérique", écrit OneZero, qui a rencontré ce personnage virtuel.

BabyX

Bien que Soul Machines commerce avec de grands comptes pour générer des revenus sur ses produits intelligents, son objectif n’est certainement pas de se contenter de créer des visages attrayants pour les chatbots des services à la clientèle... La véritable ambition de Sagar a toujours été de modéliser le cerveau humain lui-même, avec toutes ses complexités. Lui et son équipe ont ainsi conçu un projet pour le moins original. Le résultat est un tout-petit bébé virtuel, bien différent des simples algorithmes d'apprentissage évolutif qui pilotent des véhicules autonomes ou traitent les requêtes de clients au téléphone. Ce projet, c’est BabyX. Il semble avoir environ 18 mois, raconte OneZero, qui l’a rencontré: Avec des yeux écarquillés et curieux, l’apparence du bébé est "inspirée d'une capture stéréoscopique de la propre fille de Sagar". BabyX a été créé peu de temps après que Sagar a ouvert son laboratoire à l'Université d'Auckland en 2012. Il a été présenté lors du cycle des TedX Talks de 2014 par Sagar. Dans la présentation, on peut le voir passer du rire aux larmes en fonction des stimuli sonores envoyés devant un public abasourdi.

Pour l’heure, BabyX peut à peine babiller. Mais d'un simple clic de souris, Sagar peut placer un écran tactile Internet transparent devant son visage. Ayant été programmé pour être attiré par la nouveauté - sa curiosité est récompensée par des éclats de dopamine numérique – le bébé "apprécie" jouer à des jeux. Il "aime" également être regardé ou caressé via un pavé tactile, et devient stressé - ses niveaux de "cortisol" numérique augmentent - lorsqu'il est ignoré pendant un certain temps.

BabyX est aussi conçu pour identifier les intonations d'une voix humaine inquiète, et à mesure que son niveau de stress augmente, il "apprend", dit Sagar, à associer l'image de quelque chose qui rebute, une araignée par exemple, à une réaction de peur. Pour donner un aperçu de cette capacité cognitive, Sagar a ouvert devant le reporter de OneZero une série de fenêtres sur son écran - chacune surveillant un aspect différent de "l'activité cérébrale" de BabyX en temps réel comme l’activité de ses neurotransmetteurs, le traitement visuel et auditif, la reconnaissance d'objets, la mémoire épisodique... Après avoir éloigné l'araignée, il a fait voir au bébé une figurine de dinosaure. Après avoir suivi le jouet des yeux, ses niveaux de "cortisol" ont chuté, l’équivalent de la  sérotonine a augmenté, lui permettant d’esquisser un sourire.

Le rendu graphique plus impressionnant que l’intelligence

Mais un bébé informatisé qui peut être entraîné à détecter des modèles et à associer des mots et des images à ses propres états internes, peut sembler à peine plus doué qu'un jouet élaboré. Plusieurs informaticiens contactés par OneZero ont ainsi été d'accord pour dire que le projet est "fou". "Différents groupes de neurosciences computationnelles élaborent des modèles de fonctions différentes, mais dans des domaines restreints et étroits", note Thomas Serre, professeur agrégé en sciences linguistiques cognitives et psychologiques à l'Université Brown. "Ce que [Soul Machines] prétend faire, c'est synthétiser un cerveau entier, ce que personne ne peut faire. Les graphismes sont très réalistes : ils sont capables de mieux synthétiser des comportements et différentes expressions faciales que la plupart des choses que j'ai vues. Mais il semble que la principale contribution réside dans le rendu des choses plutôt que dans l’intelligence", dit-il à OneZero.

S’il admet que parler à des humains numériques "semblera un peu étrange au début", Mark Sagar s'attend à ce qu'ils gagnent en importance, du moins si les clients mettent en œuvre la gamme complète d'options - en utilisant notamment la technologie de reconnaissance faciale pour qu’ils se souviennent de leurs interactions passées avec nous. C’est comme cela qu’ils sauront adopter un affect plus susceptible de nous attirer, donc de nous éloigner de "la vallée de l’étrange".

Et ils auront même leurs propres émotions - ou leur équivalent virtuel. Ils pourraient en effet être programmés, comme BabyX, pour rechercher de la dopamine numérique et en prendre une dose chaque fois qu'ils remarquent qu'ils nous ont fait sourire. L’expression de nos humeurs positives stimulera les leurs, et progressivement, au fil de millions d'interactions, ils apprendront à nous manipuler "comme les humains se manipulent les uns les autres", écrit OneZero. Si de tels agents fonctionnent comme attendu, nous pouvons nous attendre à ce qu'ils se multiplient de manière exponentielle. Perspective dystopique? Soul Machines déploie en tout cas ce qu'il appelle un "Digital DNA Studio", qui permettra aux clients de créer facilement leurs propres avatars personnalisés. Et ce n'est pas seulement le secteur du service client qui semble avoir de l’appétence pour ce type de transformations. Ces technologies seront probablement adoptées par des secteurs comme l’enseignement, la santé, la psychothérapie...

Attention aux "vallées de l’étrange"

Si les fervents fans de science-fiction utopique peuvent s’enthousiasmer de l'avenir envisagé par Soul Machines, ceux qui s'inquiètent de la perspective de déshumanisation de la vie ont de quoi être moins optimistes. Car le monde de l’intelligence artificielle envisage un avenir où les "soi-disant agents numériques" seront intégrés à notre vie quotidienne en se présentant sous les traits de visages amicaux sur nos appareils numériques.

Toutefois, toute personne qui tente de reproduire l'apparence et le comportement d'un être humain sous une forme virtuelle risque de tomber dans ce qu'on appelle "la vallée de l’étrange" ou "vallée dérangeante". L'idée, formulée pour la première fois par le pionnier de la robotique Masahiro Mori en 1970, est que plus les humanoïdes ont une apparence proche de celle d’un être humain, plus ses imperfections peuvent nous paraître monstrueuses et effrayantes. Logique, puisque quand les hommes, créatures sociales par excellence souvent adeptes d’anthropomorphisme, interagissent avec une machine intelligemment conçue pour imiter notre comportement, ils ont tendance à lui répondre de la même manière qu’ils le feraient avec un être humain.

"Tout ce que vous ne faites pas est un pas dans la vallée de l’étrange […] Comment ça respire, comment ça parle, si ça sourit mais que la voix semble triste, etc. C'est dans toutes ces couches de choses" que tout se jouera, dit ainsi Sagar à OneZero. Raison pour laquelle son objectif a toujours été de modéliser le cerveau humain lui-même.

Assistants personnels numériques

En examinant le modèle cérébral des Soul Machines avec des détails visuels, OneZero indique que ces collections d'algorithmes "travaillent sur les mêmes principes généraux que leurs homologues biologiques, et lorsqu'ils sont assemblés, ils créent un fac-similé rudimentaire de certains processus mentaux simples". Plus précisément, l’ambition de Sagar est de construire une armée d'assistants personnels numériques. Il imagine, comme il le dit dans cette interview à KiwiNetTV, un avenir où chacun détiendrait son propre aide-de-camp individuel, qui peut par exemple agir comme intermédiaire entre nous et Internet: parcourir le Web pour nous apporter des informations, prendre des rendez-vous, payer des factures. En gros, pour nous décharger des tâches fastidieuses qui ponctuent notre quotidien de moments qui nous agacent. Mais il nous imagine acquérir ces compagnons virtuels comme on adopterait des enfants, en partageant avec eux des souvenirs et des expériences au fil des années.

Evidemment, imaginer que cette technologie étonnante puisse être utilisée à mauvais escient est, dès lors, chose facile. Pourtant, Sagar est optimiste, estimant que si les robots commencent à assumer nos tâches répétitives, nous pourrons tous nous concentrer sur autre chose. Comme quoi? "Peut-être que nous serons moins concentrés sur la cupidité et donc focalisés davantage sur la connexion", suppose-t-il. Mais tout en évoquant une possibilité plus dystopique. "Celui qui possède les robots peut avoir un contrôle total sur absolument tout". Mais à ce stade, il est à noter qu’à l'exception de BabyX, toujours confiné au laboratoire, les humains numériques que Soul Machines a produits jusqu'à présent se comportent pour la plupart comme des chatbots conventionnels, malgré leur graphisme ultra-sophistiqué.

Retrouvez également sur Gomytech: