Elles le sont d’autant plus que les géants du numérique qui les ont développées les diffusent massivement, à travers des applications utilisées quotidiennement par des centaines de millions d’individus. Les conditions sont aujourd’hui réunies pour que ces technologies convergent et donnent naissance à une nouvelle génération d’applications.
Composante clé de l’intelligence artificielle actuelle, le Machine Learning est devenu en quelques années une technologie incontournable pour automatiser de nombreuses tâches et repousser les limites de l’informatique traditionnelle. Il s’agit d’une technologie générique basée sur des algorithmes d’apprentissage statistique qui éliminent la nécessité de coder tous les cas possibles et toutes étapes de processus requises pour aboutir au résultat voulu. L’approche consiste à utiliser des données représentatives de la problématique à traiter pour entraîner un modèle de données jusqu’à l’obtention d’un résultat satisfaisant. Après cet apprentissage initial, le modèle peut être perfectionné en étant périodiquement ré-entraîné.
Deux raisons majeures expliquent le phénoménal succès du Machine Learning :
Sa capacité à rendre l’informatique plus efficace et plus simple, grâce à l’automatisation de tâches cognitives chronophages, fastidieuses ou rébarbatives. S’y ajoute la possibilité d’étendre l’automatisation à des domaines où elle était jusque-là très ou trop coûteuse à mettre en œuvre. C’est notamment le cas de la vision par ordinateur (computer vision) dont les cas d’usage ont littéralement explosé grâce aux capacités d’apprentissage des algorithmes d’analyse et de reconnaissance visuelle. La « computer vision » (basée sur les technologies de Machine Learning) trouve sa place dans l’industrie, la recherche médicale, la logistique, l’immobilier, mais aussi dans le commerce, la publicité, le marketing, etc.
Les kits et frameworks gratuits mis à disposition des développeurs. Afin d’accélérer l’adoption de leur technologie et le développement des usages, Google, Amazon et Microsoft proposent tous, sur leur plateforme cloud respective, des boîtes à outils complètes pour créer, entraîner, tester et exécuter des applications de Machine Learning.
Les progrès et l’accessibilité du Machine Learning ouvrent de nouvelles perspectives à la réalité augmentée. Cette technologie permet de superposer au monde réel des informations et des objets numériques. Cette matérialisation des informations dans le champ visuel de l’utilisateur donne actuellement à la réalité augmentée un avantage sur la réalité virtuelle (VR). Celle-ci est en effet plus complexe et plus coûteuse à mettre en œuvre puisqu’elle impose d’immerger l’utilisateur dans un environnement complètement virtuel. Moins contraignante que la VR, la réalité augmentée voit ses cas d’usage se multiplier, en particulier :
Dans l’univers du jeu et du divertissement, qui a d’ailleurs considérablement contribué à améliorer les techniques de rendu et de spatialisation ;
Dans le monde des musées et du patrimoine, un des premiers secteurs à s’en être emparer pour enrichir et ludifier l’expérience proposée aux visiteurs ;
Dans le domaine du marketing et de la vente, où elle renouvelle la manière d’engager les consommateurs à découvrir et essayer des produits qu’il s’agisse de chaussures, de lunettes, de cosmétiques, de meubles en ligne ou en magasin.
Quels que soient les domaines et les cas d’usage, la création d’une application de réalité augmentée convaincante nécessite impérativement :
Des données, pour enrichir la réalité que ce soit du texte, des formes, des textures, des images 2D ou 3D ;
Un système pour reconnaître le monde réel, celui qu’on veut enrichir, et en identifier les éléments qu’il s’agisse d’un bâtiment, d’un espace intérieur, d’un paysage, d’une voiture ou d’une installation de chauffage ;
Un dispositif de vision permettant de superposer les données et objets numériques au monde réel dans lequel se trouve l’utilisateur.
C’est sur le deuxième et troisième point qu’a buté jusqu’ici la réalité augmentée. Ces freins sont aujourd’hui en passe d’être levés grâce, d’une part, au Machine Learning et à sa composante computer vision et, d’autre part, aux puces dédiées au Machine Learning qui équipent les nouvelles générations de smartphones.
Depuis déjà plusieurs années, Apple et Google proposent des kits qui facilitent le développement d’applications de réalité augmentée. Ces kits fournissent des algorithmes et des bibliothèques permettant de distinguer et reconnaître des catégories d’éléments (surfaces et volumes, textures, QR codes, texte, personnes, animaux, véhicules…). À partir de cette base prépackagée, les développeurs peuvent facilement faire appel au Machine Learning et à sa composante computer vision pour entraîner leur modèle de réalité augmentée à reconnaître des objets bien spécifiques. Par exemple, reconnaître non plus une voiture dans l’absolu, mais les différents modèles de voitures d’un même constructeur.
Il devient alors possible d’associer et superposer aux objets reconnus tous types d’informations (caractéristiques techniques, historiques de pannes, instructions de manipulation, animations ludiques ou explicatives) et d’objets numériques en 2D ou 3D (mapping de couleur ou de texture, ajout d’attributs, modification d’apparence par déformation).
Reste la question du dispositif qui doit permettre à l’utilisateur de visualiser cette couche numérique en temps réel dans l’environnement où il se trouve. À ce jour, le smartphone est sans conteste le plus accessible, puisque 90 % de la population en est déjà équipé. Les smartphones les plus récents offrent une excellente qualité d’image, plusieurs heures d’autonomie, une capacité de stockage significative pour héberger les applications et surtout une capacité de traitement local, grâce aux nouveaux composants conçus pour le Machine Learning. Cela signifie de faibles temps de latence, un facteur déterminant pour délivrer une expérience crédible et convaincante dans un contexte dynamique.
Le smartphone présente cependant deux limitations : d’une part, l’utilisateur doit le tenir et n’est donc pas libre de ses mains ; d’autre part, son champ visuel est forcément limité à ce que peut embrasser la caméra et son regard focalisé sur l’appareil. Sous réserve de résoudre les problèmes de batteries qu’elles ont rencontré jusqu’ici, les nouvelles lunettes de réalité augmentée sur lesquelles les constructeurs travaillent actuellement devraient éliminer ces deux inconvénients.
En développant ces technologies, les géants du numérique redessinent les réponses possibles à d’innombrables problématiques métiers et grand public. La réalité quotidienne de demain sera « augmentée » : plus riche, plus informée, plus sécurisante, plus ludique, plus simple, plus conviviale…
Pour les entreprises, connaître le potentiel de ces technologies est une première étape. Elles doivent, quelle que soit leur taille, s’y intéresser pour ouvrir le champ des possibles et réfléchir autrement que dans les limites imposées par l’informatique traditionnelle. Paradoxalement, la deuxième étape consiste à oublier la technologie pour se concentrer sur ce qu’on aimerait pouvoir faire pour simplifier les processus, faciliter l’apprentissage, diffuser plus largement les bonnes pratiques, rendre l’expérience d’achat plus engageante et, ensuite seulement, une fois que l’usage a été ainsi « rêvé », se poser la question des moyens et des compétences technologiques pour que ce rêve de réalité augmentée devienne réalité.