A l’aide d’un simple télescope braqué sur une fenêtre, des physiciens israéliens ont réussi à déchiffrer des chansons et des paroles prononcées dans une pièce à 25 mètres d’eux. Comment ? En observant les infimes vibrations d’une ampoule suspendue au plafond…
James Bond, Jason Bourne ou OSS 117… c’est un peu du passé. Quand les services de renseignement recrutent, ils ne cherchent pas seulement des barbouzes, ils cherchent plutôt des têtes bien faites et accessoirement des gameurs et des hackeurs. Rangez le pistolet avec silencieux, l’appareil photo miniature, la semelle cachant une lame, sortez l’ordinateur portable et accessoirement… le télescope.
Ben Nassi, Yaron Pirutin, Adi Shamir, Yuval Elovici et Boris Zadov, des chercheurs de l’université israélienne Ben-Gourion du Néguev et de l’Institut Weizmann des sciences, ont annoncé la mise au point d’une nouvelle technique d’espionnage – on parle sobrement d’écoute à distance –, qu’ils appellent « lamphone ». Cette technique permettrait à toute personne possédant un ordinateur portable, un télescope et un capteur électro-optique (d’une valeur de quelques centaines d’euros) d’écouter, en temps réel, tous les sons émis dans une pièce située à distance, pourvu qu’elle soit éclairée.
Les longueurs d’onde émises lors d’une conversation produisent d’infimes vibrations qui entraînent à leur tour d’infimes variations de luminosité. En mesurant ces minuscules changements de luminosité, les chercheurs montrent qu’il est possible de capter les sons, assez clairement pour discerner le contenu des conversations ou même reconnaître un morceau de musique.
Vibrations de quelques centaines de microns
« Tout son présent dans la pièce peut être récupéré sans qu’il soit nécessaire de pirater quoi que ce soit et sans dispositif dans la pièce. Il suffit d’avoir une ligne de mire sur une ampoule suspendue, et c’est tout », explique Ben Nassi, chercheur en sécurité. Lui et ses collègues prévoient de présenter leurs conclusions à la conférence Black Hat sur la sécurité de l’information, du 1er au 6 août, à Las Vegas (Nevada).
Lors de leurs expériences, les chercheurs ont placé une série de télescopes, avec des lentilles de 10, 20 et 35 centimètres, à environ 25 mètres de l’ampoule d’une pièce cible, et ont placé l’oculaire de chaque télescope devant un capteur électro-optique. Ils ont ensuite utilisé un convertisseur analogique-numérique pour changer les signaux électriques de ce capteur en informations numériques.
Dans la pièce cible, ils diffusaient des enregistrements de discours et de musiques et transmettaient les informations recueillies par leur installation à un ordinateur portable qui les analysait. Les chercheurs ont découvert que les vibrations de l’ampoule – de l’ordre de quelques centaines de microns – en réponse aux mouvements du son étaient enregistrables comme des changements mesurables dans la lumière que le capteur percevait.
Après avoir traité le signal recueilli par un logiciel capable de filtrer le bruit, ils ont pu reconstituer les sons enregistrés dans la pièce : sur leur site, ils proposent l’extrait d’un discours dans lequel Donald Trump dit « We will make America great again » de manière suffisamment audible pour qu’il puisse être transcrit par l’API Cloud Speech de Google. Ils proposent également deux enregistrements dans lesquels il est possible de distinguer Let It Be, des Beatles, et Clocks, de Coldplay, tous deux reconnus par l’application Shazam.
Une nouvelle forme d’attaque possible
Dan Boneh, informaticien et cryptographe de Stanford, cité par Wired, affirme que cette technique représente une nouvelle forme d’attaque par « canal latéral », c’est-à-dire une attaque qui profite d’une fuite involontaire d’informations pour voler des secrets.
La technique n’est pourtant pas infaillible. Lors de leurs essais, les chercheurs ont utilisé une ampoule suspendue, et il n’est pas certain qu’une ampoule montée dans une lampe fixe vibre suffisamment pour produire le même type de signal audio.
Les enregistrements de voix et de musiques qu’ils ont utilisés lors de leurs essais étaient également plus forts que la conversation humaine moyenne, les haut-parleurs étant réglés à leur volume maximal. Par ailleurs, les ampoules LED offrent un rapport signal/bruit qui est environ 6,3 fois celui d’une ampoule à incandescence et 70 fois celui d’une ampoule fluorescente.
Mais les chercheurs expliquent avoir utilisé un capteur électro-optique et un convertisseur analogique-numérique relativement bon marché, et qu’ils auraient pu passer à un modèle plus coûteux pour capter des conversations plus discrètes.
Un espionnage en temps réel
Ils ne sont pas non plus les premiers à montrer qu’il est possible d’écouter aux portes avec les yeux. En 2014, des chercheurs du Massachusetts Institute of Technology (MIT), de Microsoft et d’Adobe ont mis au point un « microphone visuel » : en analysant la vidéo enregistrée par un télescope d’un objet qui capte des vibrations – un sac de chips ou une plante d’intérieur, par exemple –, ils ont pu reconstruire la parole et la musique.
L’un des chercheurs du groupe, l’informaticien Yuval Elovici a aussi travaillé sur la technique de hack brightness, qui permet de capter en vidéo les changements imperceptibles à l’œil nu de la luminosité des écrans LCD, permettant de dérober des documents et des fichiers sur des ordinateurs non connectés. Aussi pratique soit-il, ce « microphone visuel » ne permet pas d’agir dans l’urgence, relèvent les chercheurs israéliens. Idem pour le hack brightness.
La lamphone, en revanche, permet un espionnage en temps réel. « Lorsque vous l’utilisez en temps réel, vous pouvez réagir immédiatement plutôt que de perdre l’occasion d’intervenir », soutient Ben Nassi. Il prend aussi soin d’affirmer que s’ils publient leurs résultats, c’est pour faire comprendre aux services de renseignement et à leurs éventuelles cibles qu’il est désormais possible d’espionner et d’être espionné en direct. « Nous voulons sensibiliser les gens à ce type d’attaque, explique-t-il. Nous ne sommes pas là pour fournir des outils. »