Le cloud. Libertés, avantages et gros problèmes.

Nom de l'orateur

Titre : Le cloud. Avantages, libertés et gros problèmes
Intervenant : Xavier Mouton-Dubosc
Lieu : Capitole du Libre - Toulouse
Date : Novembre 2014
Durée : 23 min 51
Pour visionner la vidéo

Transcription

Merci à tous d’être présents sur cette présentation qui va être très embrumée, voire complètement fumeuse sur donc le cloud. Alors, le cloud, en soi c’est un mot dont on entend beaucoup parler depuis cinq ans, sur lequel il y a une vraie mode à la fois au niveau technique mais surtout commercial et en fait, mon rôle à moi va être surtout d'essayer de démêler un petit peu tout ça et je vous jure que je me suis complètement ennuagé là-dedans.

La première chose que j'ai envie de dire sur le cloud, c'est que, même si le mot est récent, en fait, il est présent depuis pratiquement les débuts de l'informatique. En fait, le cloud c'est principalement la relation entre un gros ordinateur central et des terminaux d’utilisateurs. Ça a toujours existé, c'est quelque chose que l'on maîtrise bien de ce côté-là depuis un sacré bon bout de temps. En soi, le cloud, ce sont des serveurs qui passent par des tuyaux, sauf que maintenant ce ne sont plus des liaisons série entre des bureaux, maintenant c'est l'ADSL ou les ondes Wi-fi, vers des minitels. Oui, en France on a été précurseurs sur le cloud et je vais vous le montrer. Le principe du cloud, en soi, c'est relativement simple, c'est déléguer ses données à un serveur. Pourquoi ? Parce que tout simplement ça me coûte moins cher que de devoir gérer moi-même ce serveur-là. Ensuite, ce serveur, comme c'est quelqu’un d'autre qui va s'occuper à ma place, il va être toujours disponible. Je n'aurai pas de problème parce que quelqu’un a débranché la prise chez moi, ou parce qu’il y a de la maintenance à faire. Quelqu’un d'autre la fera à ma place.

Malheureusement, cela veut dire aussi, que c'est un serveur sur lequel je n'ai pas toutes les clefs et où je ne sais pas trop ce qu'il se passe derrière. Et le principal problème, c'est que si je ne sais pas trop ce qu'il se passe derrière, ça veut dire que les données que je vais transmettre, que j'accepte qu'elles soient publiques ou que ce soient des données qui sont vraiment personnelles, eh bien il faut se poser la question « qui est-ce qui a accès à ces données et qu'est-ce qu'il va en faire ? »

En soi, l'informatique n'est plus personnelle. Alors je vous avais dit que le cloud, le principe terminal/grand serveur, a toujours existé dans l'informatique. Oui, mais il y a eu une révolution, en 1977, avec l’arrivée de l'Apple II. C’était un début de démocratisation d'une informatique qui est personnelle. C'est-à-dire que, tout d'un coup, vous avez la puissance de calcul nécessaire chez vous pour faire des traitements ; par exemple, pour travailler sur un tableur de données, pour en faire, par exemple, un carnet d'adresses, ou, par exemple, pour classer, faire votre inventaire si vous êtes une petite entreprise. Et cette informatique-là a été le début, vraiment, de la démocratisation de l'informatique et des développeurs en chambre.

Malheureusement, le problème de cette informatique personnelle, c'est que l'on avait un problème d'échange de données. À l'époque, on utilisait des disquettes, ou on se transférait par câbles les données d'ordinateur à ordinateur. On avait un problème c'est que du coup, à un instant t, on n'avait pas forcément les mêmes données, tout le monde, sur lesquelles on travaillait. Bref, c’était un gros bazar, les données étaient verrouillées, vraiment, à votre disque dur. Donc il y avait un problème de travail collaboratif là-dessus.

À partir de là, justement le cloud, la grande promesse, c'est que vous mettez des données quelque part, elles sont disponibles de manière uniforme et pour toutes les personnes qui sont autorisées et quel que soit le matériel. Je veux dire que je suis une preuve vivante, depuis le week-end dernier. Mais par exemple, quand on casse son téléphone, eh bien on est bien content de retrouver l’intégralité de son carnet d'adresses et de ses correspondances disponibles, prêtes à être injectées dans un nouveau téléphone.

Malheureusement, cela veut dire une chose. Ça veut dire qu'on n'a plus d'informatique réellement personnelle. Ça veut dire que votre ordinateur, votre smartphone, ne sont plus, en soi, directement quelque chose qui vous appartient, quelque chose de strictement indépendant, mais ils sont des terminaux qui sont reliés à des services qui tournent sur des très gros serveurs et qui ne sont pas disponibles près de chez vous.

Alors, rien que pour faire l'expérience : vous prenez un ordinateur moderne ou vous prenez un smartphone ou une tablette, avec eux c'est encore plus flagrant, vous les débranchez d'Internet et vous regardez ce qui vous reste comme fonctions. Et vous verrez que, tout d'un coup, les fonctions sont fortement dégradées. C'est-à-dire qu'on en est à un stade où ce sont vraiment des terminaux. Ils ont d'abord été conçus pour travailler avec des serveurs de données distants et continuellement avec eux.

En fait, je vais être honnête, quand je dis que le cloud a toujours existé, ce n'est pas complètement vrai. Le cloud, ce qui fait maintenant qu'on en parle énormément, c'est une technologie qui s'appelle la virtualisation. La virtualisation ça veut dire qu'on n'a plus des serveurs matériels, en soi, qui prennent une certaine place, par exemple, typiquement, si on construisait le volume d'une boite à pizza, dans des salles de serveurs, mais on a des serveurs qui tournent sur des machines qui sont beaucoup plus grosses, qui sont capables de faire tourner en tâche de fond des dizaines, voire des centaines de serveurs derrière, ce qui veut dire qu'on a des data-centers qui leur sont strictement réservés et qui sont disponibles un petit peu partout dans le monde. Et on va voir que la virtualisation permet, par exemple, de rapprocher des données par rapport aux gens, c'est-à-dire ne plus avoir un serveur à un seul endroit dans le monde, mais à pouvoir les étoiler à travers le monde pour les avoir les plus proches, finalement, des utilisateurs

La virtualisation, en soi, ce que c'est ? La virtualisation, c'est un concept qui consiste à dire, eh bien, le système d’exploitation d'un ordinateur et tout ce qui tourne par-dessus , que ça soit, par exemple, un serveur d'e-mails, que cela soit par exemple un client, un logiciel de comptabilité, tout ça, eh bien ce système d'exploitation va en faire un programme, justement, comme un autre, et il va tourner sur un autre OS. Donc, on peut aligner, indépendamment, plusieurs programmes, l'un à côté de l'autre, sur un très grand serveur. Ce qui veut dire, donc, qu'un serveur, une très grande boîte, peut héberger plusieurs petits serveurs, avant, qui étaient individuels. Le gros avantage, c’est que cette très grande boîte prend beaucoup moins de place que l'ensemble de ces petites boîtes à pizza et donc, à partir de là, on a un gain de place dans le data-center. On a aussi un immense apport au niveau écologique, puisqu'on mutualise l’achat du matériel, on mutualise la consommation d'électricité, on n'a pas besoin continuellement d'avoir des serveurs qui tournent en continu. Peut-être que certains n'auront besoin de tourner que, par exemple, entre 18 heures et 23 heures et d'autres n'ont besoin de travailler que de 9 heures à 17 heures. Cela aussi amène beaucoup de choses au niveau de la maintenance et donc sur plein d'autres points. Du coup, éventuellement, puisqu’on consomme moins d'électricité et qu'on a besoin de beaucoup moins de matériel, au final, ça coûte beaucoup moins cher. S'il y a une panne technique sur un OS, sur votre serveur, le gros avantage c'est qu'on peut le redémarrer beaucoup plus vite. On peut même prendre un instantané du système d’exploitation à un instant t, et relancer une instance de votre système d'exploitation, tel qu'il était une heure avant de planter, en un temps qui est quasiment ridicule par rapport au démarrage d'un vrai ordinateur, et aussi on peut le redimensionner. Ça c'est le grand apport réel du virtuel. Ça veut dire que, si, par exemple vous tenez un blog sur le cinéma, disons que votre blog va faire un millier de visiteurs par jour, ce qui est un chiffre très honorable, mais que, au moment où il y a trois blockbusters et le festival de Cannes qui a lieu en mai, eh bien, vous vous retrouvez avec un million de visiteurs uniques par jour. Si c’était un serveur physique, il serait très vite encombré. Là, dans une machine virtuelle, l'immense avantage, c'est qu'on peut dire qu'on ne loue, toute l'année, que très peu de CPU, très peu de mémoire et qu'à la volée, on dise, eh bien, je n'ai pas besoin de 512 mégas de mémoire, je veux un giga de mémoire, immédiatement, ou 14 gigas, je veux 14 CPU ; on redimensionne à la volée, on n'a même pas besoin de redémarrer le serveur. Donc il y a ce qu'on appelle, vraiment, une scalabilité, ce qui est un avantage en termes d'administration qui est énorme.

Ce qu'on appelle le cloud, en fait, regroupe trois grandes familles. En fait ces familles-là, c'est quelque chose dont vous avez peut-être entendu parler par les acronymes, mais là je vais essayer, un petit peu, de les définir. J'ai dit essayer.

Il y a ce qu'on appelle l'infrastructure. L'infrastructure comme un service, c'est quand on prend un ordinateur et qu'on le virtualise. C'est-à-dire, qu'en fait, vous allez juste louer le fait que l'ordinateur est virtualisé. À partir de là, la mise en place du système d’exploitation, la mise en place des logiciels qui sont derrière et leur administration sont de votre ressort. C'est une offre que Gandi fait depuis 2007, OVH fait à peu près depuis la même période. Amazon le fait, c'est ce qu'on appelle la technologie EC2, à peu près depuis la même période, et où, en fait, c'est un peu comme si on louait un serveur matériel, sauf que là il est virtualisé avec les avantages qu'on puisse changer de taille à la volée, le nombre de CPU, le nombre de disques durs qu'il y a dedans. L'infrastructure comme un service c'est une technologie qui, parfois, est utilisée par des particuliers, par des associations ou des entreprises.

La plate-forme comme un service est un domaine un petit peu particulier. C'est-à-dire que l'OS n'est plus du ressort du client. On a installé, en fait, un service qui n'est pas directement utilisable. Par exemple, on va avoir un environnement d'un langage de programmation ou, par exemple, un base de données. Amazon, boite service, propose par exemple RDS c'est un serveur Postgres, MySQL, etc, c'est un serveur de bases de données qui, en fait, est virtualisé. C'est-à-dire que vous n’avez plus à vous occuper de l'OS, l'administration de ce serveur c'est eux qui la gèrent, vous n'avez plus qu'à l'utiliser. Par contre, c'est un domaine qui est très spécialisé et qui, là, est plus dans le cadre de professionnels très bien documentés ou d'entreprises vraiment spécialisées.

Et il y a ce qu'on appelle le cloud, d'une manière beaucoup plus générale, d'une manière, je vais dire, un petit peu abusive et très réductrice, le cloud comme étant un logiciel comme un service. Alors là, en fait, tout est installé. L'OS, ce n'est plus vous qui le gérez, la plate-forme ça n'est plus vous qui la gérez ou qui la paramétrez. Vous, tout ce que vous avez à faire, c'est d'aller sur un site Internet, de vous connecter et d'utiliser. Éventuellement de sortir votre carte bleue et encore, je crois que certains services se passent de ce détail oiseux.

Pour vous donner des exemples de logiciels comme un service, il y a par exemple des clients d’e-mails comme Gmail, il y a par exemple des prestations de blogs comme wordpress.com ou OverBlog ou CanalBlog, il y a par exemple des prestations, aussi, de suites de bureautique comme Microsoft live office où, en fait, avec son navigateur, on a l'équivalent des services Excel ou Word, mais, en fait, on s'en sert à partir de son navigateur. Il y a des services d'échanges de fichiers, par exemple Dropbox. Et la Wikipédia, en soi, oui, la Wikipédia, est un service logiciel, puisque vous vous connectez sur un service, vous consultez les pages et si vous voulez l'éditer, eh bien vous créez un compte, vous n'avez pas à vous préoccuper de l’administration du serveur et du paramétrage du logiciel. Ce sont des personnes derrière qui s'en occupent.

Pour un utilisateur de logiciels, le cloud a de nombreux avantages. Primo, la seule chose qu'il a à se poser comme question, c'est juste d'avoir un navigateur web et une connectivité. On n'a plus, par exemple, à installer, si on reprend la suite Office, ceux qui ont connu l'ère vaillante des disquettes, savent que Microsoft Office, à une époque, il fallait une bonne trentaine de disquettes pour l'installer, qu'on n’avait pas les bons pilotes, qu'on n'avait pas forcément assez de mémoire dans son ordinateur, et tout ça. Là, la question est transparente, ça marche dans votre navigateur web, donc le service logiciel, vous n'avez plus rien à faire, vous n'avez plus qu'à l'utiliser.

Il n'y a pas de maintenance, donc ça veut dire qu'on n'a pas à se poser la question de la mise à jour. Quand vous vous connectez, par exemple sur Facebook, vous ne vous posez pas la question si vous utilisez la version 2/36 ou 3/14 de Facebook. Non, vous utilisez une version de Facebook, qui est uniforme pour tout un bassin d’utilisateurs. Donc, de ce côté-là, il n'y a plus à se poser la question « ai-je bien tous les logiciels qui sont mis à jour sur mon poste ? ». Les mises à jour, du coup, sont totalement transparentes, puisqu'en fait, ce n'est qu'une relation client-serveur et ce sont les personnes qui s'occupent du serveur qui vont mettre à jour les logiciels, au lieu que vous ayez à vous en occuper.

Le logiciel comme un service a aussi d'immenses avantages quand on est éditeur logiciel. D'abord on n'a plus de problèmes de compatibilité. Quand on créait un logiciel, on se posait la question, par exemple, oui, eh bien c'est vrai, j'ai une version pour Windows, mais je n'ai pas une version pour Mac ; oui, j'ai une version pour Windows 95/98, oui elle ne marche pas sur XP ; ou oui, il y a des incompatibilités à cause de tel pilote de carte son ou tel pilote de carte réseau. Là on n'a plus à le gérer. On le configure très bien sur son serveur et on n'a plus qu'à déployer ; ça marche uniformément pour l'ensemble de nos clients ou l'ensemble des utilisateurs.

La distribution, aussi, est simplifiée. Cela veut dire qu'on n'a plus à avoir une armada de commerciaux qui doivent faire en sorte que vos boîtes en carton, qui font un chouette volume, soient bien présentes dans l'ensemble des rayonnages de toutes les Fnac et tous les Cultura de France. Tout ça vous n'avez plus à le faire, vous n'avez plus qu'à communiquer sur un nom domaine et vous n'avez plus, justement, toute la logistique de distribution régionale, de distribution auprès des entreprises à faire, puisque maintenant tout se fait d'une manière uniforme, via Internet.

Cela signifie aussi une maintenance beaucoup plus aisée, puisqu'on n'a plus une version A, une version B, une version C, à maintenir pour nos utilisateurs, puisque tout le monde utilise la même version. Donc on est beaucoup plus tranquille. Ça permet aussi d'embarquer une facturation. Donc on n'a plus à se dire « eh bien j'ai une suite Office pour les étudiants, j'ai une suite Office pour les particuliers, j'ai une suite Office pour les PME, j'ai une suite Office pour les grands comptes ». Non ! Finalement vous n'avez plus à gérer tous ces problèmes qui sont absolument oiseux, vous le gérez dans votre serveur, vous gérez aussi le système de facturation de carte bleue, puisque vous n'avez plus de commission à laisser à la Fnac ou à Cultura, donc, de suite, c'est largement plus simple. Ça veut dire aussi une chose, c'est que, s'il n'y a plus de boîte matérielle et que c'est sur le serveur, vous n'avez plus de piratage de licences, vous êtes assuré que tous les utilisateurs sur votre serveur sont des utilisateurs légitimes.

Alors le cloud, en soi, c'est super ! Enfin oui ! C'est un service qui est vraiment chouette, auquel je donne mes données et avec envie et comme ça je peux faire de la glissade sur les trottoirs sans me préoccuper de savoir si je vais tout perdre ! Mais en fait, si on prend la toute première version du cloud que je vous ai donnée, la plate-forme comme un service, c'est une back door, c'est une porte d’entrée. C’est-à-dire que si jamais par exemple, vous louez, en plate-forme, un serveur, vous mettez dessus un serveur d'entreprise sur lequel il y a votre compta, mais surtout, il y a des documents confidentiels propres à votre entreprise. Vous faites en sorte de ne pas vous faire pirater en instituant des canaux de communication protégés, par exemple du HTTPS ou du SFTP et, théoriquement, personne n'a accès à vos données sinon vous. Eh bien non ! Puisque, comme le logiciel d'exploitation que vous louez tourne dans un autre logiciel d'exploitation, tout est en clair. Ce que stocke en mémoire ou sur disque dur virtuel ce système d'exploitation est lisible par les administrateurs de ces data-centers. Donc, forcément, il y a un accès, privilégié, auquel vous n'avez plus droit et qui est totalement en dehors de vote contrôle.

Autre chose aussi, qui est importante, c'est que vous relevez de la juridiction des serveurs du pays de votre hébergeur et du siège social de votre hébergeur. Nous sommes des citoyens français, donc, a priori, votre principal problème est de respecter la loi française. Mais si, par exemple, vous utilisez des services d'Amazon, n'oubliez pas qu'Amazon est une société américaine, donc vous relevez de la juridiction américaine et que ses data-centers, pour l'Europe, sont principalement basés à Dublin, donc vous relevez de la juridiction irlandaise. Donc vous êtes dans un début de complexification assez ardue du droit duquel vous relevez.

Alors le problème ? Le problème du cloud c'est d'avoir le choix. Et comme je l'ai dit maintenant nos ordinateurs, nos smartphones, sont liés à ces services-là, ils sont intrinsèquement liés. Donc vous n’avez plus ce choix-là, et vous n'avez plus cette liberté que procurait auparavant l'informatique personnelle. En fait on n’achète plus du matériel. Quand vous regardez bien, quand vous achetez un smartphone, quand vous achetez une tablette, vous louez des services intégrés, et le terminal n'est juste qu'un petit bonus. Si je devais faire, en fait, une comparaison, ce n'est ni plus ni moins qu’une box ADSL, et après, vous pouvez, effectivement, faire tourner les logiciels dessus, mais vous êtes réellement dans ce qu'on appelle un silo. Un silo, ça veut dire que, quand vous achetez un iPhone, vous faites tourner dans iOS, vous faites tourner, donc, le système de facturation d'Apple, vous ne pouvez utiliser qu'un seul navigateur, qui est Safari, et vous ne pouvez utiliser des logiciels qui ne sont que ceux qui sont distribués par Apple. Idem chez Google. Idem chez Microsoft. Idem chez Blackberry. Je préfère ce terme écologique. C'est un écosystème replié, insulaire et autosuffisant. C'est un peu les îles Galapagos ou les Corses. Vous verrez, les Corses essaient de se placer ailleurs mais n’aiment pas qu'on aille se placer chez eux. En soi, le cloud, si je dois faire un jeu de mots, c'est capturer beaucoup de données utilisateurs.

Alors contre ça, heureusement on a proposé le Cloud Souverain, on a mis un judoka sur un nuage, magnifique, superbe. Mais le Cloud Souverain c'est une vaste blague. C'est un gâchis d'argent public, c'est-à-dire qu'on a débloqué plus de cinquante millions pour construire deux opérateurs, qui sont soutenus par deux groupes qui étaient complètement en retard sur ces technologies. Ce qui veut dire qu'ils concurrençaient Ikoula, OVH, Gandi, qui étaient déjà présents et très performants sur ce terme-là, sur lequel il n'y a aucune spécification solide. Numergy, par exemple, envoie ses e-mails via une plate-forme d'envoi d'e-mails, donc tous ses e-mails, à la fois les e-mails commerciaux, mais par exemple, les e-mails avec vos créances, nom d'utilisateur et mot de passe. Sauf que ces services de plate-forme étaient basés sur Amazon, donc vos mots de passe passaient par des entreprises américaines. Je pense qu'il y a mieux, quand même, comme Cloud Souverain, tandis que notre entreprise est en train de se revendre à des capitaux étrangers. Bref, c'est un concept absolument fumeux et impossible à appliquer et, qui plus est, une marque déposée par SFR.

Autre problème, la concentration des services. Je vous l'ai dit, Amazon a ses principaux serveurs à Dublin qui arrosent l'Europe. Sauf que, c'est arrivé plus d'une fois, que les serveurs sautent à Dublin, suite à un orage, par exemple, et à partir de là, plein de services ne fonctionnent plus : Vimeo, Amazon, Pinterest, Github, Expédia, SoundCloud et toutes les entreprises qui sont basées du coup sur Amazon, n'étaient plus accessibles pour l'Europe. Ça a aussi existé pour l’hébergement matériel et ça existera toujours, mais cette concentration d'opérateurs rend le problème beaucoup plus grave.

La concentration c'est aussi plus facile à écouter, puisque, évidemment, on a directement les tuyaux dans ce cas-là.

Heureusement vous pouvez retrouver votre anonymat. Et pour retrouver votre anonymat, il y a une solution qui s'appelle Tor. Tor est un système de proxys distribués entre différents serveurs, que vous ne contrôlez pas. Ouais, bon, passons.

Heureusement les services SaaS reposent, parfois, sur des standards. Gmail, il y a un protocole derrière. Trois protocoles pour la gestion des e-mails. Ils les utilisent directement. Facebook, Twitter, Overblog sont des systèmes de blog et ont des systèmes d'export compatibles avec les systèmes de blog comme Wordpress ou Dotclear. Donc vous devriez pouvoir avoir le droit de récupérer toutes vos données en une fois, ce qu'on appelle la reversabilité. Si vous avez un protocole standard et que vous pouvez récupérer vos données, eh bien vous pouvez, à partir de là, devenir votre propre opérateur de service logiciel, devenir votre propre opérateur de cloud et c’est justement le cadre de la conférence suivante. Voilà. J'espère que cela vous aura, un petit peu, dégagé la vue sur la question. Merci

Applaudissements.