XD blog

blog page


2018-06-13 Retard en intelligence artificielle

L'Europe est en retard dans ce moment. C'est un fait. Voici quelques chiffres dans ce sens : AI Startups as Innovation Drivers. Une version PDF est disponible en bas de page, l'un des auteurs est Axelle Lemaire. Si vous n'êtes pas convaincu, vous le serez sans doute par Andrew Ng - The State of Artificial Intelligence.

2018-06-11 De l'impolitesse des courriers automatisés

Les courriers automatisés manquent parfois de tact et sont parfois incorrects. Dans le dernier, Free m'apprend qu'un prélèvement a été refusé suite à un décès et que cela me coûtera 7.5 euros supplémentaires. Ma maladresse n'est pas intentionnelle et je trouve le courrier quelque peu impoli. Par la suite, le courrier est envoyé le 9 en me laissant 2 semaines pour régulariser la situation, 2 jours plus tard, la ligne internet était coupée.


more...

2018-05-30 The practice of reproducible research

Common rules, common formats, documentation, small steps, unit tests, it seems obvious to many and not that obvious for every who tried to put that in practice. Some inspiration: The Practice of Reproducible Research (or the PDF). To my opinion, reproducible research is not a goal, it is a need.

2018-05-29 Aveu de médiocrité

Toujours pas de date de sortie du glyphosate : Rejet à l’Assemblée de l’inscription dans la loi de la date de sortie du glyphosate. D'après l'article, la solution doit d'abord exister avant de pouvoir inscrire cette date. J'interprète ce renoncement comme un aveu : l'assemblée pense que c'est impossible, que nous n'en sommes pas capables. Les oiseaux meurent, les abeilles disparaissent, les insectes sont au musée. C'est quand même un terrible aveu de médiocrité que de penser que nous n'en sommes pas capables.


more...

2018-05-26 Democracy - La ruée vers les datas

Je vous recommande le visionnage du documentaire Democracy - La ruée vers les datas sur Arte qui relate l'histoire de la création de la loi sur le Règlement général sur la protection des données, un peu comme Villani l'avait fait avec sa médialle Fields dans Théorème vivant. Il relate le temps de la réflexion qui a précédé le vote de la loi en 2016 pour une entrée en vigueur le 25 mai 2018. Le documentaire insiste peu sur les amendements proposés par les lobbyistes ni la pression qu'ils ont exercée - un seul a apparemment accepté d'être filmé -, elle n'est qu'esquissée, au contraire, il insiste sur l'immense travail de réflexion et de discussion fournis par les auteurs du texte qui a été adopté. Il faut remercier son auteur opiniâtre Jan Philipp Albrecht, forçat du RGPD.

Un des interlocuteur donne un exemple de ce qu'on peut trouver comme enseignements dans les données. Je suppose qu'il a trouvé un accueil favorable dans l'oreille du réalisateur puisqu'il a conservé. Je la transcris également car elle traduit à mon sens ce que l'école oublie parfois d'être, un endroit où on doit rêver : Students who took creative litterature course in 9th grade have a better chance to pass algebra in the 10th grade. Ce n'est pas moi qui le dit, ce sont les données. (9th = troisième).

Je termine par une métaphore initiée par Albrecht lui-même. Si les données étaient du pétrole, la loi RGPD serait une loi de protection de l'environnement. On attend la suivante.

La loi s'applique à toute donnée transitant par l'Europe. Ceci explique pourquoi Facebook déplace les données des utilisateurs non Européens Données personnelles : Facebook met 1,5 milliard d‘utilisateurs hors de portée du droit européen.

La loi RGPD est sortie mais pas la loi sur les voitures ou les pesticides. Il faut croire que les lobby des GAFA ne sont pas aussi méchants que ça en tout cas moins persistants. On a plus de contrôle sur ce qui est fait de nos données et pas encore ce qui arrive dans notre assiette La fabrique du silence : retour à Glomel.

2018-05-23 Un livre à lire sur le Big Data

Big Data, penser l'homme et le monde autrement, de Gilles Babinet de Gilles Babinet. Les données sont peut-être dangereuses mais on peut faire un grand nombre de choses utiles avec. Le livre cite de nombeux exemples, évoque aussi le passage d'une société au numérique. Quelques extraits...


more...

2018-05-22 Les trains autonomes de demain

La grève à la SNCF nous est relatée principalement par les statistiques du nombre de grévistes qui s'étiole de semaine en semaine. Je n'en ai pas retenu grand si ce n'est la disparition du statut des cheminots et la privatisation partielle voulue par la communauté Européenne. Je n'ai pas l'impression que ces deux mesures répondent au fond du problème à savoir la vétusté des voies autres que TGV qui est à peine rentable de son côté. Je fais un aparté sur un sujet qui témoigne de notre incapacité à prendre de bonne décision. Le tracé de la ligne Est passe dans une gare Champagne Ardennes qui est un hangar en rase campagne à mi-chemin entre deux ville sans que je parvienne à m'expliquer les raisons de ce choix. De ce fait, le train ne s'arrête pas dans un centre-ville ce qui est à mon sens un de ses grands avantages. J'y reviendrai.


more...

2018-05-03 Régression logistique et diagramme de Voronoï

Je retombe régulièrement sur le jeu de données Iris très souvent utilisé pour illustrer car il marche bien. J'aime bien aussi cette image :

Elle me fait penser à un diagramme de Voronoï, le graphe qui dessine les zones d'influences de points dans un plan et plus généralement dans un espace vectoriel. Je me suis alors demandé s'il n'y avait pas d'équivalence entre les deux... La réponse est non dans le cas général mais cela n'empêche pas une petite promenade pour comprendre deux ou trois petites choses sur les problèmes que peut modéliser une régression logistique : Régression logistique, diagramme de Voronoï, k-Means. Vous y verrez une image comme celle-ci :

2018-05-02 Histoire d'intelligence artificielle

Deux articles parus dans Variance autour de l'histoire de l'intelligence artificielle : COLLOQUE « INTELLIGENCE ARTIFICIELLE : FICTION OU ACTIONS ? » : UNE BRÈVE HISTOIRE DE L’INTELLIGENCE ARTIFICIELLE (1ÈRE PARTIE), DEUXIÈME PARTIE : DE LA NAISSANCE DE L’INFORMATIQUE AU DEEP LEARNING.

2018-04-27 Gilles Dupré (1946-2018)

Gilles Dupré était architecte avant d'être mari ou père. Il pouvait interrompre ses vacances, traverser la France de nuit, tout changer d'un projet qu'il disait avoir conclu, batailler jusqu'à plus d'heure avec les façades. Il dessinait avant d'écrire, noircissait de croquis tous les ronds de bières, toutes les nappes en papier. Il peignait. Il allait voir toutes les expositions à Paris où ailleurs, lisait tous les livres, organisait des voyages pour l'ordre des architectes. Il écrivait peu mais savait toujours retrouver le livre où l'œuvre qui traduisait le mieux sa pensée. L'essentiel était d'avoir un projet et de tout faire pour le concrétiser. Il était important de laisser une trace, le reste était secondaire. Féru de jazz, de bandes dessinées, il lisait la nuit, vous surprenait en sortant un livre de son sac "Tiens ça m'a fait penser à toi."


Photo : Clément Sautet


more...

2018-04-22 La grève et ses conséquences

J'avais besoin de rejoindre Charleville-Mézières depuis Paris. Pour moi qui n'ait pas le permis, les transports publics sont indispensables et en ce jour de grève, aucun train ne circulait, blablacar ne proposait rien avant 21h, les bus rien avant deux jours. Les Ardennes étaient ce jour-là virtuellement inacessibles.

2018-04-16 Notebook sur Spark

J'ai déplacé les notebooks sur Spark depuis le site Python dans tout ses états vers Spark approximatif. Des petits modules sont plus faciles à maintenir.

2018-04-01 Revue de presse : ENSAE

A l’Ensae, « faute de bouger facilement, les étudiants s’investissent dans les associations », Le Monde 29 Mars 2018.

2018-03-31 Mettre un modèle de machine learning en production

J'écrivais un article il y a peu sur le sujet ONNX : apprendre et prédire sur différentes machines où j'évoquais deux pistes pour mettre en production un modèle de machine learning, essentiellement via une application web. Il n'y a pas d'ordre de préférence, certaines sont plus abouties que d'autres. La première tensorflow-serving propose tout clé en main mais elle repose sur l'utilisation de tensorflow. La seconde ONNX, onnxmltools, winmltools convertit un modèle dans un format commun. Il est ensuite exploité là où une librairie de prédiction (un runtime) existe (liste des runtime disponibles). Ce format commun n'est pas encore exploitable en C++ ou javascript mais ces options envisageable également. Tensorflow encore propose une façon d'exploiter les modèles en javascript directement avec tensorflow.js (voir https://js.tensorflow.org/tutorials/import-keras.html). ONNX réfléchit à une extension pour le langage C/C++ ONNX in C/C++ qu'il est possible de faire pour le moment pour un modèle de deep learning en convertissant un modèle appris pour la librairie caffe2 avec ONNX : ONNX: deploying a trained model in a C++ project. C'est une direction choisie par le module sklearn-porter qui propose des codes en Java, C++, Go, PhP, Ruby, Javascript pour certains des modèles implémenté par scikit-learn. Cela couvre nettement plus de modèles que ce que j'avais commencé à faire avec mlprodict. Il existe d'autres options comme Seldon, à moitié open source, à moitié tourné vers une proposition de services.

2018-03-29 Intelligence Artificielle en France

Quelques tables sont organisées lors de la conférence AI for Humanity organisée par le gouvernement pour la remise du rapport Villani. La première table ronde invitait Laurence Devillers, que j'avais vu lors du colloque organisé par les anciens de l'ENSAE Colloque Individu, données et société connectée.

Lors de la seconde table, Yann LeCun affirmait que la thèse CIFRE était une des raisons pour lesquelles Facebook avait choisi la France pour implanter un centre de recherche en Europe (Paris). Parmi les thésards, Alexis Conneau qui est passé par l'ENSAE.

D'après le directeur du CNRS, Antoine Petit, il est important d'avoir des chercheurs ou ingénieurs qui enseignent dans le monde académique et travaillent dans le monde privé. Il confirme ce qu'a dit Yann LeCun une heure plus tôt. Certains chercheurs de Facebook consacre 20%, 50% de leur temps à l'enseignement. On pense à tort que l'école est le plus souvent en retard par rapport à ce qui se fait dans le monde de l'entreprise et que les étudiants ne savent rien faire en quittant l'école. En intelligence artificielle, c'est plutôt l'inverse. La recherche académique est en avance par rapport à ce qui se fait en entreprise

Quelques annonces comme DeepMind qui va créer un centre de recherche en France où aussi : Microsoft s’engage avec les acteurs de l’écosystème pour contribuer à faire de la France la nation de l’Intelligence Artificielle.


-->

Xavier Dupré