XD blog

blog page

~technical


2018-12-19 Hackathon ENSAE 2018

La vidéo du hackathon est disponible. Vous pourrez aussi voir en chiffres la fin haletente pour les deux challenges : nombre de soumissions par heure et aussi le récit heure par heure du hackathon vu par un mentor Nuit intense au hackathon.

2018-12-17 La COP 24, berceau des illusions

Greta Thunberg proteste à sa façon en refusant d'aller à l'école chaque vendredi pour protester contre l'inaction des gouvernements face au réchauffement climatique. Dans son discours lors de la COP 24, elle parle de justice climatique, elle dit aussi que si nous avons tant de fois échoué à réparer un système, c'est peut-être qu'il faut en changer.


more...

2018-12-15 La loi et le politique impatient

L'article induit quelque peu en erreur car le titre est comme d'habitude rédigé de façon à accrocher le lecteur tout en l'induisant dans l'erreur si jamais s'il s'arrêtait là : Le plafonnement des indemnités prud’homales jugé contraire au droit international. En substance, l'article aborde un cas où le jury prud'homal a donné raison à l'employé et a accordé des indemnités hors du plafond proposé par la loi. La loi plafonne les indemnités, l'employeur sait à l'avance ce qu'il va payer et cela peut être interprété comme si le jugement était connu à l'avance, ce qui est contraire à ce qu'on entend par Etat de droit. Le plafonnement des indemnités prud'homales n'est pas explicitement contraire à la loi mais pas tout à fait conforme à l'esprit de la loi. Voilà ce que j'ai retenu de cet article.


more...

2018-12-12 Les impôts payés en avance

Je suppose que beaucoup d'enseignants vacataires ont reçu un message des impôts comme celui que je recopie ci-dessous leur annonçant que les impôts seront prélevés dès le mois de janvier sur la base des revenus 2017 et corrigé en Septembre 2019 car le revenu 2018 ne sera connu qu'à cette date. Il est dit que le paiement à la source apporte beaucoup de souplesse... Je pense à tous les efforts pour mettre en place l'impôt à la source que l'Etat aurait pu utiliser pour réduire ce délai de 9 mois entre le début de l'année et la connaissance de mon revenu de 2018. Bref, si seulement on avait investi ces efforts dans la lutte contre la fraude plutôt que d'aller réformer une collecte qui marchait bien...


more...

2018-12-05 onnxruntime is open source

onnxruntime is meant to deploy machine learned models once they are converted to ONNX format. I did a presentation about it at PyParis and MSExperience. I went open source last night as expected. It aims at computing the prediction of many machine learned models or pipelines built with many machine learning frameworks. It does not take a dependency on the framework which produces the model, the runtime is optimized for CPU, GPU. I'm now working on a couple of projects, all open source, all on github. Interesting times.

2018-12-01 Choose a web framework

I need to choose a framework to run a website. The first option which comes to many developpers is probably django. But it is slow and it is difficult to know where to start with it. I looked into aiohttp or sanic. I was looking into something more efficient and I found some interesting options such as japronto (uses C), vibora (use Cython), uvicorn, starlette. There was some interesting benchmark here: Web Framework Benchmarks (source code is on github/TechEmpower. The example for Starlette is quite simple and easier to read than any big documentation. japronto seems a bit risky even though it is very promising. One last bjoern. Another benchmark.

2018-08-30 Python 3.7

For those would want to install many packages on a :epkg:`Linux` machine, here are the instruction I followed for most of the content I write for my teachings : Install Python 3.7 and many packages on Linux Debian 9.

2018-07-28 Numériques, parcoursup

Une émission intéressante : Tout est numérique. Et à propos de parcourssup : Un clone en Python 3 de Parcoursup, écrit à but didactique.

2018-07-26 Interview de l'auteur de Python dans le monde

Suivez le lien : « Je n’imaginais pas que le langage informatique Python connaîtrait un tel succès ». Quand j'y repense, j'ai commencé à enseigner le langage Python en 2005 avec la version 2.5 sur les conseils d'un ancien élève autrefois mon étudiant qui me disait qu'un des objectifs du langage était sa simplicité, d'où une plus grande facilité d'apprentissage comparé à d'autres langages. Sa grammaire était l'une des plus courtes. Je suis parti avec un livre en vacances et que j'ai potassé tranquillement sur la plage pendant une semaine, trois semaines avant de préparer mes premiers cours. 13 ans plus tard, le langage est enseigné quasiment partout, il est présent sur nombre d'offre d'emplois et est un des langages les plus utilisés pour faire de la datascience.

2018-07-10 DataFrame for C Sharp

Microsoft has recently released an open source machine learning library called ML.net. As opposed to scikit-learn, there is no dataframe in C# and the data are described as an array of instances specific to the data the learning pipeline has to handle : Get started with ML.NET in 10 minutes. I was wondering if there could be a way to skip that part even if it means to be a little bit slower. I finally ended up by implementing something similar to what a dataframe in Python with pandas which I called Scikit.ML.DataFrame. I modified the inital example:


more...

2018-07-06 echarts, pyecharts

C'est une librairie de visualisation qu'on m'a fait découvrir et qui mérite le détour : pyecharts + echarts.

2018-06-29 Le meilleur data scientist de France

C'est par un concours de circonstances pas si incroyable que ça d'ailleurs que le concours du meilleur datascientist de France s'est déroulé à station F avec les mêmes données que celles utilisées lors du hackathon de l'ENSAE Hackathon Ernst & Young / ENSAE / Genius / Latitudes / Label Emmaüs / 2017. La gagnant a partagé sa solution How I won Le Meilleur Data Scientist de France 2018, le dixième également Meilleur Data Scientist de France 2018. La vidéo de l'événement dans laquelle j'apparais très rapidement...

La présentation des solutions aura lieu le 4 juillet au meetup de FrenchData FrenchData Meetup #5 : les coulisses de 2 startups data et les solutions du MDSF.

2018-06-26 Data for Good #4

J'ai assisté à la quatrième session de Présentation des projets Data for Good (ou sur la page facebook) A noter, Cédric Villani faisait partie du jury. Il a partagé un peu de son expérience de la vie parlementaire, de la nécessité de convaincre qu'une idée est une bonne idée et que cette partie est au moins aussi importante que l'idée elle-même. C'était de mon point de vue une des sessions les plus réussies et pour la première fois les présentations ont été filmées et sont visibles sur le compte facebook.

Le premier projet hippocrate.tech a regroupé data scientist, philosophe et juriste pour traduire l'éthique sous la forme d'un code de bonne conduite pour les datascientist. Il n'est pas inutile d'y faire un détour.

J'ai découvert la base de données MIMIC qui contient les résultats de tests médicaux de 40.000 patients de services de réanimations. L'objectif d'un des projets était de construire un indicateur du caractère critique de l'état d'un patient. Après les présentations, la conversion m'a amené à Owkin, une startup qui construit des outils d'aide au diagnostique à partir d'intelligence artificielle. Elle a récemment effectué une levée de fond auprès de Otium : OWKIN, la pépite française spécialisée dans le machine learning lève 11 millions de dollars

Un dernier vers openfisca qui donne accès à de nombreuses données économiques et qui permet de faire des simulations pour mesurer l'impact d'une loi.

2018-05-30 The practice of reproducible research

Common rules, common formats, documentation, small steps, unit tests, it seems obvious to many and not that obvious for every who tried to put that in practice. Some inspiration: The Practice of Reproducible Research (or the PDF). To my opinion, reproducible research is not a goal, it is a need.

2018-05-29 Aveu de médiocrité

Toujours pas de date de sortie du glyphosate : Rejet à l’Assemblée de l’inscription dans la loi de la date de sortie du glyphosate. D'après l'article, la solution doit d'abord exister avant de pouvoir inscrire cette date. J'interprète ce renoncement comme un aveu : l'assemblée pense que c'est impossible, que nous n'en sommes pas capables. Les oiseaux meurent, les abeilles disparaissent, les insectes sont au musée. C'est quand même un terrible aveu de médiocrité que de penser que nous n'en sommes pas capables.


more...
<-- -->

Xavier Dupré