XD blog

blog page


2018-07-30 A propos des scores nutritionnels

Manger devient de plus en plus compliqué, les produits sont aspergés de pesticides et autres déserbants dont on se demande comment ils peuvent ne pas être présents dans le fruit ou le légume qu'on mange. Si les diététiciens vous conseillaient de manger la peau des fruits il y a 50 ans car les vitamines s'y concentraient, ils vous recommandent maintenant de la laver et de l'enlever car les pesticides y ont élu domicile. Les poissons que nous mangeons ont mangé du plastique sans parler des huîtres qui ne vous diront pas ce qu'elles ont filtré. En attendant que les produits bio se propagent, il faut s'intéresser maintenant à tous les E qui pullulent dans les étiquettes des produits préparés : Quel est le bon système d'information pour lutter contre la malbouffe ?. Quelques liens utiles : yuka, une application qui calcule en direct le score nutritionnel d'un produit à partir de son étiquette, elle utilise les données de OpenFoodFacts, la DGCCRF qui émet des alertes sur les produits avariés, DGCCRF - Alerte rappels de produits, FoodWatch qui éduque sur les décisions prises et qui nous impacte au quotidien telle que sur le CETA : Les accords commerciaux menacent nos choix démocratiques. SlowFood insiste sur l'éducation des enfants. Enfin, Siga propose un score qui prend en compte un aliment dans sa globalité et distinguent les aliments transformés et ultra transformés. Pour donner une idée concrète, il faut revoir L'aile ou la cuisse. J'ai aussi découvert que deux beurres bio n'étaient pas toujours équivalents, le premier est fait à partir de crème de beurre, Beurre moulé demi-sel bio - Franprix - 250 g, le second utilise de la crème et du lait écrémé en poudre, Beurre de Baratte - Carrefour Bio - 250 g, ce qui m'apparaît à première vue très surprenant. Je terminerais par deux cartes produites par Erin Brokovitch : Chromium 6 aux USA, Cancer et autres problèmes aux USA.

2018-07-28 Numériques, parcoursup

Une émission intéressante : Tout est numérique. Et à propos de parcourssup : Un clone en Python 3 de Parcoursup, écrit à but didactique.

2018-07-26 Interview de l'auteur de Python dans le monde

Suivez le lien : « Je n’imaginais pas que le langage informatique Python connaîtrait un tel succès ». Quand j'y repense, j'ai commencé à enseigner le langage Python en 2005 avec la version 2.5 sur les conseils d'un ancien élève autrefois mon étudiant qui me disait qu'un des objectifs du langage était sa simplicité, d'où une plus grande facilité d'apprentissage comparé à d'autres langages. Sa grammaire était l'une des plus courtes. Je suis parti avec un livre en vacances et que j'ai potassé tranquillement sur la plage pendant une semaine, trois semaines avant de préparer mes premiers cours. 13 ans plus tard, le langage est enseigné quasiment partout, il est présent sur nombre d'offre d'emplois et est un des langages les plus utilisés pour faire de la datascience.

2018-07-25 Logiciels gratuits de capture d’écran en vidéo

Suivez le lien : 10 logiciels gratuits de capture d’écran en vidéo. J'ai essayé OBS qui n'est pas mal du tout.

2018-07-24 Multiplier avec les doigts et théorème de maths

Ma soeur me demandait ce que je pensais de la vidéo Multiplier avec les mains où on voit quelqu'un expliquer comment multiplier avec les doigts et la connaissance des multiplication de deux chiffres inférieur à 5. Tut d'abord j'y ai vu un théorème de mathématiques à démontrer formidablement bien posé et abordable dès la quatrième ou la troisième (après les identités remarquables). Est-ce qu'on devrait enseigner cette méthode de calcul aux enfants ? Je dis oui si on continue d'enseigner les autres et non si on bascule vers celle-là uniquement car elle ne s'applique qu'aux nombres à deux chiffres. Le plus amusant dans les maths, c'est de comprendre pourquoi ça marche, pas de comptrer le plus vite du monde. Et c'est quand même plus simple d'écrire 9 x 9 = (10 - 1) x 9 = 10 x 9 - 9 = 90 - 9 = 81 pour calculer mentalement le résultat que d'utiliser la méthode avec les doigts, surtout dans un pays qui à tort a tendance à pointer du doigt tous ceux qui comptent avec leurs doigts.

2018-07-22 La paie des soldats de l'armée française

L'émission Louvois, le scandale d'un logiciel de paie de l'armée française revient sur les problèmes rencontrés par l'armée sur une période de 10 ans pour assurer la paie de ses soldats, problèmes non encore tout-à-fait résolus à ce jour. Des sommes folles ont été englouties en pure, un immense gâchis pourrait-on dire si ce n'est que le documentaire semble montrer qu'un projet de cette envergure a beaucoup plus de chances de réussir s'il est confié à une équipe de bons ingénieurs. Le logiciel de la paie a eu plusieurs vies et plusieurs supervisions. Il semble que celle de l'armée qui a repris la suite des premiers jets par l'entreprise SOPRA jusqu'à la reprise la même entreprise et STERIA a fait montre d'un certain amateurisme. Gérer un projet d'informatique d'envergure n'est pas à laisser au premier venu même si la tradition française a tendance à laisser croire que ce pourrait être le cas.

2018-07-14 Jour de pollution à Mimizan

Alors que je joue tranquillement avec ma nièce dans le sable de la plage sud de Mimizan, une garde nageuse passe pour me dire que la plage est polluée et qu'il vaut mieux éviter tout contact avec l'eau, même au niveau des pieds. Je lui demande si c'est l'éternelle papèterie qui salit l'eau un peu plus que d'habitude. Elle me réponds qu'elle n'en sait rien mais probablement non car la plage dans l'estuaire de la rivière n'est pas fermée. A défaut d'en savoir plus, je lui demande si les résultats des tests qu'on ne lui a pas communiqué visiblement seront publiés quelque part et ils seront affichés prochainement selon elle. J'y suis retourné le lendemain alors que la plage avait réouverte sans trouver aucun indication de cette dite pollution. Le site internet de la ville ne le publiant pas. Je lui donne raison puisque cette trace a toute les chances de devenir indélélile sur le web mais par soucis de transparence, en tant que citoyen, je ne peux que m'interroger sur la véritable nature d'une pollution qui incite la mairie à ne pas divulguer les résultats, tout du moins d'une façon facilement accessible.


more...

2018-07-10 DataFrame for C Sharp

Microsoft has recently released an open source machine learning library called ML.net. As opposed to scikit-learn, there is no dataframe in C# and the data are described as an array of instances specific to the data the learning pipeline has to handle : Get started with ML.NET in 10 minutes. I was wondering if there could be a way to skip that part even if it means to be a little bit slower. I finally ended up by implementing something similar to what a dataframe in Python with pandas which I called Scikit.ML.DataFrame. I modified the inital example:


more...

2018-07-06 echarts, pyecharts

C'est une librairie de visualisation qu'on m'a fait découvrir et qui mérite le détour : pyecharts + echarts.

2018-07-05 Comment détecter un mauvais système de données

EDF, ou Enedis, je ne sais pas vraiment comment l'appeler, m'a envoyé quatre fois le même courrier le même jour pour la même raison, à savoir, la visite de mon compteur d'électricité. EDF cherche toujours à les visiter quand je ne suis pas là ou en me proposant des horaires assez larges. La dernière fois, c'était un intervalle de cinq heures sans même qu'il puisse réduire quelques heures à l'avance. Et aujourd'hui, je me demande comment la même société peut envoyer 4 fois le même courier pour la même raison et le même si ce n'est qu'elle a un système de données plutôt défaillant. Cela me rappelle la SNCF l'année dernière qui était capable de me dire que mon train partait dans une gare et l'inverse une gare plus loin.


more...

2018-06-29 Le meilleur data scientist de France

C'est par un concours de circonstances pas si incroyable que ça d'ailleurs que le concours du meilleur datascientist de France s'est déroulé à station F avec les mêmes données que celles utilisées lors du hackathon de l'ENSAE Hackathon Ernst & Young / ENSAE / Genius / Latitudes / Label Emmaüs / 2017. La gagnant a partagé sa solution How I won Le Meilleur Data Scientist de France 2018, le dixième également Meilleur Data Scientist de France 2018. La vidéo de l'événement dans laquelle j'apparais très rapidement...

La présentation des solutions aura lieu le 4 juillet au meetup de FrenchData FrenchData Meetup #5 : les coulisses de 2 startups data et les solutions du MDSF.

2018-06-26 Data for Good #4

J'ai assisté à la quatrième session de Présentation des projets Data for Good (ou sur la page facebook) A noter, Cédric Villani faisait partie du jury. Il a partagé un peu de son expérience de la vie parlementaire, de la nécessité de convaincre qu'une idée est une bonne idée et que cette partie est au moins aussi importante que l'idée elle-même. C'était de mon point de vue une des sessions les plus réussies et pour la première fois les présentations ont été filmées et sont visibles sur le compte facebook.

Le premier projet hippocrate.tech a regroupé data scientist, philosophe et juriste pour traduire l'éthique sous la forme d'un code de bonne conduite pour les datascientist. Il n'est pas inutile d'y faire un détour.

J'ai découvert la base de données MIMIC qui contient les résultats de tests médicaux de 40.000 patients de services de réanimations. L'objectif d'un des projets était de construire un indicateur du caractère critique de l'état d'un patient. Après les présentations, la conversion m'a amené à Owkin, une startup qui construit des outils d'aide au diagnostique à partir d'intelligence artificielle. Elle a récemment effectué une levée de fond auprès de Otium : OWKIN, la pépite française spécialisée dans le machine learning lève 11 millions de dollars

Un dernier vers openfisca qui donne accès à de nombreuses données économiques et qui permet de faire des simulations pour mesurer l'impact d'une loi.

2018-06-13 Retard en intelligence artificielle

L'Europe est en retard dans ce moment. C'est un fait. Voici quelques chiffres dans ce sens : AI Startups as Innovation Drivers. Une version PDF est disponible en bas de page, l'un des auteurs est Axelle Lemaire. Si vous n'êtes pas convaincu, vous le serez sans doute par Andrew Ng - The State of Artificial Intelligence.

2018-06-11 De l'impolitesse des courriers automatisés

Les courriers automatisés manquent parfois de tact et sont parfois incorrects. Dans le dernier, Free m'apprend qu'un prélèvement a été refusé suite à un décès et que cela me coûtera 7.5 euros supplémentaires. Ma maladresse n'est pas intentionnelle et je trouve le courrier quelque peu impoli. Par la suite, le courrier est envoyé le 9 en me laissant 2 semaines pour régulariser la situation, 2 jours plus tard, la ligne internet était coupée.


more...

2018-05-30 The practice of reproducible research

Common rules, common formats, documentation, small steps, unit tests, it seems obvious to many and not that obvious for every who tried to put that in practice. Some inspiration: The Practice of Reproducible Research (or the PDF). To my opinion, reproducible research is not a goal, it is a need.


-->

Xavier Dupré