XD blog

blog page

~recreative


2017-02-25 Système de votes

Quelques articles intéressantes sur des systèmes de votes infalsifiables : Theoretical online voting system, Survey of Fully Verifiable Voting Cryptoschemes.

2017-02-24 Open Data

J'ai imaginé des énigmes algorithmiques ou de données. Rien de tel pour apprendre qu'un mystère. Je cherchais à reproduire ce que j'avais fait avec les données vélib sur Paris (Busy areas in Paris) mais pour une ville américaine. J'ai finalement opté pour Chicago car le site open data City Of Chicago est juste incroyable. Par comparaison, (Open Data Paris propose 204 jeux de données, Chicago 1097 et le site est plus simple d'utilisation. On ne trouve rien à Paris lorsqu'on cherche velib ou vélo et on trouve beaucoup de données lorsqu'on cherche bike à Chicago. A quand un seul point d'entrée pour tous les jeux de données ? Bref, l'énigme est accessible : City Bike. Il s'agit de trouver les zones habitées et les zones où l'on trouve une majorité de sociétés. L'énigme se termine par une question : que font les habitants de Chicago après le boulot ?

2016-12-02 Les outils de debugging des navigateurs

C'est une façon original de se server des outils de débugging d'une navigateur : Ras-le-bol de votre fil d’actus Facebook ? Voici comment le désactiver.

2016-12-01 Le papier...

Le papier est aux données ce que l'or est à la monnaie.

Je me demandais ce que deviendrait l'expression faire des faux papiers dans un monde numérique. Et puis j'ai eu un peur de ce fichier central qui regroupe toutes les informations devenant de ce fait le répertoire des identités. Plus facile à hacker qu'une multitude de fichiers.

2016-11-23 Les sondages ont tout faux

En guise d'introduction, je recopie ici un extrait d'André Malraux issues de l'article suivant : Malraux : ses étonnantes confidences au Figaro en 1967

[...] Je pense du Gallup [sondage] ce que je pense du carbone 14. Vous retrouvez, en faisant des fouilles, un morceau d'une matière qui a contenu du carbone. Bon. En l'analysant, il vous est facile de savoir quelle est sa quantité de carbone 14. Ce qui vous donne l'âge approximatif de l'objet trouvé. Pour un objet préhistorique, la méthode est excellente, parce que, à cinq cents ans près, elle est précise. Mais s'il s'agit d'un objet découvert dans un foyer allumé sous Louis XIV, mieux vaut ne pas insister. Il en est de même des sondages. Supposons que nous voulions savoir si, oui ou non, les garçons de 18 ans ont envie de voter. Un sondage nous renseignera vraiment. Mais s'il s'agit d'un problème où le sentiment public joue à 52 contre 48 — ce qui est souvent le cas en France — on arrive souvent à un résultat incertain. Dernier point. Au début, nous avons fait des sondages avec des agents qui avaient souvent des passions politiques. Or le gallup ne peut être sérieux qu'à condition d'être fait par des enquêteurs indifférents. Prenez des collectionneurs de papillons, des farfelus complets, sachant à peine qui est le général de Gaulle, M. Mitterrand, M. Mendès-France ou M. Waldeck Rochet. Le travail sera à peu près rigoureux. Si, au contraire, vous avez affaire à des passionnés, c'est la catastrophe.

La précision d'un sondage est assez faible lorsqu'on interroge 1000 personnes : Exemple I : Application aux présidentielles. Tout au plus, la méthode dégage une tendance. Ce qui étonne à propos des élections présidentielles aux Etats-Unis ou de la primaire de la droite en France, le gagnant n'a jamais été en tête dans les sondages. A priori, même si les sondages ne sont que des tendances, l'accumulation des chiffres finit se muer en certitude. Qu'est-ce qui n'a pas marché alors ?


more...

2016-08-01 Un peu d'agriculture de quartier

C'est plus une conversation volée hier à Paris à un agriculteur qui expliquait à un client pourquoi on ne pouvait pas trouver ses fraises chez Carrefour. L'agricultrice produit six cagettes par jour et cette quantité est trop petite pour intéresser les grandes surfaces. La discussion se poursuivit sur le changement opéré par l'agriculteur ces dernières années pour choisir une agriculture raisonnée. Avant, il gérait 55.000 mètres carrés de pommier qu'il traitait avec toutes sortes de produits dont des pesticides. Il produisait 55 tonnes de pommes par an pour une attention constante régulier et une perte de 100.000 euros. Aujourd'hui, il gère seulement 8.000 mètres carrés, ne répand aucun produit. Il travaille beaucoup moins qu'avant pour presser les 6 tonnes de pommes qu'il vent sous forme de jus de fruits. Je ne me souviens plus du chiffre exact mais il gagne maintenant quelques milliers d'euros. De son discours, on comprenait qu'il essayait de convaincre ses amis d'opérer la même bascule. Je risquais une remarque sur le sac en plastique qu'il me tendait et la réponse fusa : c'était un sac en amidon de maïs.

Je n'aurais sans doute pas retenu cette histoire si je n'étais allé au marché de Morcenx qui aurait dû rassembler une soixantaine de petits producteurs locaux d'après les différents site web que nous avons consultés. A l'arrivée, seul une dizaine. L'un d'eux nous disait que cette affluence était habituelle et la raison est économique. Les agriculteurs s'en sortent difficilement. J'ai tout de même acheté des melons, deux fois moins cher qu'à Paris.

2016-07-31 Ouvrir les données

Je reviens de vacances. J'étais à Mimizan. Au cours de mes balades, je suis tombé sur ce panneau.

Il est apposé sur une sorte de piédestal assez haut pour surmonter les grandes marées. Au pied s'écoulent les rejets de l'usine GascognePapier. Je ne doute pas de la véracité de l'annonce mais l'odeur assez forte qui se dégage du ruisseau qui s'écoule dans la mer ébranle quelque peu cette affirmation. Pourquoi chercher à réduire des rejets s'ils ne sont pas toxiques ? Une personne qui a traversé l'écoulement pieds nus - nous sommes sur une plage - a pris soin quelques mètres plus loin de nettoyer ses jambes jusqu'au genou. Et puis réduire par 5, qu'est-ce que cela veut dire ? Je suppose qu'en 20 ans, la composition de ces déchets a évolué. Que veut dire réduire par 5 ? On peut réduire le volume des rejets par 5 tout en rejetant la même quantité de produits nocifs.

Je me suis alors demandé si j'aboutirais à la même conclusion à partir de données relatives à la composition de ces rejets. Pourquoi ne pas publier ces données si ces rejets ne sont pas toxiques ?

2016-06-20 A joke but it is so true

source: commitstrip

2016-05-21 20h l'histoire des enfants, 21h celle des parents

Vous avez relu ce soir le même livre pour la vingtième fois car votre petite fille vous l'a demandé. Vous avez bien essayé de piocher maladroitement le mauvais livre mais elle est très têtu. La reine des neige a encore gagné. Personnellement, je lis dans le noir. Je suis très peu fidèle au texte original. Monsieur noir a eu un succès mitigé, monsieur vague n'était pas le plus doué pour endormir. Mademoiselle je fais semblant de dormir même si on me chatouille a résisté à l'oubli pendant quatre mois.

Et à 21h commence l'histoire des parents. Je dois dire que la télévision est un peu plus futée et procède par série. Quand on est adulte, on ne peut plus regarder toujours le même épisode. Enfin presque, quand on regarde les séries proposées par France Télévision, elles sont principalement policières. Il y a souvent un duo de personnages reliés par une relation complexe. Rien de précis juste un brin de mystère dont on dévoile un petit bout à chaque épisode. Ensuite une intrigue de fond, celle qui vous incite à revenir la semaine prochaine. Et pour finir, l'intrigue du jour, la petite satisfaction du jour.

2016-05-18 Meetup Data For Good 18 Mai

DataForGood continue sa série de meetup sur des projets de datamining au bénéfice de la société. Le dernier opus s'est tenu aujourd'hui Demo Day : Présentation des projets Data for Good et fut très enthousiasmant. Plus d'une centaine de personnes étaient présentes. Cinq projets ont été présentés précédés d'une présentation de Paul Duan. et Adrien Montcoudiol. Il y a très peu d'inspecteurs d'hygiène sur Paris et plus d'un milliers de restaurants. Comment choisir le prochain à visiter ? Vous serez sans doute là la prochaine fois pour avoir la réponse. En attendant, quelques liens : Driven Data un équivalent de Kaggle rémunéré au bénéficiaire d'organismes publics. Data Kind propose de travailler sur des projets à but humanitaire de plus long terme et moins dans l'esprit compétition. Data Look recense des projets centrés sur le partage d'information et leur visualisation, un peu moins sur le travail de celles-ci. On y retrouve le projet mené en Amérique du Sud qui permet à tout un chacun de remonter les nids de poules. Ma rue solidaire un site qui aide au montage de projet collectif pour lutter contre la précarité avec les outils d'aujourd'hui !.

2016-05-14 Les modèles économiques ne prennent pas tout en compte

Je pensais avoir entendu depuis Seattle la présence d'OGM dans l'alimentation bovine avait un impact négactif sur la production de méthane de nos troupeaux. Enlever les OGM permet de réduire la production de méthane de 30%. Mais je n'ai pas réussi à retrouver la source de cette information. J'ai tout de même creusé un peu et je dois dire que je ne sais plus vraiment ce que je bois comme lait.


more...

2016-05-07 Les pubs à la télévision, impact à l'école

Comme la seconde saison de The 100 m'a beaucoup plu, je me suis mis en tête de regarder un épisode sur la télévision américaine. J'ai vite abandonné. Il est quasiment impossible de suivre un épisode avec toute la publicité. Tout est haché surtout vers la fin. Ce n'est rien de nouveau mais en regardant ce découpage ou plutôt ce massacre, je me demandais si cela n'avait pas un effet sur la concentration des enfants américains. Le téléspactateur n'est jamais habitué à maintenir sa concentration plus de sept minutes d'affilée. Cela me rappelle la réflexion de Kristen Stewart aux Oscar Kristen Stewart juge sévèrement la cérémonie des César qui n'était pas habituée à suivre une cérémonie sans interruption. Mais à l'école ? Quel peut être l'impact sur les enfants d'un spectacle où le spectateur n'est jamais concentré sur une période qui n'excède jamais quelques minutes ?

L'élite, par ce terme, je désigne les parents qui ont les moyens d'avoir un contrôle quasi permanent dans le temps sur l'éducation qu'ils donnent à leur enfant, l'élite fait souvent le choix d'interdire la télévision voire la présence d'écrans pour leurs enfants. Je pense mais ce n'est que mon avis que cela favorise chez ces enfants la faculté de pouvoir rester concentré sur une longue période.

En informatique, lorsqu'on construit un programme, on considère qu'une pause, une semaine, un mois, nécessite en effort même de la part de l'auteur du programme lorsqu'il souhaite se replonger dans ce qu'il a écrit. Il lui faut un temps d'adaptation pendant lequel il s'approprie ce qu'il a lui-même créé. Pour programmer, il faut une certaine capacité d'immersion.

Bref si votre enfant joue, ne l'interrompez pas.


more...

2016-04-30 Seattle

Deux liens pour éviter de les chercher à nouveaux la prochaine fois que je me retrouve à Seattle. How to travel between Seattle, Victoria and Vancouver, B.C. Walking Downtown Bainbridge Island (and Taking a Look at Their New Complete Street) Je comparais Google et Bing et j'ai fermé Google Maps car leur page maps n'arrête pas de clignoter à chaque fois que je me déplace sur la carte. Je suis de plus en plus incapable de regarder la télévision américaine. On peut zapper sur cinq chaînes d'affilée sans éviter une seule fois les pubs. Ca m'évoque plutôt la question suivante : en supposant que toutes les chaînes de télévisions diffuse la même proportion de publicité p ~ 30%, lorsqu'une pub survient sur la chaîne que je regarde, je passe à la suivante en bouclant sur l'ensemble des chaînes. Combien de fois dois-je zapper pour tomber sur autre chose que de la pub ? Quelle est la distribution de cette variable ? Encore du Bernouilli très simple mais la télévision américaine inspire peu.

2016-04-14 Retour sur le hackathon ENSAE / Microsoft / Croix-Rouge

Le hackathon ENSAE / Microsoft / Croix-Rouge s'est terminé depuis quelques temps déjà (novembre 2015). Je ne sais pas si une seconde édition aura lieu même si la question m'est régulièrement posée. En attendant, les photos sont disponibles, la vidéo tirée de l'événement ENSAE ParisTech - DSSC l'est aussi depuis peu. Un retour sur l'événement, plus complet, a récemment été publié dans la revue des anciens de l'ENSAE : Le premier hackathon organisé par l’ENSAE et Microsoft sur les données de la Croix-Rouge. Enfin, Microsoft sponsorise la seconde édition du Data Science Game (2016).

Les résultats des deux groups vainqueurs du hackathon ont été présentés lors du meet up de DataForGood en janvier 2016.

2016-04-02 Apprendre la programmation

C'est l'histoire de trois français qui montent une école de programmation dans la Silicon Valley. Holberton School, 40% de femmes parmi la première promotion, petite promotion de 32 étudiants, le cursus est gratuit, l'école se rémunère en prenant 17% du salaire sur les trois premières années de chaque étudiant une fois le premier job trouvé. Pas d'examen, apprentissage et évaluation par projet uniquement. Ces Français qui veulent apprendre aux Américains à coder. Dernier point : les mentors. Nombreux, de tous horizons professionnels, et pour la plupart, français.


<-- -->

Xavier Dupré