XD blog

blog page

~recreative


2017-08-01 La panne du 1er août

Je fais partie comme de nombreux voyageurs des personnes impactées par la panne qui empêche la SNCF de faire circuler ses trains au départ ou à destinations de la gare Montparnasse. Le message que j'ai reçu est assez simple et sans appel : Nous vous informons qu'en raison d'une panne de signalisation, votre train ne circulera pas. Nous vous invitons, dans la mesure du possible, à reporter votre voyage. J'ai donc pris un autre billet pour le même jour en espérant que le site web ne m'ait pas laissé acheter un billet non valide. La panne arrive à tout le monde et je ne voudrais pas blâmer une entreprise publique qui pour ma part satisfait mes besoins. Néanmoins, j'aurais apprécié que le mail me proposât quelques options de remplacement. Je suis très heureux d'apprendre que cinquante techniciens inspectent le poste de commandemant de Vanves-Malakoff (d'après LeMonde) mais je ne sais combien travaillent sur les itinéraires de remplacement.


more...

2017-07-24 Pollution et emplois

La papèterie de Mimizan rejette quelques résidus de bois sans vraiment dire exactement combien. Voici le petit billet que j'avais écrit l'année dernière : Ouvrir les données. Cette année, il m'est arrivé de retourner sur la plage plutôt que d'aller me baigner car ce que je prenais pour les résidus d'un petit dégazage étaient probablement ceux de la papèterie locale.

Même si ce n'était qu'une sorte de farine d'écorce de bois, le premier réflexe de tout baigneur est de s'en écarter. C'est la petite pustule à supporter pour garder la papèterie dans la région. L'argument est toujours d'ordre économique et se présente presque toujours sous la forme d'un chantage : pollution mais emplois, pollution mais vacances pas trop chères. Le choix est le même depuis des années sans que nous puissions décider en tant que citoyens s'il n'existe pas d'alternatives à ce choix imposé.

2017-07-22 Geek non désiré à la terrasse

Je m'assois a la terrasse d'un café à Bordeaux, valises en bandoulière. Je commande un demi. Je jette un coup à la Garonne. Elle est très sombre. La pluie a probablement nettoyé le sol aux alentours. Je sors mon ordinateur portable pour évacuer un bug qui me trottait dans la tête depuis le départ du train. Dix minutes passent. Je termine ma bière. La serveuse revient et me dit que les ordinateurs portables sont interdits en terrasse. J'ai le choix de migrer à l'intérieur ou de le fermer. Je passe en revue les raisons qui pourraient me pousser à rester et comme je n'en vois aucune, je plie bagages aussi sec. La terrasse n'était pourtant pas comble, l'intérieur encore moins et pourtant, le clavier aux bouts des doigts, je suis passé dans la catégorie des squatteurs de chaises à faible consommation. Je ne sais pas ce que j'étais avant peut être un bouffeur d'ennui à fort potentiel alcoolique. Moi geek avoué me suis senti l'espace d'un instant mis au ban de la société. Je rumine. Mon voisin de terrasse fumeur a bon dos de m'empoisonner. Lui a le droit de rester. Je ne sais pas de quelle religion mon ordinateur portable est le signe ostentatoire mais ce jour-là, face à la Garonne, à la terrasse d'un bout de bateau, j'ostentais magnifiquement. Mon église ne devait pas être loin. J'ai bien évidemment écrit ce billet à la terrasse d'un autre café.

2017-07-17 Atoll de données

Je me souviens pas d'avoir lu une phrase aussi proche techniquement de mon quotidien de travail et pourtant celui-ci ne m'a pas aidé à la comprendre. "Camden avait mené un coup exceptionnel d'investissement en limites croisées d'un atoll de données.", extraite de L'une rêve, l'autre pas, de Nancy Kress. La science fiction est toujours à la frontière entre le possible et l'impossible. Comme cette phrase est un des éléments qui justifie l'intrigue, j'ai naturellement voulu la ranger dans la première catégorie sans pour autant pouvoir lui donner un sens précis. J'ai pourtant mené ma petite enquête auprès de mes amis sans pouvoir dégager un début de piste sensé. Je pensais trouver une idée en allant chercher le texte original. Le titre complètement différent Beggars in Spain promettait quelque succès. La traductrive ne devait pas être très inspirée non par cette phrase qu'elle a simplement transcrite mot à mot :Cross-border data-atoll investment.

Quelques recherches sur internet ont suffi pour déformer l'expression en Cross-border data flow puis finalement Transborder dataflow qui traduit le fait que les données traversent différentes législations qui les protègent différemment. Cela rappelle étonnamment une technique d'optimisation fiscale Double irlandais qui exploite plusieurs législations. L'interprétation continue avec un article Transborder Data Flows at Risk puis Declaration on Transborder Data Flows. Je dirais alors que l'expression initiale évoque une transformation et un déplacement astucieux d'un ensemble de données intéressant depuis une législation stricte quant à leur usage vers une autre plus permissive par rapport à l'usage qu'on souhaite en faire. Cela évoque d'ailleurs des problèmatiques assez récentes liées au Machine Learning éthique, à l'anonymisation des données Anonymisation des données, à la notion de vie privée au regard de tout ce qu'on sait de votre double numérique.

2017-06-18 Administrateur général des données sur GitHub

Etalab maintient un compte GitHub : github/Administrateur général des données dans lequel on peut trouver des bouts de codes, des jeux de données, comme ces références sur l'anonymisation des données : anonymisation.

2017-05-31 Qu'est-ce qu'un data scientist ?

La réponse en vidéo et l'interview d'un ancien de l'ENSAE, Pierre Cordier, MÉTIER - Antho à la découverte du métier de Data Scientist.

2017-05-17 Les petits détails des ordinateurs portables

Je passe énormément de temps avec les ordinateurs et je réalise qu'un certain confort est indispensable si on ne veut pas devenir fou. Voici quelques détails auxquels je pense quand j'achète un portable.

Je n'aime pas trop les écrans brillants. C'est épuisant et la luminosité doit pouvoir être ajustée depuis le clavier tout comme le son. (OLED vs LED LCD – Which display tech is the best?) Les écrans LCD sont plus mats ce que je préfère. Je ne sais pas vraiment ce qui est meilleur pour les yeux. Ensuite, je n'ai pas besoin d'écran très puissant car je ne joue pas trop avec mes ordinateurs.

Je n'aime pas que la touche CTRL ne soit pas dans le coin inférieur gauche. Sur certains clavier, elle est inversée avec la touche fonction (c'est le cas des Lenovo). Enfin, les anglais n'aiment pas trop les clavier Azerty. Ils font parfois des trucs bizarre quand ils adaptent un Qwerty en Azerty. Mon dernier portable a une touche >< près des touches de déplacement, soit de l'autre côté. Pas possible ! De même pour les touches de défilement de pages et même début et fin de ligne, elles doivent être accessibles directement, sans pression d'une autre touche. Une petite précision pour ceux qui choisissent des Mac ou Apple, le clavier français rend difficile d'accès tous les symbols [] {} qui sont très fréquents quand on programme. C'est joli mais agaçant.

Sur un portable récent, j'ai eu un problème de touche lente à la répétition : j'écrivais normalement comme sur n'importe quel ordinateur mais lorsque je tapais deux fois sur la même touche, seule une lettre apparaissait. On m'a dit : il suffit de ralentir. Celui qui m'a dit ça ne doit pas utiliser un ordinateur tous les jours. HP Spectre X360 Missing Double Keystrokes).

Sur un autre portable, il était impossible de booter depuis réseau (touche F12 au redémarrage), Boot issue after installation on Acer Swift 3 laptop (only with 64 bits version)).

Le disque SSD 256 Go. Je préfère SSD à autre chose même si le disque SSD est plus cher et plus petit.

Le ventilateur ne doit pas faire trop de bruit. Difficile à tester sans faire des calculs. De même, il faut pouvoir le poser sur les genoux sans que ça brûle. Si c'est juste pour écrire, cela ne devrait pas chauffer.

2017-03-13 Table ronde sur la numérisation de l'Etat

9 mars. J'assiste à une table ronde autour de la numérisation et la simplification de l'état. Ca bouge beaucoup et bien. Quelques pitchs qui commencent toujours par ce qui irrite et ce qui est proposé. Les ministères communiquent entre eux et le modèle choisi est simple et efficace. Tout le monde communique via des API. Les ministères ne travaillent pas sur un immense système communs mais mettent à disposition des autres leurs données via une API. C'est plutôt futé. Chaque entité gère ses données et contrôle son accès. Les équipes fonctionnent en startup, pitch, font des prototypes en trois mois, on teste avec des cobayes, et passent à l'industrialisation si c'est convainquant. La loi a aussi changé, les échanges de données entre ministères sont gratuits, et un citoyen n'est plus obligé de renseigner ses informations plusieurs fois à partir du moment où ses données sont déjà détenues par un ministère. Il est en quelque sorte très démocratique puisque chaque service échange ce qu'il veut avec qui il veut. Il l'est aussi car l'état ne force pas la numérisation mais donne les moyens d'y parvenir. Regardez FranceConnect, DataAsso, Palyma, Miquado Idée, Alicem, Liquid immat, ApiCarto. Le tout est chapeauté par SGMAT.

On parle d'agilité. Il faut beaucoup de temps pour former quelqu'un à être agile.


more...

2017-02-25 Système de votes

Quelques articles intéressantes sur des systèmes de votes infalsifiables : Theoretical online voting system, Survey of Fully Verifiable Voting Cryptoschemes.

2017-02-24 Open Data

J'ai imaginé des énigmes algorithmiques ou de données. Rien de tel pour apprendre qu'un mystère. Je cherchais à reproduire ce que j'avais fait avec les données vélib sur Paris (Busy areas in Paris) mais pour une ville américaine. J'ai finalement opté pour Chicago car le site open data City Of Chicago est juste incroyable. Par comparaison, (Open Data Paris propose 204 jeux de données, Chicago 1097 et le site est plus simple d'utilisation. On ne trouve rien à Paris lorsqu'on cherche velib ou vélo et on trouve beaucoup de données lorsqu'on cherche bike à Chicago. A quand un seul point d'entrée pour tous les jeux de données ? Bref, l'énigme est accessible : City Bike. Il s'agit de trouver les zones habitées et les zones où l'on trouve une majorité de sociétés. L'énigme se termine par une question : que font les habitants de Chicago après le boulot ?

2016-12-02 Les outils de debugging des navigateurs

C'est une façon original de se server des outils de débugging d'une navigateur : Ras-le-bol de votre fil d’actus Facebook ? Voici comment le désactiver.

2016-12-01 Le papier...

Le papier est aux données ce que l'or est à la monnaie.

Je me demandais ce que deviendrait l'expression faire des faux papiers dans un monde numérique. Et puis j'ai eu un peur de ce fichier central qui regroupe toutes les informations devenant de ce fait le répertoire des identités. Plus facile à hacker qu'une multitude de fichiers.

2016-11-23 Les sondages ont tout faux

En guise d'introduction, je recopie ici un extrait d'André Malraux issues de l'article suivant : Malraux : ses étonnantes confidences au Figaro en 1967

[...] Je pense du Gallup [sondage] ce que je pense du carbone 14. Vous retrouvez, en faisant des fouilles, un morceau d'une matière qui a contenu du carbone. Bon. En l'analysant, il vous est facile de savoir quelle est sa quantité de carbone 14. Ce qui vous donne l'âge approximatif de l'objet trouvé. Pour un objet préhistorique, la méthode est excellente, parce que, à cinq cents ans près, elle est précise. Mais s'il s'agit d'un objet découvert dans un foyer allumé sous Louis XIV, mieux vaut ne pas insister. Il en est de même des sondages. Supposons que nous voulions savoir si, oui ou non, les garçons de 18 ans ont envie de voter. Un sondage nous renseignera vraiment. Mais s'il s'agit d'un problème où le sentiment public joue à 52 contre 48 — ce qui est souvent le cas en France — on arrive souvent à un résultat incertain. Dernier point. Au début, nous avons fait des sondages avec des agents qui avaient souvent des passions politiques. Or le gallup ne peut être sérieux qu'à condition d'être fait par des enquêteurs indifférents. Prenez des collectionneurs de papillons, des farfelus complets, sachant à peine qui est le général de Gaulle, M. Mitterrand, M. Mendès-France ou M. Waldeck Rochet. Le travail sera à peu près rigoureux. Si, au contraire, vous avez affaire à des passionnés, c'est la catastrophe.

La précision d'un sondage est assez faible lorsqu'on interroge 1000 personnes : Exemple I : Application aux présidentielles. Tout au plus, la méthode dégage une tendance. Ce qui étonne à propos des élections présidentielles aux Etats-Unis ou de la primaire de la droite en France, le gagnant n'a jamais été en tête dans les sondages. A priori, même si les sondages ne sont que des tendances, l'accumulation des chiffres finit se muer en certitude. Qu'est-ce qui n'a pas marché alors ?


more...

2016-08-01 Un peu d'agriculture de quartier

C'est plus une conversation volée hier à Paris à un agriculteur qui expliquait à un client pourquoi on ne pouvait pas trouver ses fraises chez Carrefour. L'agricultrice produit six cagettes par jour et cette quantité est trop petite pour intéresser les grandes surfaces. La discussion se poursuivit sur le changement opéré par l'agriculteur ces dernières années pour choisir une agriculture raisonnée. Avant, il gérait 55.000 mètres carrés de pommier qu'il traitait avec toutes sortes de produits dont des pesticides. Il produisait 55 tonnes de pommes par an pour une attention constante régulier et une perte de 100.000 euros. Aujourd'hui, il gère seulement 8.000 mètres carrés, ne répand aucun produit. Il travaille beaucoup moins qu'avant pour presser les 6 tonnes de pommes qu'il vent sous forme de jus de fruits. Je ne me souviens plus du chiffre exact mais il gagne maintenant quelques milliers d'euros. De son discours, on comprenait qu'il essayait de convaincre ses amis d'opérer la même bascule. Je risquais une remarque sur le sac en plastique qu'il me tendait et la réponse fusa : c'était un sac en amidon de maïs.

Je n'aurais sans doute pas retenu cette histoire si je n'étais allé au marché de Morcenx qui aurait dû rassembler une soixantaine de petits producteurs locaux d'après les différents site web que nous avons consultés. A l'arrivée, seul une dizaine. L'un d'eux nous disait que cette affluence était habituelle et la raison est économique. Les agriculteurs s'en sortent difficilement. J'ai tout de même acheté des melons, deux fois moins cher qu'à Paris.

2016-07-31 Ouvrir les données

Je reviens de vacances. J'étais à Mimizan. Au cours de mes balades, je suis tombé sur ce panneau.

Il est apposé sur une sorte de piédestal assez haut pour surmonter les grandes marées. Au pied s'écoulent les rejets de l'usine GascognePapier. Je ne doute pas de la véracité de l'annonce mais l'odeur assez forte qui se dégage du ruisseau qui s'écoule dans la mer ébranle quelque peu cette affirmation. Pourquoi chercher à réduire des rejets s'ils ne sont pas toxiques ? Une personne qui a traversé l'écoulement pieds nus - nous sommes sur une plage - a pris soin quelques mètres plus loin de nettoyer ses jambes jusqu'au genou. Et puis réduire par 5, qu'est-ce que cela veut dire ? Je suppose qu'en 20 ans, la composition de ces déchets a évolué. Que veut dire réduire par 5 ? On peut réduire le volume des rejets par 5 tout en rejetant la même quantité de produits nocifs.

Je me suis alors demandé si j'aboutirais à la même conclusion à partir de données relatives à la composition de ces rejets. Pourquoi ne pas publier ces données si ces rejets ne sont pas toxiques ?


-->

Xavier Dupré