XD blog

blog page

2016-05


2016-05-29 Longitude, latitude et les carreaux de l'INSEE

Les données carroyées à 200 mètres, produites par l'INSEE, contiennent 18 variables sur la structure par âge des individus, les caractéristiques des ménages (locataire/propriétaire, etc.) et les revenus au 31 décembre 2010 pour chaque zone ou carreau de 200 mètres de côté d'un quadrillage qui recouvre le territoire français, territoire d'outre mer compris.

Un des inconvénients relève du système de coordonnées utilisé pour la métropole, LAEA (Lambert Azimutal Equal Area code EPSG 3035) d'après la documentation générale (voir également Documentation complète sur les données carroyées à 200 mètres). Il faut le plus souvent les convetir en longitude/latitude pour tracer des cartes avec les librairies existantes en Python (basemap par exemple).

Comment trouver un code python qui permettent d'effectuer cette conversion ?


more...

2016-05-25 2 Challenges Big Data

Data Science Game 2016 C'est une compétition internationale regroupant des équipes de 4 étudiants d'une même école (doctorants inclus !). L'évènement étant en partie créé par l'ENSAE, l'école se doit d'y participer! Princeton, la National University of Singapour, Télécom ou la TSE se sont déjà inscrits... Bref, l'évènement est parrainé par Capgemini et Microsoft, il y aura du beau monde et de la visibilité !

Paris Summer Innovation Fellowship En partie organisé par Data for Good x Bayes Impact, c'est un programme d'innovation intensif de 2 semaines pour vous permettre de développer un projet de data science à impact social. Les participants recevront une bourse de financement et des conseils d'experts tels que Paul Duan (fondateur de Bayes Impact), Rand Hindi (fondateur de Snips) ou Max Song (ex genetic engineer à la NASA). Ça se déroule dans les superbes locaux de FiveByFive (Paris 10ème) avec une présentation prévue à la mairie de Paris en septembre.

A propos des Big Data, Olivier Grisel (un des concepteurs de scikit-learn) est passé sur France Inter dans la tête au carré Nos vies à l'heure des "big data".

2016-05-22 GEOFLA, Lambert 93 projection

I was trying to use the files GEOFLAî Départements to draw a map and my first try left the map empty. I then discovered that the coordinates were expressed with Lambert 93 projection. A couple of searches later, I found a couple of versions of the same function in Javascript, PHP or Python. Here is the one I finally chose and modified: lambert93_to_WGPS. After conversion, the file can be used more easliy with module basemap.

2016-05-21 20h l'histoire des enfants, 21h celle des parents

Vous avez relu ce soir le même livre pour la vingtième fois car votre petite fille vous l'a demandé. Vous avez bien essayé de piocher maladroitement le mauvais livre mais elle est très têtu. La reine des neige a encore gagné. Personnellement, je lis dans le noir. Je suis très peu fidèle au texte original. Monsieur noir a eu un succès mitigé, monsieur vague n'était pas le plus doué pour endormir. Mademoiselle je fais semblant de dormir même si on me chatouille a résisté à l'oubli pendant quatre mois.

Et à 21h commence l'histoire des parents. Je dois dire que la télévision est un peu plus futée et procède par série. Quand on est adulte, on ne peut plus regarder toujours le même épisode. Enfin presque, quand on regarde les séries proposées par France Télévision, elles sont principalement policières. Il y a souvent un duo de personnages reliés par une relation complexe. Rien de précis juste un brin de mystère dont on dévoile un petit bout à chaque épisode. Ensuite une intrigue de fond, celle qui vous incite à revenir la semaine prochaine. Et pour finir, l'intrigue du jour, la petite satisfaction du jour.

2016-05-18 Meetup Data For Good 18 Mai

DataForGood continue sa série de meetup sur des projets de datamining au bénéfice de la société. Le dernier opus s'est tenu aujourd'hui Demo Day : Présentation des projets Data for Good et fut très enthousiasmant. Plus d'une centaine de personnes étaient présentes. Cinq projets ont été présentés précédés d'une présentation de Paul Duan. et Adrien Montcoudiol. Il y a très peu d'inspecteurs d'hygiène sur Paris et plus d'un milliers de restaurants. Comment choisir le prochain à visiter ? Vous serez sans doute là la prochaine fois pour avoir la réponse. En attendant, quelques liens : Driven Data un équivalent de Kaggle rémunéré au bénéficiaire d'organismes publics. Data Kind propose de travailler sur des projets à but humanitaire de plus long terme et moins dans l'esprit compétition. Data Look recense des projets centrés sur le partage d'information et leur visualisation, un peu moins sur le travail de celles-ci. On y retrouve le projet mené en Amérique du Sud qui permet à tout un chacun de remonter les nids de poules. Ma rue solidaire un site qui aide au montage de projet collectif pour lutter contre la précarité avec les outils d'aujourd'hui !.

2016-05-14 Les modèles économiques ne prennent pas tout en compte

Je pensais avoir entendu depuis Seattle la présence d'OGM dans l'alimentation bovine avait un impact négactif sur la production de méthane de nos troupeaux. Enlever les OGM permet de réduire la production de méthane de 30%. Mais je n'ai pas réussi à retrouver la source de cette information. J'ai tout de même creusé un peu et je dois dire que je ne sais plus vraiment ce que je bois comme lait.


more...

2016-05-07 Les pubs à la télévision, impact à l'école

Comme la seconde saison de The 100 m'a beaucoup plu, je me suis mis en tête de regarder un épisode sur la télévision américaine. J'ai vite abandonné. Il est quasiment impossible de suivre un épisode avec toute la publicité. Tout est haché surtout vers la fin. Ce n'est rien de nouveau mais en regardant ce découpage ou plutôt ce massacre, je me demandais si cela n'avait pas un effet sur la concentration des enfants américains. Le téléspactateur n'est jamais habitué à maintenir sa concentration plus de sept minutes d'affilée. Cela me rappelle la réflexion de Kristen Stewart aux Oscar Kristen Stewart juge sévèrement la cérémonie des César qui n'était pas habituée à suivre une cérémonie sans interruption. Mais à l'école ? Quel peut être l'impact sur les enfants d'un spectacle où le spectateur n'est jamais concentré sur une période qui n'excède jamais quelques minutes ?

L'élite, par ce terme, je désigne les parents qui ont les moyens d'avoir un contrôle quasi permanent dans le temps sur l'éducation qu'ils donnent à leur enfant, l'élite fait souvent le choix d'interdire la télévision voire la présence d'écrans pour leurs enfants. Je pense mais ce n'est que mon avis que cela favorise chez ces enfants la faculté de pouvoir rester concentré sur une longue période.

En informatique, lorsqu'on construit un programme, on considère qu'une pause, une semaine, un mois, nécessite en effort même de la part de l'auteur du programme lorsqu'il souhaite se replonger dans ce qu'il a écrit. Il lui faut un temps d'adaptation pendant lequel il s'approprie ce qu'il a lui-même créé. Pour programmer, il faut une certaine capacité d'immersion.

Bref si votre enfant joue, ne l'interrompez pas.


more...

Xavier Dupré