XD blog

blog page

2016-07


2016-07-31 Ouvrir les données

Je reviens de vacances. J'étais à Mimizan. Au cours de mes balades, je suis tombé sur ce panneau.

Il est apposé sur une sorte de piédestal assez haut pour surmonter les grandes marées. Au pied s'écoulent les rejets de l'usine GascognePapier. Je ne doute pas de la véracité de l'annonce mais l'odeur assez forte qui se dégage du ruisseau qui s'écoule dans la mer ébranle quelque peu cette affirmation. Pourquoi chercher à réduire des rejets s'ils ne sont pas toxiques ? Une personne qui a traversé l'écoulement pieds nus - nous sommes sur une plage - a pris soin quelques mètres plus loin de nettoyer ses jambes jusqu'au genou. Et puis réduire par 5, qu'est-ce que cela veut dire ? Je suppose qu'en 20 ans, la composition de ces déchets a évolué. Que veut dire réduire par 5 ? On peut réduire le volume des rejets par 5 tout en rejetant la même quantité de produits nocifs.

Je me suis alors demandé si j'aboutirais à la même conclusion à partir de données relatives à la composition de ces rejets. Pourquoi ne pas publier ces données si ces rejets ne sont pas toxiques ?

2016-07-20 Python module: mlxtend

A module to follow mlxtend. Don't forget to read the blog of his author: sebastianraschka. Worth the detour.

2016-07-07 Machine Learning? What did you say?

Yesterday my sister asked : What is machine learning? And she quickly added please explain with terms I know.

Ok...

So I won't say this is just a bunch of optimization problems which apply on data to improve the efficiency of a company.

What should i say?

Should I apply the shaddock logic to my job: if I can't explain, I'm no use. Is it about quantifying people's intuition with data?

Well...

Machine Learning is everywhere but that won't help. In cars, in websites, in sales, but that won't help.

So I thought. Think about your job today, think about it in 20 years. A robot will probably do it. We always think a robot is a machine as if you could only automate physical jobs such as a mechanical arm. But the smaller robot is a program for computers. I press a button to update my blog: this is a robot. By extension, we could consider machine learning a kind of robot for statisticians. We don't try anymore to analyze the data, to model it. We just try to apply a black box which tells us if the data can be predicted. How? we care less.

Is that the end of the story?

The robot knows more and more and still can only solve problems we've seen. Not the last one. The new one. So the job is now to improve the robot so that I don't solve the same problem twice.


Xavier Dupré