<== page de blog - 8/14 ==> Blog cours (3)
page de blog - 8/14¶
Après l’architecture Von Neumann¶
2017-10-26
Les ordinateurs d’aujourd’hui ne sont pas très éloignés de l”architecture Von Neumann qui place le processor CPU au centre de la machine. C’est l’architecture dans le cours proposé en dernière de l’école Anatomie et histoire d’un ordinateur.
…
RUST¶
Pourquoi pandas et numpy, pourquoi pas seulement pandas (2A) ?¶
2017-09-19
Voici quelques questions abordées durant la première séance.
L’instruction pandas.read_csv n’a pas toujours fonctionné.
Deux principales raisons à cela, la première à cause du chemin.
Un chemin peut être absolu, il commence par c:\
ou \
sous Windows
ou /
sous Linux, ou relatif, il commence par un nom.
Le chemin absolu ne pose pas de difficulté en Python sauf dans
quelques cas où le chemin est un chemin réseau (commençant par \\
).
Par défaut, Python cherche les données à partir de l’emplacement
du programme si le chemin est relatif. Cet emplacement est aussi l’emplacement
courant pour le programme. Il suffit de placer les fichiers dans ce répetoire
pour n’utiliser que le nom du fichier. On l’obtient en exécutant :
…
Carré magique (1A) et transformation d’une fonction¶
2017-09-19
On veut écrire une fonction qui calcule la somme des nombres sur chaque ligne d’un carré magique pour s’assurer qu’on a bien la même somme à chaque fois.
…
Quelques papiers que j’aimerais avoir le temps de lire¶
2017-09-13
Lens Depth Function and k-Relative Neighborhood Graph: Versatile Tools for Ordinal Data Analysis
Dense Distributions from Sparse Samples: Improved Gibbs Sampling Parameter Estimators for LDA
Distributed Sequence Memory of Multidimensional Inputs in Recurrent Networks
A Unified Formulation and Fast Accelerated Proximal Gradient Method for Classification
Breaking the Curse of Dimensionality with Convex Neural Networks
Explaining the Success of AdaBoost and Random Forests as Interpolating Classifiers
Clustering from General Pairwise Observations with Applications to Time-varying Graphs∗
Titres des notebooks¶
2017-09-12
Le site contient plus de 300 notebooks qu’on peut retrouver compilés sous la forme d’une gallerie Galleries de notebooks et d’une page qui indique la couverture des tests unitaires : Notebooks Coverage. Excepté si les notebooks utilisent un cluster un une autre ressources difficile d’accès, ceux-ci sont exécutées une fois par semaine pour vérifier qu’ils continuent à tourner avec les dernières versions des modules dont ils dépendent. Ce faisant, le titre est maintenant précédé d’un code qui indique le public auquel il s’adresse et le contenu. Il y a trois niveaux, 1A, 2A, 3A pour chaque année du cursus à l’ENSAE. Le contenu et indiqué par un code.
…
Installer theano et un compilateur C++¶
2017-08-20
epkg:theano est un module difficile à installer car il utilise une compilation C++ pour optimiser les calculer que le programmeur demmande. Cela veut dire qu’il fait appel à un compilateur C++ pour convertir des instructions Python en un code qui s’exécute rapidement. Les portables ont peu souvent des processeurs GPU mais rien n’empêche de développer un programme de deep learning en CPU d’abord. C’est plus facile sous Linux (ou sous Windows Subsystem for Linux. Il suffit d’installer g++ :
…
PyData Seattle - des idées à prendre¶
2017-08-03
Les vidéos de la conférence sont en ligne et il y a toujours de bonnes idées à prendre : PyData Seattle 2017. Quelques modules à suivre : Scattertext, pomegranate. Un dernier module qui montre que toutes les grandes boîtes ont leur outil de machine learning. catboost est optimisé pour la construction de forêt d’arbres sur des variables catégorielles tout comme Facebook avait sorti le sien sur le texte fasttext. Enfin, un champ que je connais moins, z3, un outil de preuve systématique, qui pourrait servir un jour à traiter des données.
Cheat Sheets¶
2017-06-24
Quand quelqu’un s’amuse à regrouper plusieurs cheat sheets au même endroit, il faut absolument garder le lien quelque part, Essential Cheat Sheets for Machine Learning and Deep Learning Engineers, et son répertoire GitHub. C’est une façon très simple d’attirer pas mal de monde au même endroit car cela nous évite pas mal d’aller retour vers un moteur de recherche.
Performance du langage Python¶
2017-02-25
C’est un article de blog assez concis et clair qui dévoile une partie de ce que cache un langage interprété comme Python : Cost of abstractions.
<== page de blog - 8/14 ==> 2020-09 (1) 2020-10 (2) 2020-11 (2) 2020-12 (1) 2021-02 (2)