from jyquickhelper import add_notebook_menu
add_notebook_menu(last_level=2)


import numpy as np
from pyquickhelper.helpgen import NbImage
from sklearn.datasets import load_iris
from sklearn.linear_model import LogisticRegression
from sklearn.ensemble import RandomForestClassifier
from jupytalk.talk_examples.sklearn2019 import (
    graph_persistence_pickle, graph_persistence_pickle_issues,
    graph_persistence_onnx, profile_fct_graph, onnx2str, onnx2dotnb,
    onnxdocstring2html, rename_input_output, graph_three_components)
from mlinsights.plotting import pipeline2dot
%matplotlib inline


from logging import getLogger
logger = getLogger('skl2onnx')
logger.disabled = True


graph_persistence_pickle()


graph_persistence_pickle_issues()


data = load_iris()
X, y = data.data, data.target


clr = LogisticRegression(multi_class="auto", solver="liblinear").fit(X, y)

profile_fct_graph(lambda: [clr.predict(X) for i in range(0, 1000)],
                  "Cumulated time inside functions when predicting\nLogisticRegression",
                  ["safe_sparse_dot", "dot", "sum"]);


graph_persistence_onnx()


graph_three_components()


X.shape

(150, 4)


beta = np.random.randn(4, 3)
M = (X @ beta)
expM = np.exp(M)
pred = expM / (expM + 1)
pred[:5]

array([[0.9993822 , 0.45859843, 0.99672386],
       [0.99938059, 0.477194  , 0.99527649],
       [0.99892886, 0.46590839, 0.99484022],
       [0.99878037, 0.50803645, 0.99322234],
       [0.99918539, 0.46178468, 0.9964578 ]])


X32 = X.astype(np.float32)
beta32 = beta.astype(np.float32)


from skl2onnx.algebra.onnx_ops import OnnxMatMul, OnnxExp, OnnxAdd, OnnxDiv

onnxExpM = OnnxExp(OnnxMatMul('X', beta32, op_version=12), op_version=12)

cst = np.ones((1, 3), dtype=np.float32)
onnxExpM1 = OnnxAdd(onnxExpM, cst, op_version=12)        # use of broadcasting

onnxPred = OnnxDiv(onnxExpM, onnxExpM1, op_version=12)


inputs = {'X': X[:1].astype(np.float32)}

model_onnx = onnxPred.to_onnx(inputs)

print(onnx2str(model_onnx))

ir_version: 4
producer_name: "skl2onnx"
producer_version: "1.7.0"
domain: "ai.onnx"
model_version: 0
graph {
  node {
    input: "X"
    input: "Ma_MatMulcst"
    output: "Ma_Y0"
    name: "Ma_MatMul"
    op_type: "MatMul"
    domain: ""
  }
  node {
...


with open("model-1.onnx", "wb") as f:
    f.write(model_onnx.SerializeToString())


import onnx
model2 = onnx.load("model-1.onnx")


onnx2dotnb(model_onnx, orientation='LR')


from skl2onnx.algebra.onnx_ops import OnnxLinearRegressor
onnxdocstring2html(OnnxLinearRegressor.__doc__)


lin_reg = OnnxLinearRegressor('input',
                              coefficients=list(beta.ravel().astype(np.float64)),
                              targets=2)

inputs = {'input': X[:1].astype(np.float32)}
try:
    model_onnx = lin_reg.to_onnx(inputs)
except Exception as e:
    print(str(e).split("\n")[0])

Shape inference fails.


from onnxconverter_common.data_types import FloatTensorType

model_onnx = lin_reg.to_onnx(inputs, outputs=[('Yp', FloatTensorType((1, 1)))])

onnx2dotnb(model_onnx, width="80%")


clr = LogisticRegression(multi_class="auto", solver="liblinear").fit(X, y)
clr

LogisticRegression(solver='liblinear')


from skl2onnx import to_onnx

model_onnx = to_onnx(clr, X.astype(np.float32), target_opset=12)

onnx2dotnb(model_onnx)


from sklearn.pipeline import Pipeline
from sklearn.decomposition import PCA

pipe = Pipeline([('pca', PCA(n_components=2)),
                 ('lr', LogisticRegression())])
pipe.fit(X, y)

Pipeline(steps=[('pca', PCA(n_components=2)), ('lr', LogisticRegression())])


model_onnx = to_onnx(pipe, X.astype(np.float32), target_opset=12)

onnx2dotnb(model_onnx, orientation="TB", width="30%")


from onnxruntime import InferenceSession

sess = InferenceSession(model_onnx.SerializeToString())

label, proba = sess.run(None, {'X': X32})
label[:3]

array([0, 0, 0], dtype=int64)


pipe.predict_proba(X32)[:3]

array([[9.81390001e-01, 1.86099916e-02, 7.11872743e-09],
       [9.76009954e-01, 2.39900265e-02, 1.93148667e-08],
       [9.84706803e-01, 1.52931912e-02, 6.28132306e-09]])


proba[:3]

[{0: 0.9813900589942932, 1: 0.018609998747706413, 2: 7.118746925272035e-09},
 {0: 0.9760100245475769, 1: 0.023990022018551826, 2: 1.9314878585419137e-08},
 {0: 0.9847068190574646, 1: 0.015293179079890251, 2: 6.281324793633303e-09}]


pipe.predict_proba(X32)[:3]

array([[9.81390001e-01, 1.86099916e-02, 7.11872743e-09],
       [9.76009954e-01, 2.39900265e-02, 1.93148667e-08],
       [9.84706803e-01, 1.52931912e-02, 6.28132306e-09]])


import pandas
pandas.DataFrame(proba).head()


clr = LogisticRegression(multi_class="auto", solver="liblinear").fit(X, y)
model_onnx = to_onnx(clr, X[:1].astype(np.float32))


model_js = ("var myarr = new Uint8Array([%s]);" % 
    ",".join(map(lambda x: str(x), model_onnx.SerializeToString())))
model_js[:200] + " ... " + model_js[-20:]

'var myarr = new Uint8Array([8,4,18,8,115,107,108,50,111,110,110,120,26,5,49,46,55,46,48,34,7,97,105,46,111,110,110,120,40,0,50,0,58,229,4,10,141,2,10,1,88,18,5,108,97,98,101,108,18,18,112,114,111,98,9 ... 0,46,109,108,16,1]);'


script = """
%s
var myOnnxSession = new onnx.InferenceSession({ backendHint: 'webgl' });
var inferenceInputs = [ new onnx.Tensor(new Float32Array([5.1, 3.5, 1.4, 0.2]), "float32", [1, 4]) ];

myOnnxSession.loadModel(myarr).then(() => {
    myOnnxSession.run(inferenceInputs).then(output => {
        const outputTensor = output.values().next().value;
        document.getElementById("__ID__").innerHTML = "<p>" + String(outputTensor) + "</p>"
    }).catch(function(err) {
    document.getElementById("__ID__").innerHTML = err.message;
    });
}).catch(function(err) {
    document.getElementById("__ID__").innerHTML = err.message;
});
""" % model_js


from jyquickhelper import RenderJS
jr = RenderJS(script, libs = [dict(path="https://cdn.jsdelivr.net/npm/onnxjs/dist/onnx.min.js",
                                   name="onnx", exports="onnx")])
jr


clr = LogisticRegression(multi_class="auto", solver="liblinear").fit(X, y)


%timeit clr.predict_proba(X[:1])

80.9 µs ± 5.95 µs per loop (mean ± std. dev. of 7 runs, 10000 loops each)


sess = InferenceSession(model_onnx.SerializeToString())
X32 = X.astype(np.float32)
%timeit sess.run(None, {'X': X32[:1]})

22 µs ± 4.13 µs per loop (mean ± std. dev. of 7 runs, 10000 loops each)


clr = RandomForestClassifier(n_estimators=10).fit(X, y)


%timeit clr.predict_proba(X[:1])

890 µs ± 63 µs per loop (mean ± std. dev. of 7 runs, 1000 loops each)


sess = InferenceSession(model_onnx.SerializeToString())
X32 = X.astype(np.float32)
%timeit sess.run(None, {'X': X32[:1]})

19.5 µs ± 1.04 µs per loop (mean ± std. dev. of 7 runs, 100000 loops each)


pipe = Pipeline([('pca', PCA(n_components=2)),
                 ('lr', LogisticRegression(multi_class="auto"))])
pipe.fit(X, y)
model_onnx = to_onnx(pipe, X[:1].astype(np.float32))


from mlprodict.sklapi import OnnxTransformer
tr = OnnxTransformer(model_onnx.SerializeToString(), output_name="output_probability")
tr.fit()
tr.transform(X)[:5]


pipe = Pipeline([('onnx', OnnxTransformer(model_onnx.SerializeToString(), 
                                         output_name="output_probability")),
                 ('lr', LogisticRegression(multi_class="auto"))])
pipe.fit(X, y)
dot = pipeline2dot(pipe, X)

from jyquickhelper import RenderJsDot
RenderJsDot(dot)


from sklearn.ensemble import RandomForestClassifier
clr = RandomForestClassifier(n_estimators=2).fit(X, y)

profile_fct_graph(lambda: [clr.predict(X) for i in range(0, 1000)], nb=30, figsize=(15, 3),
                  title="Cumulated time inside functions when predicting\nRandomForestClassifier");


import onnx, skl2onnx, sklearn, onnxruntime, mlprodict
mods = [onnx, skl2onnx, onnxruntime, sklearn, mlprodict]
for m in mods:
    print(m.__name__, m.__version__)

onnx 1.7.105
skl2onnx 1.7.0
onnxruntime 1.3.993
sklearn 0.24.dev0
mlprodict 0.3.1134

	0	1	2
0	0.981390	0.018610	7.118747e-09
1	0.976010	0.023990	1.931488e-08
2	0.984707	0.015293	6.281325e-09
3	0.975605	0.024395	2.240644e-08
4	0.983403	0.016597	5.354823e-09

	0	1	2
0	0.981390	0.018610	7.118747e-09
1	0.976010	0.023990	1.931488e-08
2	0.984707	0.015293	6.281325e-09
3	0.975605	0.024395	2.240644e-08
4	0.983403	0.016597	5.354823e-09

ONNX, scikit-learn, persistence, deployment¶

Persistence and predictions¶

Persistence with pickle¶

Main issues¶

Iris dataset¶

Example with logistic regression¶

Persistence with ONNX¶

Three components for ONNX¶

ONNX specifications¶

Example with matrix operations¶

Case of a simple linear regression: dedicated operator¶

Conversion to ONNX¶

scikit-learn to ONNX: sklearn-onnx¶

Conversion of a pipeline¶

Runtime¶

onnxruntime¶

ONNX.js¶

Benchmark¶

LogisticRegression¶

RandomForestClassifier¶

Transfer Learning¶

OnnxTransformer¶

Within a pipeline¶

Appendix¶

Profile RandomForestClassifier¶

Open source tools in this talk¶