Simon Bussy

FLASH: a Fast joint model for Longitudinal And Survival data in High dimension

V.T. Nguyen, A. Fermanian, A. Guilloux, A. Barbieri, S. Zohar, A.S. Jannot, S. Bussy

Biometrics (2024)

Paper

Online Inventory Problems: Beyond the i.i.d. Setting with Online Convex Optimization

M. Hihat, S. Gaïffas, G. Garrigos, S. Bussy,

NeurIPS (2023)

Paper

Binacox: automatic cut-point detection in high-dimensional Cox model with applications in genetics

S. Bussy, M.Z. Alaya, A. Guilloux, A.S. Jannot

Biometrics (2021)

Paper GitHub

Comparison of methods for early-readmission prediction in a high-dimensional heterogeneous covariates and time-to-event outcome framework

S. Bussy, R. Veil, V. Looten, A. Burgun, S. Gaïffas, A. Guilloux, B. Ranque, A.S. Jannot

BMC Medical Research Methodology (2019)

Paper GitHub

Binarsity: a penalization for one-hot encoded features in linear supervised learning

M.Z. Alaya, S. Bussy, S. Gaïffas, A. Guilloux

Journal of Machine Learning Research (2019)

Paper GitHub

Trajectories of Biological Values and Vital Parameters: An Observational Cohort Study of Adult Patients with Sickle Cell Disease Hospitalized for a Non-Complicated Vaso-Occlusive Crisis

R. Veil, S. Bussy, V. Looten, J.B. Arlet, J. Pouchot, A.S. Jannot, B. Ranque

Journal of Clinical Medicine (2019)

Paper GitHub

C-mix: A high-dimensional mixture model for censored durations, with applications to genetic data

Doctor Norbert Marx 2019 Award

S. Bussy, A. Guilloux, S. Gaïffas, A.S. Jannot

Statistical Methods in Medical Research (2018)

Paper GitHub

PhD manuscript, Laboratoire de Probabilités, Statistique et Modélisation (LPSM, UMR 8001)
Supervised by A. Guilloux, A.S. Jannot, S. Gaïffas. Paris - France, October 2015-October 2018

Introduction of high-dimensional interpretable machine learning models and their applications

thesis slides
Research internship, Centre de Mathématiques Appliquées of École Polytechnique,
Supervised by A.S. Jannot, S. Gaïffas, A. Guilloux. Palaiseau - France, April-September 2015

New machine learning techniques for medicine

report slides
Kaggle in class, Dreem startup, ENS Paris-Saclay,
Paris - France, January 2015 - Mars 2015

Prediction of slow oscillation from EEG signals

report slides website
Research project on reinforcement learning, ENS Paris-Saclay,
Supervised by Emilie Kaufmann. Paris - France, October 2014 - January 2015

A movie recommendation system based on Multi-action bandits

report slides
Data scientist intership, Orange Silicon Valley,
San Francisco - United States, February - August 2014

Machine learning models to predict startups valuation trends

report slides website
Deep learning reseach project, Telecom SudParis,
Supervised by Jérémie Jakubowicz. Évry - France, October 2013 - January 2014

Layer-wise training of deep generative models

report
Reseach project, Telecom SudParis,
Supervised by Wojciech Pieczynski. Évry - France, April - June 2013

Optimal unsupervised segmentation of pairwise Markov process

report

Prix de thèse Daniel Schwartz - Conservatoire National des Arts et Métiers,
Paris - France, Oct 2020

Introduction de modèles de machine learning interprétables en grande dimension et leurs applications

slides
2020 Joint Statistical Meetings (JSM) - American Statistical Association,
Philadelphia - USA, Aug 2020

Lights: a generalized joint model for high-dimensional multivariate longitudinal data and censored durations (oral, virtual session)

slides talk website
2020 International Biometric Conference (IBC),
Seoul - Korea, Jul 2020

Lights: a generalized joint model for high-dimensional multivariate longitudinal data and censored durations (oral, virtual session)

slides website
Journées de Statistique 2019,
Nancy - France, Jun 2019

Prix du Docteur Norbert MARX 2019 (oral)

slides website
Irontalk: conference at Ironhack Web Development Bootcamp,
Paris - France, May 2019

How to introduce AI to a traditional business

event
Conférence Doctoriales Sorbonne Université,
Paris - France, Apr 2019

Grand témoin docteur-entrepreneur: Business Plan, Valeur d’une entreprise et Financement de l’innovation
Séminaire INSERM UMR 1137 (Paris Bichat),
Paris - France, Feb 2019

Design of a machine learning algorithm in high dimension to predict hospital readmission (oral)
Séminaire IRDES méthodologique sur les parcours de soins,
Paris - France, Jan 2019

Design d’un algorithme d’IA en grande dimension pour prédire la réadmission à l’hôpital (oral)

slides
L'intelligence artificielle pour l'homme et sa santé,
Evry - France, Dec 2018

Binacox: automatic cut-points detection in high-dimensional Cox model (poster)

poster website
I.A. & Santé,
Nancy - France, July 2018

Design d’un algorithme d’IA en grande dimension pour prédire la réadmission à l’hôpital (oral)

paper slides website
Machine Learning Summer School,
Buenos Aires - Argentina, June 2018

Binacox: automatic cut-points detection in high-dimensional Cox model (poster)

poster website
PhD students seminar at LPSM,
Paris - France, April 2017

Survival model in high-dimension

slides1 slides2 website
International Society for Clinical Biostatistics,
Birmingham - United Kingdom, August 2016

C-mix: A high-dimensional mixture model for censored durations (poster)

website
MAP5 Seminar,
Paris - France, May 2016

Modèle pénalisé pronostique à variable latente pour des données censurées

slides website
Paris Big Data Management Summit,
Paris - France, March 2016

A high dimensional mixture model for time-to-event data (poster)

poster website
Workshop Data Initiative, École Polytechnique,
Palaiseau - France, Mars 2016

Modelling Patient Time-Series Data from EHR using Gaussian Processes

slides website
Internal Medicine Department Seminar, APHP,
Paris - France, January 2016

Facteurs prédictifs de la réhospitalisation précoce de drépanocytaires adultes

slides website
PhD students seminar at LPSM,
Paris - France, January 2016

Risk assessment of sickle-cell anemia

slides website
PhD students seminar at Centre de Recherche des Cordeliers INSERM,
Paris - France, December 2015

Continuous time survival in latent variable models

slides website
Workshop Data Initiative, École Polytechnique,
Palaiseau - France, October 2015

Forecasting Non-Stationary Time Series

website

Statistical Learning & Longitudinal data,
M2 Massive Health Data - Paris Descartes University

Lecture Instructor, 2019-20; 2020-21

SLIDES
Survival Analysis & Machine Learning,
M2 Massive Health Data - Paris Descartes University

Lecture Instructor, 2019-20; 2020-21

SLIDES
DataCamp Kaggle
M2 Data Science - Université Paris Saclay

Project Manager & Instructor, 2018-19; 2019-20; 2020-21
Data Science & Feature Design,
Ecole polytechnique Executive Education - Palaiseau

Lecture Instructor, Feb 2019
Linear models
M1 ISUP-UPMC

Teaching Assistant, 2017-18, lecture instructor: Charlotte Dion

TD1 TD2 TD3 TD4 TD5 TD6 TD7
Linear models
M1 ISUP-UPMC

Teaching Assistant, 2016-17, lecture instructor: Claire Boyer

TD1 TD2 TD3 TD4 TD5 TD6 TD7 TD8 TD9
Inferential Statistics,
L3 ISUP-UPMC

Teaching Assistant, 2015-16; 2016-17; 2017-18. Lecture instructor: Olivier Lopez

TD1 TD2 TD3 TD4 TD5
Time series,
M1 ISUP-UPMC

Teaching Assistant, 2015-16. Lecture instructor: Vincent Lefieux

Time Series with R TD Data TP Data project

Massil Hihat,
Califrais' Machine Learning Lab, LOPF, LPSM

PhD Student (2021-)
Van Tuan Nguyen,
Califrais' Machine Learning Lab

PhD Student (2021-)
Massil Hihat,
Califrais' Machine Learning Lab, LOPF, LPSM

Research Internship (2021) ENS Paris

Supply Chain Modeling with Model Predictive Control
Van Tuan Nguyen,
Califrais' Machine Learning Lab

Research Internship (2020) M2 Télécom Paris

High-dimensional constrained stock optimization using deep deterministic policy gradient
Alice Eliet-Doillet,
Califrais' Machine Learning Lab

Research Internship (2019) M2 ENSAE ParisTech

Machine Leaning for churn modelling: state-of-the-art review and introduction of a new method for high-dimensional longitudinal data
Bastien Bergere,
Califrais' Machine Learning Lab

Research Internship (2019) M2 Mathématiques, Apprentissage et Sciences Humaines (MASH), Université Paris-Dauphine; Mathématiques Vision Apprentissage (MVA), ENS Paris-Saclay

Reinforcement Learning for stock optimization and introduction of a new method for learning an efficient discretization for continuous states MDP
Meziane Bellahmer,
Califrais' Machine Learning Lab

Research Internship (2019) M2 Intelligence Artificielle, Université Paris-Descartes

Multivariate time-series modelling to predict prices, availability and demand of fresh produce
Maud De Tollenaere,
co-supervised with A.S. Jannot, F. Pages, A. Guilloux

Research Internship (2018) M2 Analyse, Modélisation et Ingénierie de l’Information Biologique et Médicale, Université Paris-Saclay

Techniques d’apprentissage automatique pour affiner le pronostic à l’aide de données d’imagerie immunologique
Christophe Botella,
co-supervised with A.S. Jannot, A. Guilloux

Research Internship (2016) M2 Mathématiques pour les Sciences du Vivant, Université Paris-Saclay

Modèle de régression sur données longitudinales: application à des données médicales à faible résolution

Report

2018-2019
Postdoctoral research position, INSERM

We introduced a prognostic method called lights to deal with the problem of joint modeling of longitudinal data and censored durations in a high-dimensional context.
2015-2018
PhD in Statistics, Sorbonne University

At the intersection between theory and applications, my work was focused on the design and analysis of statistical methods for high-dimensional problems, with a particular emphasis on survival analysis settings.
2014-2015
MSc in Machine Learning (MVA), ENS Paris-Saclay, Mention Très Bien

Harmonic analysis, wavelet analysis and signal processing, optimization, information theory and pattern recognition, statistical learning and high dimensional statistics, kernel methods, reinforcement learning, graphical models, computer vision.
2011-2014
MSc in Statistics & Applied Mathematics, Télécom SudParis

Course (grade): Maths (A), data analysis (A), probability & statistics (A), data mining (A+), numerical analysis (A), optimization (A), information theory (A+), stochastic processes (A+), Queuing theory (A+), Databases Management (A).

download cv (fr)

simon.bussy@califrais.fr simon.bussy@gmail.com

Califrais' Machine Learning Lab
4 rue Martel
75010 Paris

Simon Bussy

About me

Honours

Research interests

Papers

FLASH: a Fast joint model for Longitudinal And Survival data in High dimension

Online Inventory Problems: Beyond the i.i.d. Setting with Online Convex Optimization

Binacox: automatic cut-point detection in high-dimensional Cox model with applications in genetics

Comparison of methods for early-readmission prediction in a high-dimensional heterogeneous covariates and time-to-event outcome framework

Binarsity: a penalization for one-hot encoded features in linear supervised learning

Trajectories of Biological Values and Vital Parameters: An Observational Cohort Study of Adult Patients with Sickle Cell Disease Hospitalized for a Non-Complicated Vaso-Occlusive Crisis

C-mix: A high-dimensional mixture model for censored durations, with applications to genetic data

Other manuscripts

PhD manuscript, Laboratoire de Probabilités, Statistique et Modélisation (LPSM, UMR 8001)
Supervised by A. Guilloux, A.S. Jannot, S. Gaïffas. Paris - France, October 2015-October 2018

Introduction of high-dimensional interpretable machine learning models and their applications

Research internship, Centre de Mathématiques Appliquées of École Polytechnique,
Supervised by A.S. Jannot, S. Gaïffas, A. Guilloux. Palaiseau - France, April-September 2015

New machine learning techniques for medicine

Kaggle in class, Dreem startup, ENS Paris-Saclay,
Paris - France, January 2015 - Mars 2015

Prediction of slow oscillation from EEG signals

Research project on reinforcement learning, ENS Paris-Saclay,
Supervised by Emilie Kaufmann. Paris - France, October 2014 - January 2015

A movie recommendation system based on Multi-action bandits

Data scientist intership, Orange Silicon Valley,
San Francisco - United States, February - August 2014

Machine learning models to predict startups valuation trends

Deep learning reseach project, Telecom SudParis,
Supervised by Jérémie Jakubowicz. Évry - France, October 2013 - January 2014

Layer-wise training of deep generative models

Reseach project, Telecom SudParis,
Supervised by Wojciech Pieczynski. Évry - France, April - June 2013

Optimal unsupervised segmentation of pairwise Markov process

Talks, Teaching & Supervision

Education

Postdoctoral research position, INSERM

PhD in Statistics, Sorbonne University

MSc in Machine Learning (MVA), ENS Paris-Saclay, Mention Très Bien

MSc in Statistics & Applied Mathematics, Télécom SudParis

Contact

Research interests

Statistical Learning

High-dimensional Statistics

Survival Analysis

Time series

Reinforcement learning

Deep learning

Papers

FLASH: a Fast joint model for Longitudinal And Survival data in High dimension

Online Inventory Problems: Beyond the i.i.d. Setting with Online Convex Optimization

Binacox: automatic cut-point detection in high-dimensional Cox model with applications in genetics

Comparison of methods for early-readmission prediction in a high-dimensional heterogeneous covariates and time-to-event outcome framework

Binarsity: a penalization for one-hot encoded features in linear supervised learning

Trajectories of Biological Values and Vital Parameters: An Observational Cohort Study of Adult Patients with Sickle Cell Disease Hospitalized for a Non-Complicated Vaso-Occlusive Crisis

C-mix: A high-dimensional mixture model for censored durations, with applications to genetic data

Other manuscripts

PhD manuscript, Laboratoire de Probabilités, Statistique et Modélisation (LPSM, UMR 8001) Supervised by A. Guilloux, A.S. Jannot, S. Gaïffas. Paris - France, October 2015-October 2018

Introduction of high-dimensional interpretable machine learning models and their applications

Research internship, Centre de Mathématiques Appliquées of École Polytechnique, Supervised by A.S. Jannot, S. Gaïffas, A. Guilloux. Palaiseau - France, April-September 2015

New machine learning techniques for medicine

Kaggle in class, Dreem startup, ENS Paris-Saclay, Paris - France, January 2015 - Mars 2015

Prediction of slow oscillation from EEG signals

Research project on reinforcement learning, ENS Paris-Saclay, Supervised by Emilie Kaufmann. Paris - France, October 2014 - January 2015

A movie recommendation system based on Multi-action bandits

Data scientist intership, Orange Silicon Valley, San Francisco - United States, February - August 2014

Machine learning models to predict startups valuation trends

Deep learning reseach project, Telecom SudParis, Supervised by Jérémie Jakubowicz. Évry - France, October 2013 - January 2014

Layer-wise training of deep generative models

Reseach project, Telecom SudParis, Supervised by Wojciech Pieczynski. Évry - France, April - June 2013

Optimal unsupervised segmentation of pairwise Markov process

Talks, Teaching & Supervision

Education

Contact

PhD manuscript, Laboratoire de Probabilités, Statistique et Modélisation (LPSM, UMR 8001)
Supervised by A. Guilloux, A.S. Jannot, S. Gaïffas. Paris - France, October 2015-October 2018

Research internship, Centre de Mathématiques Appliquées of École Polytechnique,
Supervised by A.S. Jannot, S. Gaïffas, A. Guilloux. Palaiseau - France, April-September 2015

Kaggle in class, Dreem startup, ENS Paris-Saclay,
Paris - France, January 2015 - Mars 2015

Research project on reinforcement learning, ENS Paris-Saclay,
Supervised by Emilie Kaufmann. Paris - France, October 2014 - January 2015

Data scientist intership, Orange Silicon Valley,
San Francisco - United States, February - August 2014

Deep learning reseach project, Telecom SudParis,
Supervised by Jérémie Jakubowicz. Évry - France, October 2013 - January 2014

Reseach project, Telecom SudParis,
Supervised by Wojciech Pieczynski. Évry - France, April - June 2013