Lemonnier_Remi.jpg
Dans cette thèse, nous étudions deux applications des processus stochastiques au marketing Internet. Le premier chapitre s'intéresse au "scoring" d'internautes pour les enchères en temps réel. Ce problème consiste à trouver la probabilité qu'un internaute donné réalise une action d'intérêt, appelée conversion, dans les quelques jours suivant l'affichage d'une bannière publicitaire.
Nous montrons que les processus de Hawkes [1] constituent une modélisation naturelle de ce phénomène mais que les algorithmes de l'état de l'art ne sont pas applicables à la taille des données typiquement à l'oeuvre dans des applications industrielles.
Nous développons donc deux nouveaux algorithmes d'inférence non-paramétrique qui sont plusieurs ordres de grandeurs plus rapides que les méthodes précédentes. Nous montrons empiriquement que le premier a de meilleures performances que les compétiteurs de l'état de l'art, et que le second permet une application à des jeux de données encore plus importants sans payer un prix trop important en terme de pouvoir de prédiction.
Les algorithmes qui en découlent ont été implémentés avec de très bonnes performances depuis plusieurs années à
1000mercis, l'agence marketing d'avant-garde étant le partenaire industriel de cette thèse CIFRE, où ils sont devenus un actif important pour la production.
Le deuxième chapitre s'intéresse aux processus diffusifs sur les graphes qui constituent un outil important pour modéliser la propagation d'une opération de marketing viral sur les réseaux sociaux. Nous établissons les premières bornes théoriques sur le nombre total de noeuds atteint par une contagion dans le cadre de graphes et dynamiques de diffusion quelconques, et montrons l'existence de deux régimes bien distincts : le régime sous-critique
où au maximum O(n) noeuds seront infectés, où n est la taille du réseau, et le régime sur-critique ou O(n) noeuds peuvent être infectés.
Nous étudions également le comportement par rapport au temps d'observation T et mettons en lumière l'existence de temps critiques en-dessous desquels une diffusion, même sur-critique sur le long terme, se comporte de manière sous-critique. Enfin,
nous étendons nos travaux à la percolation et l'épidémiologie, où nous améliorons les résultats existants.