Vous le savez, la conviction qui nous anime est la même depuis la création de Qwant : il y a un besoin pressant sur le marché pour un moteur de recherche qui respecte la vie privée de ses utilisateurs ! Mais pour développer cette technologie, il nous a fallu faire des choix…
Le TECH ROCKS SUMMIT a été l’occasion pour moi de mettre un petit coup de projecteur sur ce qui est au cœur de notre aventure : la technologie qui fait tourner notre moteur de recherche et les choix que nous avons faits depuis mon arrivée au mois de mars dernier !
Vous le savez, la conviction qui nous anime est la même depuis la création de Qwant : il y a un besoin pressant sur le marché pour un moteur de recherche qui respecte la vie privée de ses utilisateurs ! Mais pour développer cette technologie, il nous a fallu faire des choix… et quelques compromis afin d’offrir le meilleur service possible à nos utilisateurs tout en garantissant le respect de nos valeurs.
Durant mon intervention, j’ai ainsi expliqué comment il avait été décidé de déléguer une partie du travail d’indexation à un partenaire : Microsoft Bing. Depuis les premières mises en production, Qwant a posé les briques fondatrices lui permettant de ne plus faire que déléguer à son partenaire. Une part substantielle des requêtes utilisateurs est aujourd’hui intégralement gérée par Qwant.
Nos SERP, Search Engine Result Pages, sont composées de plusieurs parties, et la liste des documents est celle qui nous occupe dans ce billet. La qualité et la pertinence sont maitresses, et pour les améliorer, nous développons nos algorithmes de Learning-to-Rank (LTR). C’est une décision cruciale car le LTR est véritablement le cœur du réacteur !
C’est cette technologie qui nous permet de faire évoluer Qwant vers une autonomie grandissante et des résultats toujours plus pertinents. De manière similaire, il a été ainsi, dans un premier temps, plus intéressant de nous appuyer, pour l’indexation, sur Elasticsearch.
Cette solution nous a permis de faire les premiers pas. Mais la latence grandissant avec le volume de l’index, nous avons fait le choix récent de changer de technologie afin de baisser nos temps de réponses moyens d’une seconde à soixante millisecondes, et ainsi nous affranchir d’une contrainte nous interdisant d’envisager une totale autonomie.
En quelques mots je viens de parler de temps de réponse de notre index, en regard de sa taille. Aujourd’hui, Qwant est en mesure de répondre en totale autonomie aux requêtes de ses utilisateurs dans 40 % des cas pour ce qui est de la liste de documents proposée. Mais tant d’autres éléments sont à présenter e.g. la vitesse de crawl qui permet la fraicheur des résultats, le suivi de qualité qui permet de valider la pertinence, l’intelligence artificielle qui permet de travailler sur cette pertinence. D’autres billets de blogs et interventions technique vont nous permettre à l’avenir de présenter les efforts et les avancées de Qwant.
En nous recentrant sur notre cœur de métier, nous nous assurons de posséder les compétences fondamentales et les outils pour être, demain, incontournable.