Thumbnail for Innovation: C'est quoi Kaggle? by En parlant de bureautique, formez-vous!

Innovation: C'est quoi Kaggle?

En parlant de bureautique, formez-vous!

7m 15s1,161 words~6 min read
YouTube auto captions
Transcript source

YouTube auto captions

This transcript was extracted from YouTube's auto-generated caption track. The transcript below is server-rendered so it can be read, searched, cited, and shared without opening the original YouTube player.

Timestamped outline
Pull quotes
[0:03]Bonjour, Kaggle est devenue une plateforme incontournable et vous devez absolument savoir ce qui s'y passe si vous intéressez à l'innovation.
[0:03]Les plus grandes entreprises s'en servent aujourd'hui pour essayer de découvrir de nouveaux outils ou pour faire leur recrutement.
[0:23]Vous trouverez des jeux de données liés à la finance, aux personnes les plus riches du monde, à la nutrition, à la vente de maison et cetera.
[0:23]On a tous les domaines de la science et de l'économie qui sont représentés et où vous pouvez trouver des choses incroyables, c'est une mine d'or.
Use this transcript
Related transcript hubs

[0:03]Bonjour, Kaggle est devenue une plateforme incontournable et vous devez absolument savoir ce qui s'y passe si vous intéressez à l'innovation. Les plus grandes entreprises s'en servent aujourd'hui pour essayer de découvrir de nouveaux outils ou pour faire leur recrutement. Je vous montre comment cela marche, c'est parti.

[0:23]La première chose que vous trouverez sur Kaggle, c'est des jeux de données, c'est-à-dire des informations que des entreprises, des fondations non gouvernementales ou des états mettent à disposition pour que des gens puissent travailler dessus, entraîner des intelligences artificielles pour découvrir des choses à partir de ces données. Vous trouverez des jeux de données liés à la finance, aux personnes les plus riches du monde, à la nutrition, à la vente de maison et cetera. On a tous les domaines de la science et de l'économie qui sont représentés et où vous pouvez trouver des choses incroyables, c'est une mine d'or. Rajoutez à ce que je viens de vous donner les données scientifiques, comme par exemple l'analyse des photos ou alors des éléments liés au sport et vous avez vraiment un panorama complet de toute l'information des data à aujourd'hui.

[1:17]La deuxième chose qui rend cette plateforme absolument incontournable, c'est bien sûr les compétitions qui sont organisées par les grands noms de l'économie, des entreprises ou des fondations. Ici par exemple, vous avez actuellement une compétition organisée par American Express à partir d'un certain nombre d'informations anonymisées de leurs clients qui veulent savoir est-ce qu'on peut deviner quel client va avoir une défaillance, ne pourra pas rembourser son prêt. Dans les prix, on peut aller donc à 100 000 € par exemple actuellement, mais généralement, on est plutôt aux alentours de 25 000 €, mais comme vous le voyez, il y a des prix un petit peu à tous les niveaux entre ces deux bornes. Les compétitions ne s'intéressent pas seulement au nombre comme dans le cas de American Express, mais aussi à l'analyse des photos. Ici une fondation Happy Whale offre 25 000 € aux personnes qui arriveront à créer un algorithme qui permet de suivre les dauphins au fur et à mesure de leur observation dans le temps afin de les reconnaître. Je vous montre ici une petite photo, on voit qu'il y a un petit point là, on le retrouve quelques années plus tard ici avec d'autres marques. Il faudrait que l'algorithme à partir d'une simple photo reconnaisse qu'il s'agit bien du même animal. Toujours dans la nature, vous trouverez des analyses de sons avec la reconnaissance de cris d'oiseaux. Voici un exemple pour la biologie avec l'analyse de tissus, mais vous trouverez des tas d'autres compétitions. De nombreuses chaînes de magasins organisent ici des concours de prédiction des ventes en fonction de certains facteurs comme est-ce qu'il s'agit de vacances, est-ce qu'il fait beau temps et cetera. N'hésitez pas à aller voir si vous êtes dans le secteur du retail. L'analyse des sentiments est aussi quelque chose de très important en intelligence artificielle et ici vous avez une compétition un petit peu plus faible en terme de tarif, elle est organisée directement par Kaggle, j'ai l'impression, vous demande d'analyser à partir de quelques milliers de tweets lesquels sont positifs et lesquels sont négatifs et vous voyez qu'il y a plus de 2000 équipes qui ont travaillé dessus. Google par exemple demandait si on pouvait avoir une reconnaissance immédiate des lieux à partir des photos et proposer une mise à prix à 25 000 €. Un site d'adoption d'animaux proposait pour leur refuge l'analyse de photos pour savoir lesquels allaient avoir le plus de succès et allaient accélérer l'adoption des animaux. Voilà quelque chose d'assez utile, je prends une photo, je vois tout de suite si elle est avec beaucoup d'impact ou avec peu d'impact et je peux en faire une autre pour que nos petits compagnons soient rapidement adoptés. Pour chacune des compétitions, vous trouverez d'abord les données qui sont mises à disposition pour que les gens puissent travailler. Le code qui a été proposé, ici en voilà une petite collection, vous pouvez avoir des discussions à propos du code et bien sûr le classement des meilleures équipes.

[4:26]Bien sûr, qui dit code, dit cours de manière à apprendre à coder. Ici lorsque vous allez dans les cours, vous trouverez des choses très intéressantes, très bien faites pour apprendre les différents langages, on peut même retrouver des choses assez classiques comme le SQL et le python et des choses plus liées au machine learning, comment faire apprendre la machine à détecter des choses, des sentiments, des images ou à calculer des chiffres.

[4:54]Vous aurez compris que si vous êtes un petit peu geek, il sera quand même très intéressant de pouvoir parler un petit peu de l'innovation en terme de data lorsque vous allez à un grand oral ou un entretien de recrutement. Sur quasiment chacune des questions des entreprises, il y a cette dimension d'innovation et savoir quelles compétitions existent ou quelles questions sont posées par les grandes entreprises du secteur va vous permettre d'avoir des choses très intéressantes à dire. Commencez donc par aller fouiller un petit peu les différentes compétitions qui existent, vous allez voir en quoi les intelligences artificielles peuvent aider votre secteur d'activité. La deuxième chose importante, c'est de commencer à connaître un petit peu le vocabulaire du machine learning car quel que soit le job que vous aurez, vous devrez à un moment travailler avec des équipes techniques et bien sûr, dès l'entretien d'embauche, bah c'est plus facile si on confie un job à quelqu'un qui connaît quelques mots et dont on pourra se dire cette personne n'aura pas de problème à discuter avec nos techniciens.

[5:58]Bien sûr, les équipes qui participent aux compétitions sont des geeks, des gens qui sont très à l'aise avec le machine learning, mais il n'est pas exclu qu'ils aient besoin parfois de personnes pour les aider à mettre en page, à créer des images, à faire un petit peu la mise en forme des résultats de leur compétition et j'avoue qu'il y a possibilité pour n'importe qui de venir donner un petit coup de main.

[6:23]Et évidemment, vous comprenez bien que lors d'un entretien de recrutement, avoir dit qu'on a participé, qu'on a aidé les équipes, ça va être un énorme argument pour vous faire embaucher dans une grande entreprise. Et bien sûr, si vous êtes en RH, vous voyez tout de suite l'intérêt de pouvoir suivre les personnes qui participent aux compétitions, de pouvoir éventuellement engager un dialogue avec elles et eux et ensuite pouvoir essayer éventuellement de les recruter.

[6:53]Toutes ces compétitions sont réalisées dans un nouveau type de document qui n'est pas un tableur, pas un traitement de texte, ni un diaporama, c'est ce qu'on appelle un notebook. Et je vous montrerai dans une prochaine vidéo comment fonctionnent les notebook et à quoi ils servent. Et bien voilà, j'espère que cette découverte de Kaggle vous a plu, bonne continuation, à bientôt, au revoir.

Need another transcript?

Paste any YouTube URL to get a clean transcript in seconds.

Get a Transcript