Technopedia Center
PMB University Brochure
Faculty of Engineering and Computer Science
S1 Informatics S1 Information Systems S1 Information Technology S1 Computer Engineering S1 Electrical Engineering S1 Civil Engineering

faculty of Economics and Business
S1 Management S1 Accountancy

Faculty of Letters and Educational Sciences
S1 English literature S1 English language education S1 Mathematics education S1 Sports Education
  • Registerasi
  • Brosur UTI
  • Kip Scholarship Information
  • Performance
  1. Weltenzyklopädie
  2. Hugging Face — Wikipédia
Hugging Face — Wikipédia 👆 Click Here! Read More..
Un article de Wikipédia, l'encyclopédie libre.
Hugging Face
Histoire
Fondation
2016Voir et modifier les données sur Wikidata
Cadre
Type
Firme, communauté virtuelleVoir et modifier les données sur Wikidata
Domaine d'activité
Apprentissage automatiqueVoir et modifier les données sur Wikidata
Siège
BrooklynVoir et modifier les données sur Wikidata
Pays
 États-UnisVoir et modifier les données sur Wikidata
Organisation
Effectif
170 employés (septembre 2023)Voir et modifier les données sur Wikidata
Organisme affilié
Hugging Face SAS (d)Voir et modifier les données sur Wikidata
Chiffre d'affaires
15 M$ (2022)Voir et modifier les données sur Wikidata
Produit
Hugging Face Hub (d)Voir et modifier les données sur Wikidata
Site web
(en) huggingface.coVoir et modifier les données sur Wikidata
Identifiants
OpenCorporates
us_de/6092321Voir et modifier les données sur Wikidata

modifier - modifier le code - modifier WikidataDocumentation du modèle

Hugging Face est une entreprise (licorne) américaine du domaine de l'Intelligence artificielle créée en 2016 en France et qui développe des outils pour utiliser l'apprentissage automatique. Elle propose notamment une bibliothèque, open source, de transformeurs conçue pour les applications de traitement automatique des langues, et une plate-forme permettant le partage des modèles et des ensembles de données nécessaires à l'apprentissage automatique, permettant notamment l'entraînement de nouveaux modèles, y compris de grands modèles. Hugging Face, en 2023, emploie 80 salariés en France[1]. En 2024, la plateforme collaborative Hub de l'entreprise stocke 1,3 million de modèles d'intelligence artificielle, 450 000 jeux de données, 680 000 espaces, avec environ 1 milliard de requêtes par jour.

Histoire

[modifier | modifier le code]

La société a été fondée en 2016 par les entrepreneurs français Clément Delangue, Julien Chaumond et Thomas Wolf[2], initialement pour développer une application de chatbot destinée aux adolescents[3]. Après avoir ouvert le modèle de cette application, l'entreprise développe une plate-forme d'apprentissage automatique. En 2017, Hugging Face déménage aux États-Unis pour espérer lever des fonds[2].

Le 3 août 2022, la société annonce mettre à disposition une version entreprise de son Hugging Face Hub public qui prend en charge le déploiement SaaS ou sur site[4].

En février 2023, la société présente un partenariat avec Amazon Web Services (AWS) qui rend ses produits disponibles aux clients AWS. La société indique également que la prochaine génération de BLOOM sera exécutée sur Trainium, une puce d'apprentissage automatique créée par Amazon[5],[6].

En 2024, l'entreprise a acheté XetHub pour améliorer ses capacités de stockage et de gestion des données, afin de répondre aux besoins croissants d'intelligence artificielle de plus en plus complexes[7]. XetHub est une start-up américaine, créée en 2021 à Seattle par des anciens de l'équipe de machine learning d'Apple, spécialisée dans la gestion de fichiers de projets d'intelligence artificielle, dont fichiers fragmentés et de déduplication (permettant d'importants gains de place et de vitesse), et qui a dopé le logiciel Git pour gérer des référentiels géants de données[7]. Hugging Face pourrait ainsi remplacer Git LFS par une version optimisée de son propre système de stockage et de gestion de versions, intégrant les avancées technologiques de XetHub : la bande passante serait ainsi réduite, de même que le temps de téléchargement et de mise à jour de très gros fichiers (ex. : « dans un scénario où un fichier Parquet de 10 Go nécessite une mise à jour d'une seule ligne, les utilisateurs ne devront plus télécharger l'intégralité du fichier, mais seulement les fragments modifiés »[7].

Financement

[modifier | modifier le code]

En mars 2021, Hugging Face lève 40 millions de dollars lors d'un financement de série B.[8] Le 5 mai 2022, la société annonce un financement de série C [9] qui la valorise à deux milliards de dollars[10]. En août 2023, elle lève 235 millions de dollars auprès de plusieurs grandes multinationales américaines, incluant Google, Amazon et Nvidia, ce qui amène sa valorisation à 4,5 milliards de dollars[11].

La start-up a réalisé un chiffre d'affaires de 15 millions de dollars en 2022, et prévoit de dépasser 100 millions en 2024 en profitant de l'essor du secteur[10].

Produits

[modifier | modifier le code]

Hugging Face Hub

[modifier | modifier le code]

La plateforme Hugging Face Hub permet aux utilisateurs d'y héberger[12] :

  • des dépôts utilisant Git, avec des fonctionnalités similaires à GitHub, y compris des discussions et des propositions de modifications (pull-requests) des projets.
  • des modèles, également enregistrés dans Git. 500 000 modèles mis en ligne par les utilisateurs y sont hébergés[13].
  • des ensembles de données, principalement sous forme de texte, d'images et d'audio ;
  • des applications web (« spaces » et « widgets »), permettant d'héberger des preuves de concept.

La société se veut ouverte et agnostique, à contre-courant des modèles économiques des GAFAM ou d'OpenAI. Le grand public peut accéder à ses services gratuitement, mais Hugging Face fait payer les entreprises lorsqu'elles ont besoin d'importante puissance de calcul[2],[1]. La société s'est dotée d'une équipe consacrée aux questions d'éthique et de droit qui résultent du déploiement des systèmes d'intelligence artificielle[14].

En février 2024, une étude de JFrog[15] affirme que la plateforme héberge au moins une centaine de modèles de machine learning malveillants. En effet ceux-ci abriteraient des portes dérobées qui permettraient ensuite de prendre le contrôle à distance des appareils concernés[16].

Bibliothèque de transformateurs

[modifier | modifier le code]

La bibliothèque Transformers est un package Python qui contient des implémentations open source de modèles de transformateurs pour les tâches de texte, d'image et audio. Il est compatible avec les bibliothèques d'apprentissage profond PyTorch, TensorFlow et JAX et inclut des implémentations de modèles notables tels que BERT et GPT-2[source secondaire souhaitée].

BLOOM

[modifier | modifier le code]

La société lance en 2021 le BigScience Research Workshop en collaboration avec plusieurs autres groupes de recherche pour publier un grand modèle de langage ouvert[17]. 1 000 chercheurs européens ont participé[10], notamment du CNRS, du GENCI et du ministère de l'Enseignement supérieur et de la Recherche[18].

La collaboration donne naissance l'année suivante à BLOOM (BigScience Large Open-science Open-access Multilingual Language Model), un grand modèle de langage multilingue (comprenant 46 langues et 13 langages de programmation) disposant de 176 milliards de paramètres[19]. Les chercheurs ont privilégié l’entraînement sur un corpus de 1,4 téraoctet de texte composé de données fiables dans chaque langue. L'apprentissage a été effectué avec 8 pétaflops du supercalculateur Jean Zay de l'Institut du développement et des ressources en informatique scientifique. Durant 11 semaines, des centaines de processeurs graphiques ont fonctionné en parallèle, totalisant 5 millions d’heures de calcul. Le modèle a la particularité d'être mis à disposition publiquement (open-source), mais la licence interdit certaines utilisations comme l'écriture de fake news ou de conseils de santé. L'entreprise travaille à réduire les ressources nécessaires par l'utilisation du modèle pour le rendre plus accessible[20].

Critiques, problèmes

[modifier | modifier le code]

Sécurité des jetons d'API

[modifier | modifier le code]

Des chercheurs en sécurité ont découvert plus de 1 500 jetons d'API exposés sur la plateforme Hugging Face, appartenant à des géants de la technologie comme Meta, Microsoft, Google et VMware, ce qui a mis en danger de nombreuses organisations (cf. risques de vol de données, mais aussi d'empoisonnement de modèles d'intelligence artificielle)[21].

Modèles d'intelligence artificielle malveillants

[modifier | modifier le code]

La plateforme héberge ou a hébergé de nombreux modèles d'intelligence artificielle malveillants, malgré les mesures de sécurité mises en place pour empêcher leur diffusion[22].

Liens externes

[modifier | modifier le code]

  • (en) Site officielVoir et modifier les données sur Wikidata
  • Ressource relative aux organisationsVoir et modifier les données sur Wikidata :
    • Registre de transparence de l'UE

Références

[modifier | modifier le code]
  1. ↑ a et b « Intelligence artificielle : Hugging Face va doubler ses effectifs en France », sur Le Point, 24 août 2023 (consulté le 27 novembre 2023).
  2. ↑ a b et c « Comment trois Français exilés aux Etats-Unis sont devenus des incontournables de l'IA », sur BFMTV (consulté le 11 juillet 2023).
  3. ↑ (en-US) « Hugging Face wants to become your artificial BFF », TechCrunch, 9 mars 2017 (consulté le 20 août 2022)
  4. ↑ Par Victor Cousin et Maxime Poul Le 25 août 2023 à 11h08, « Intelligence artificielle : c’est quoi Hugging Face, la pépite française valorisée à 4,5 milliards d’euros ? », sur leparisien.fr, 25 août 2023 (consulté le 11 mars 2024)
  5. ↑ Dina Bass, « Amazon's Cloud Unit Partners With Startup Hugging Face as AI Deals Heat Up », Bloomberg News,‎ 21 février 2023 (lire en ligne)
  6. ↑ Stephen Nellis, « Amazon Web Services pairs with Hugging Face to target AI developers », Reuters,‎ 21 février 2023 (lire en ligne)
  7. ↑ a b et c « Hugging Face renforce son infrastructure IA avec l'acquisition de XetHub », ActuIA,‎ 13 août 2024 (lire en ligne, consulté le 19 août 2024).
  8. ↑ « Hugging Face raises $40 million for its natural language processing library », 11 mars 2021
  9. ↑ (en) Cai, « The $2 Billion Emoji: Hugging Face Wants To Be Launchpad For A Machine Learning Revolution », Forbes (consulté le 20 août 2022)
  10. ↑ a b et c Guillaume Grallet, « Intelligence artificielle : ces Français qui défient ChatGPT », sur Le Point, 23 février 2023 (consulté le 11 juillet 2023)
  11. ↑ « La start-up d'IA Hugging Face lève 235 millions de dollars auprès de Google, Amazon, Nvidia... », Usine-digitale.fr,‎ 25 août 2023 (lire en ligne, consulté le 27 novembre 2023)
  12. ↑ « Hugging Face Hub documentation », huggingface.co (consulté le 20 août 2022)
  13. ↑ Victor Cousin et Maxime Poul à 11h08, « Intelligence artificielle : c’est quoi Hugging Face, la pépite française valorisée à 4,5 milliards d’euros ? », sur leparisien.fr, 25 août 2023 (consulté le 11 janvier 2024)
  14. ↑ « Hugging Face: dans l’atelier français de l’intelligence artificielle », sur RFI, 28 mars 2023 (consulté le 11 juillet 2023)
  15. ↑ JFrog est une entreprise et une plateforme universelle de chaîne d’approvisionnement logicielle pour Devops, la sécurité et MLOps. On peut y assembler, distribuer et automatiser les mises à jour logicielles à la périphérie. JFrog aide à améliorer et sécuriser et à mettre en conformité les modèles d’IA, dont via le DevSecOps (développement, sécurité et opérations ; méthode visant à sécuriser les logiciels, dès le début de leur conception et tout au long de leur développement
  16. ↑ Chloé Claessens, « Au moins une centaine de modèles d'IA malveillants seraient hébergés par la plateforme Hugging Face » Accès libre, Clubic, 2 mars 2024 (consulté le 3 mars 2024)
  17. ↑ « Inside BigScience, the quest to build a powerful open language model », 10 janvier 2022
  18. ↑ « Bloom : l'intelligence artificielle qui gère 46 langues », sur Génération NT, 17 juillet 2022 (consulté le 12 juillet 2023)
  19. ↑ « BLOOM », bigscience.huggingface.co (consulté le 20 août 2022)
  20. ↑ « Un système d'analyse multilingue ultra-innovant entraîné dans l'Essonne », sur Les Echos, 20 juillet 2022 (consulté le 12 juillet 2023)
  21. ↑ « Les jetons de l'API Hugging Face exposés offrent un accès complet au lama 2 de Meta, selon Lasso Security », sur Developpez.com (consulté le 19 août 2024).
  22. ↑ Chloé Claessens, « Au moins une centaine de modèles d'IA malveillants seraient hébergés par la plateforme Hugging Face », sur clubic.com, 2 mars 2024 (consulté le 19 août 2024).
v · m
Intelligence artificielle générative
Modèles
  • Texte-image
  • Texte-vidéo
Texte
  • Character.ai
  • Claude
  • DeepSeek
  • Gemini
  • GPT-3
  • GPT-4
  • Grok
  • Le Chat
  • Microsoft Copilot
  • SearchGPT
  • LLaMA
Images
  • Adobe Firefly
  • DALL-E
  • Flux
  • Midjourney
  • Stable Diffusion
Vidéos
  • Adobe Firefly
  • Sora
  • Veo
  • HeyGen
Musiques
  • Suno AI
  • Udio
Prompt
  • Prompt art
  • Ingénierie de prompt
Entreprises
  • Aleph Alpha
  • Anthropic
  • DeepSeek
  • Google DeepMind
  • Hugging Face
  • Meta AI
  • Mistral AI
  • OpenAI
  • Perplexity AI
  • xAI
Critiques
  • Droits d'auteur
  • Perroquet stochastique
  • Slop
  • icône décorative Portail de l’intelligence artificielle
  • icône décorative Portail de l’informatique
  • icône décorative Portail d’Internet
Ce document provient de « https://fr.teknopedia.teknokrat.ac.id/w/index.php?title=Hugging_Face&oldid=231348941 ».
Catégories :
  • Apprentissage automatique
  • Entreprise Internet ayant son siège aux États-Unis
  • Entreprise fondée en 2016
  • Éditeur de logiciel libre
  • Éditeur de logiciel ayant son siège aux États-Unis
  • Entreprise d'intelligence artificielle
Catégories cachées :
  • Page utilisant P571
  • Page utilisant P31
  • Page utilisant P101
  • Page utilisant P159
  • Page utilisant P17
  • Page utilisant P1128
  • Page utilisant P355
  • Page utilisant P2139
  • Page utilisant des données de Wikidata à traduire de l'anglais
  • Page utilisant P1056
  • Page utilisant P856
  • Page utilisant P1320
  • Article à illustrer Organisation
  • Page géolocalisable sans coordonnées paramétrées
  • Article utilisant l'infobox Organisation2
  • Article utilisant une Infobox
  • Article à référence souhaitée
  • Page utilisant P2657
  • Page pointant vers des bases externes
  • Page pointant vers des bases relatives aux organisations
  • Article utilisant le modèle Dictionnaires inactif
  • Page utilisant le modèle Autorité inactif
  • Portail:Intelligence artificielle/Articles liés
  • Portail:Informatique/Articles liés
  • Portail:Technologies/Articles liés
  • Portail:Internet/Articles liés
  • Portail:Médias/Articles liés
  • Portail:Société/Articles liés

  • indonesia
  • Polski
  • الرية
  • Deutsch
  • English
  • Español
  • Français
  • Italiano
  • مصر
  • Nederlands
  • 本語
  • Português
  • Sinugboanong Binisaya
  • Svenska
  • Українска
  • Tiếng Việt
  • Winaray
  • 中文
  • Русски
Sunting pranala
Pusat Layanan

UNIVERSITAS TEKNOKRAT INDONESIA | ASEAN's Best Private University
Jl. ZA. Pagar Alam No.9 -11, Labuhan Ratu, Kec. Kedaton, Kota Bandar Lampung, Lampung 35132
Phone: (0721) 702022
Email: pmb@teknokrat.ac.id