Technopedia Center
PMB University Brochure
Faculty of Engineering and Computer Science
S1 Informatics S1 Information Systems S1 Information Technology S1 Computer Engineering S1 Electrical Engineering S1 Civil Engineering

faculty of Economics and Business
S1 Management S1 Accountancy

Faculty of Letters and Educational Sciences
S1 English literature S1 English language education S1 Mathematics education S1 Sports Education
  • Registerasi
  • Brosur UTI
  • Kip Scholarship Information
  • Performance
  1. Weltenzyklopädie
  2. Cross Industry Standard Process for Data Mining
Cross Industry Standard Process for Data Mining 👆 Click Here! Read More..
Un article de Wikipédia, l'encyclopédie libre.

Cet article est une ébauche concernant les probabilités et la statistique.

Vous pouvez partager vos connaissances en l’améliorant (comment ?) selon les recommandations des projets correspondants.

Cross Industry Standard Process for Data Mining (CRISP-DM)[1] est un modèle de processus d'exploration de données qui décrit une approche pour traiter des problématiques liées à l’analyse, à l’extraction et aux sciences des données.

Des sondages effectués en 2002[2], 2004[3], 2007[4], 2014[5] et 2020[6] montrent qu'il s'agit de la méthode principale utilisée pour les projets d'analyse, d'extraction et de science des données. Cette méthode a été créée par un consortium formé des compagnies NCR, SPSS et Daimler-Benz. Le processus définit une hiérarchie consistant de phases majeures, de taches générales, de taches spécialisées et d'instances de processus[7].

Phases principales

[modifier | modifier le code]
Diagramme de processus montrant la relation entre les différentes phases de CRISP-DM.

CRISP-DM découpe le processus de data mining en six phases principales[8] :

  • connaissance du métier
  • connaissance des données
  • préparation des données
  • modélisation des données
  • évaluation
  • déploiement

Histoire

[modifier | modifier le code]

La méthode CRISP-DM est conçue en 1996. En 1997, elle se développe en tant que projet de l'Union européenne financé par le programme ESPRIT. Le projet est conduit par quatre compagnies : ISL, NCR Corporation, Daimler-Benz et OHRA. Ce cœur du consortium apporte différentes expériences au projet : ISL, plus tard acquis et intégré dans SPSS Inc. produit ses progiciels d'analyse prédictive du même nom, intégré de nos jours au groupe IBM. Le géant informatique NCR Corporation créa la division Teradata spécialisée dans les entrepôts de données et son propre progiciel de data mining. Daimler-Benz avait une importante équipe de data miners. OHRA, une compagnie d'assurance, venait juste de commencer à explorer le potentiel d'utilisation du data mining.

La première version de la méthode fut publiée sous le numéro de version CRISP-DM 1.0[9] en 1999.

CRISP-DM 2.0

[modifier | modifier le code]

En juillet 2006, le consortium annonce qu'il va commencer à travailler sur une seconde version de CRISP-DM. Le 26 septembre 2006, le CRISP-DM SIG se réunit pour discuter des améliorations pour CRISP-DM 2.0 et de la feuille de route qui en découle[10]. Depuis le 22 juin 2011, le site web redirige vers une page du site d'IBM dédié à SPSS.

Avantages

[modifier | modifier le code]
  • Méthode neutre par rapport aux métiers
  • Méthode neutre par rapport aux outils
  • Méthode liée étroitement à KDD Process Model[11]
  • Point d'ancrage du processus de data mining

Notes

[modifier | modifier le code]
  • (en) Cet article est partiellement ou en totalité issu de l’article de Wikipédia en anglais intitulé « Cross Industry Standard Process for Data Mining » (voir la liste des auteurs).

Liens externes

[modifier | modifier le code]
  • « CRoss Industry Standard Process for Data Mining »(Archive.org • Wikiwix • Archive.is • Google • Que faire ?) (consulté le 9 avril 2013)
  • CRoss Industry Standard Process for Data Mining Blog
  • Le site des dataminers Article publié par Pascal BIZZARI, Mai 2009
  • The Data Mining Group (DMG): The DMG is an independent, vendor led group which develops data mining standards, such as the Predictive Model Markup Language (PMML)

Références

[modifier | modifier le code]
  1. ↑ (en) C. Shearer, « The CRISP-DM model: the new blueprint for data mining »(Archive.org • Wikiwix • Archive.is • Google • Que faire ?) [PDF] (consulté le 9 avril 2013). J Data Warehousing 2000;5:13—22.
  2. ↑ Gregory Piatetsky-Shapiro (2002) KDnuggets Methodology Poll
  3. ↑ Gregory Piatetsky-Shapiro (2004) KDnuggets Methodology Poll
  4. ↑ Gregory Piatetsky-Shapiro (2007) KDnuggets Methodology Poll
  5. ↑ (en-US) « CRISP-DM, still the top methodology for analytics, data mining, or data science projects », sur KDnuggets (consulté le 21 avril 2021)
  6. ↑ (en-US) Jeff Saltz, « CRISP-DM is Still the Most Popular Framework for Executing Data Science Projects », sur Data Science Project Management, 30 novembre 2020 (consulté le 21 avril 2021)
  7. ↑ Robert Nisbet, John Elder, Gary Miner Handbook of Statistical Analysis & Data Mining Applications (Academic Press) page 35
  8. ↑ (en) Gavin Harper, « Methods for mining HTS data », Drug Discov. Today, vol. 11, nos 15-16,‎ août 2006, p. 694–699 (PMID 16846796, DOI 10.1016/j.drudis.2006.06.006, lire en ligne).
  9. ↑ « CRISP-DM 1.0 »(Archive.org • Wikiwix • Archive.is • Google • Que faire ?) (consulté le 9 avril 2013).
  10. ↑ « CRISP-DM SIG »(Archive.org • Wikiwix • Archive.is • Google • Que faire ?) (consulté le 9 avril 2013).
  11. ↑ « KDD Process Model »(Archive.org • Wikiwix • Archive.is • Google • Que faire ?) (consulté le 9 avril 2013)
  • icône décorative Portail de l’informatique
  • icône décorative Portail des probabilités et de la statistique
Ce document provient de « https://fr.wikipedia.org/w/index.php?title=Cross_Industry_Standard_Process_for_Data_Mining&oldid=227091403 ».
Catégories :
  • Ingénierie décisionnelle
  • Exploration de données
Catégories cachées :
  • Article contenant un lien mort
  • Recension temporaire pour le modèle Article
  • Wikipédia:ébauche probabilités et statistiques
  • Portail:Informatique/Articles liés
  • Portail:Technologies/Articles liés
  • Portail:Probabilités et statistiques/Articles liés
  • Portail:Mathématiques/Articles liés
  • Portail:Sciences/Articles liés

  • indonesia
  • Polski
  • الرية
  • Deutsch
  • English
  • Español
  • Français
  • Italiano
  • مصر
  • Nederlands
  • 本語
  • Português
  • Sinugboanong Binisaya
  • Svenska
  • Українска
  • Tiếng Việt
  • Winaray
  • 中文
  • Русски
Sunting pranala
Pusat Layanan

UNIVERSITAS TEKNOKRAT INDONESIA | ASEAN's Best Private University
Jl. ZA. Pagar Alam No.9 -11, Labuhan Ratu, Kec. Kedaton, Kota Bandar Lampung, Lampung 35132
Phone: (0721) 702022
Email: pmb@teknokrat.ac.id