Technopedia Center
PMB University Brochure
Faculty of Engineering and Computer Science
S1 Informatics S1 Information Systems S1 Information Technology S1 Computer Engineering S1 Electrical Engineering S1 Civil Engineering

faculty of Economics and Business
S1 Management S1 Accountancy

Faculty of Letters and Educational Sciences
S1 English literature S1 English language education S1 Mathematics education S1 Sports Education
  • Registerasi
  • Brosur UTI
  • Kip Scholarship Information
  • Performance
  1. Weltenzyklopädie
  2. Algorithme t-SNE — Wikipédia
Algorithme t-SNE — Wikipédia 👆 Click Here! Read More..
Un article de Wikipédia, l'encyclopédie libre.
Exemple de visualisation t-SNE.

L'algorithme t-SNE (t-distributed stochastic neighbor embedding) est une technique de réduction de dimension pour la visualisation de données développée par Geoffrey Hinton et Laurens van der Maaten et publiée en 2008[1]. 

Il s'agit d'une méthode non linéaire permettant de représenter un ensemble de points d'un espace à grande dimension dans un espace de deux ou trois dimensions. Les données peuvent ensuite être visualisées sous la forme d'un nuage de points. L'algorithme t-SNE tente de trouver une configuration optimale selon un critère de théorie de l'information afin de conserver la proximité entre les points pendant la transformation : deux points qui sont proches (resp. éloignés) dans l'espace d'origine doivent être proches (resp. éloignés) dans l'espace de faible dimension.

Description

[modifier | modifier le code]

L'algorithme t-SNE se base sur une interprétation probabiliste des proximités. Une distribution de probabilité est définie sur les paires de points de l'espace d'origine de telle sorte que des points proches l'un de l'autre ont une forte probabilité d'être choisis tandis que des points éloignés ont une faible probabilité d'être sélectionnés. Une distribution de probabilité est également définie de la même manière pour l'espace de visualisation. L'algorithme t-SNE consiste à faire concorder les deux densités de probabilité, en minimisant la divergence de Kullback-Leibler entre les deux distributions par rapport à l'emplacement des points sur la carte.

L’algorithme t-SNE est principalement utilisé pour la visualisation de données en haute dimension, et est utilisé notamment dans des tâches lourdes de clustering. Il projette les données dans un espace de faible dimension en préservant les relations de voisinage locales, ce qui permet d’observer des regroupements apparents. Contrairement à des méthodes comme l’Analyse en Composantes Principales (PCA), qui conservent la structure globale des données, t-SNE met l’accent sur la préservation des proximités locales. Plusieurs études montrent que t-SNE facilite la séparation et l’identification de sous-groupes dans des ensembles de données complexes, offrant ainsi un outil précieux pour l’exploration et l’analyse de clusters[2],[3].

L'algorithme t-SNE a été utilisée pour de nombreuses applications : analyse musicale[4],[5], recherche sur le cancer[6], bioinformatique[7], le traitement de signaux biomédicaux[8], l'interprétation géologique[9]. Cette méthode est souvent utilisée pour la visualisation de représentations de haut-niveau apprises par un réseau de neurones artificiel[10].

Références

[modifier | modifier le code]
  1. ↑ L.J.P. van der Maaten et Hinton, G.E., « Visualizing High-Dimensional Data Using t-SNE », Journal of Machine Learning Research, vol. 9,‎ novembre 2008, p. 2579–2605 (lire en ligne)
  2. ↑ (en) Yasir Hamid et M. Sugumaran, « A t-SNE based non linear dimension reduction for network intrusion detection », International Journal of Information Technology, vol. 12, no 1,‎ mars 2020, p. 125–134 (ISSN 2511-2104 et 2511-2112, DOI 10.1007/s41870-019-00323-9, lire en ligne, consulté le 10 juillet 2025)
  3. ↑ George C. Linderman et Stefan Steinerberger, « Clustering with t-SNE, Provably », SIAM Journal on Mathematics of Data Science, vol. 1, no 2,‎ janvier 2019, p. 313–332 (PMCID 7561036, DOI 10.1137/18M1216134, lire en ligne, consulté le 10 juillet 2025)
  4. ↑ (en) P. Hamel et Eck, D., « Learning Features from Music Audio with Deep Belief Networks », Proceedings of the International Society for Music Information Retrieval Conference,‎ 2010, p. 339–344
  5. ↑ Matteo Lionello, Hendrik Purwins, Luca Pietrogrande et Mohamed Abou-Zleikha, « Interactive Exploration Of Musical Space With Parametric T-Sne », DOI.org (Datacite),‎ 4 juillet 2018 (ISSN 2518-3672, DOI 10.5281/ZENODO.1422557, lire en ligne, consulté le 10 juillet 2025)
  6. ↑ (en) A.R. Jamieson, Giger, M.L., Drukker, K., Lui, H., Yuan, Y. et Bhooshan, N., « Exploring Nonlinear Feature Space Dimension Reduction and Data Representation in Breast CADx with Laplacian Eigenmaps and t-SNE », Medical Physics, vol. 37, no 1,‎ 2010, p. 339–351 (DOI 10.1118/1.3267037)
  7. ↑ (en) I. Wallach et Liliean, R., « The Protein-Small-Molecule Database, A Non-Redundant Structural Resource for the Analysis of Protein-Ligand Binding », Bioinformatics, vol. 25, no 5,‎ 2009, p. 615–620 (PMID 19153135, DOI 10.1093/bioinformatics/btp035)
  8. ↑ (en) J. Birjandtalab, M. B. Pouyan et M. Nourani, « Nonlinear dimension reduction for EEG-based epileptic seizure detection », 2016 IEEE-EMBS International Conference on Biomedical and Health Informatics (BHI),‎ 1er février 2016, p. 595–598 (DOI 10.1109/BHI.2016.7455968, lire en ligne)
  9. ↑ Mehala Balamurali, Katherine L. Silversides et Arman Melkumyan, « A comparison of t-SNE, SOM and SPADE for identifying material type domains in geological data », Computers & Geosciences, vol. 125,‎ 1er avril 2019, p. 78–89 (ISSN 0098-3004, DOI 10.1016/j.cageo.2019.01.011, lire en ligne, consulté le 10 juillet 2025)
  10. ↑ Visualizing Representations: Deep Learning and Human Beings Christopher Olah's blog, 2015
  • icône décorative Portail des probabilités et de la statistique
Ce document provient de « https://fr.teknopedia.teknokrat.ac.id/w/index.php?title=Algorithme_t-SNE&oldid=227185455 ».
Catégories :
  • Analyse des données
  • Exploration de données
Catégories cachées :
  • Portail:Probabilités et statistiques/Articles liés
  • Portail:Mathématiques/Articles liés
  • Portail:Sciences/Articles liés

  • indonesia
  • Polski
  • الرية
  • Deutsch
  • English
  • Español
  • Français
  • Italiano
  • مصر
  • Nederlands
  • 本語
  • Português
  • Sinugboanong Binisaya
  • Svenska
  • Українска
  • Tiếng Việt
  • Winaray
  • 中文
  • Русски
Sunting pranala
Pusat Layanan

UNIVERSITAS TEKNOKRAT INDONESIA | ASEAN's Best Private University
Jl. ZA. Pagar Alam No.9 -11, Labuhan Ratu, Kec. Kedaton, Kota Bandar Lampung, Lampung 35132
Phone: (0721) 702022
Email: pmb@teknokrat.ac.id