« Text mining » : différence entre les versions

De EduTech Wiki
Aller à la navigation Aller à la recherche
mAucun résumé des modifications
mAucun résumé des modifications
Ligne 3 : Ligne 3 :
Voir aussi:
Voir aussi:
* [[Text mining avec R]]
* [[Text mining avec R]]
== Notions de base ==
; Term Document Matrix (TDM)
: Une matrice TDM reflète le nombre de mots que l'on trouve dans divers documents d'un corpus
<source lang="javascript">
        doc1 doc2 doc3
Alpha  2    1    2
Beta    1    0    3
Creux  0    1    0
</source>
; Document Term Matric (DTM)
: contient la même information, mais la matrice est définie dans l'autre sens
<source lang="javascript">
      Alpha Beta Creux
doc1  2    1    ....
doc2  1
doc3  2
</source>


== Liens en Anglais ==
== Liens en Anglais ==

Version du 14 octobre 2014 à 11:16

Cet article est une ébauche à compléter. Une ébauche est une entrée ayant un contenu (très) maigre et qui a donc besoin d'un auteur.

Voir aussi:

Notions de base

Term Document Matrix (TDM)
Une matrice TDM reflète le nombre de mots que l'on trouve dans divers documents d'un corpus
        doc1 doc2 doc3
Alpha   2    1    2
Beta    1    0    3
Creux   0    1    0
Document Term Matric (DTM)
contient la même information, mais la matrice est définie dans l'autre sens
      Alpha Beta Creux
doc1  2     1    ....
doc2  1
doc3  2


Liens en Anglais

(à bouger un jour ...)

General

(websites, blogs, etc.)

Machine learning

Topic modeling


Summarization of microblogs