« Taporware » : différence entre les versions

De EduTech Wiki
Aller à la navigation Aller à la recherche
Aucun résumé des modifications
Aucun résumé des modifications
Ligne 21 : Ligne 21 :
| Distribution || Distribution || Distribution
| Distribution || Distribution || Distribution
|-
|-
| Extract text || Extract text || X
| Extract text || Extract text ||
|-
|-
| Fixed phrase || Fixed phrase || Fixed phrase
| Fixed phrase || Fixed phrase || Fixed phrase
|-
|-
| X || Hypergraph || X
|   || Hypergraph ||
|-
|-
| Link Extractor || X || X
| Link Extractor ||   ||
|-
|-
| List HTML tags || X || X
| List HTML tags ||   ||
|-
|-
| List Words || List Words || List Words
| List Words || List Words || List Words
|-
|-
| X || List XML elements || X
|   || List XML elements ||
|-
|-
| X || X || Speech Tagger
|   ||   || Speech Tagger
|-
|-
| Summarizer || Summarizer || Summarizer
| Summarizer || Summarizer || Summarizer
Ligne 41 : Ligne 41 :
| Tokenize || Tokenize || Tokenize
| Tokenize || Tokenize || Tokenize
|-
|-
| X || Transformer || X
|   || Transformer ||
|}
|}

Version du 11 novembre 2014 à 16:55

Introduction

Taporwareest un outil d'analyse de texte qui permet aux utilisateurs d'exécuter des analyses de textes sur des documents HTML, XML et du texte brut. Taporware a été développé par Geoffrey Rockwell, Lian Yan, Andrew Macdonald et Matt Patey, à l'université McMaster. Cet outil d'analyse dispose de plusieurs fonctionnalités classées en 5 catégories: outils HTML, outils XML, outils texte brut, autres outils et outils en bêta.

Fonctionnalités

Certaines fonctionnalités pour les catégories des outils HTML, outils XML et outils texte brut sont communes. Celles-ci seront donc expliquées ensemble.

Outil HTML Outil XML Outil texte brut
Co-occurrence Co-occurrence Co-occurrence
Collocation Collocation Collocation
Comparator Comparator Comparator
Concordance Concordance Concordance
Date finder Date finder Date finder
Distribution Distribution Distribution
Extract text Extract text
Fixed phrase Fixed phrase Fixed phrase
Hypergraph
Link Extractor
List HTML tags
List Words List Words List Words
List XML elements
Speech Tagger
Summarizer Summarizer Summarizer
Tokenize Tokenize Tokenize
Transformer