Aperçu d’Orange Data Mining

Orange Data Mining est une suite open source d’analyse de données et de visualisation qui permet de construire des flux de travail à l’aide de widgets. Elle est particulièrement intéressante pour l’analyse textuelle lorsque l’on souhaite travailler sans écrire beaucoup de code.

Pourquoi utiliser Orange ?

  • son interface graphique est intuitive et accessible ;
  • l’extension Text permet d’explorer des corpus textuels sans programmation avancée ;
  • l’environnement offre de nombreuses visualisations utiles pour l’exploration ;
  • les flux de travail peuvent être enregistrés, réutilisés et adaptés.

Pour l’analyse textuelle

Avec l’add-on Text, Orange permet notamment :

  • le chargement de corpus ;
  • le prétraitement du texte ;
  • la représentation en sac de mots ;
  • l’analyse de sentiment ;
  • la modélisation de sujets ;
  • plusieurs visualisations pour comparer et interpréter les résultats.

Bien commencer

Après l’installation d’Orange, ajoutez l’extension Text via Options > Add-ons, puis redémarrez l’application. Vous pourrez ensuite explorer les widgets de prétraitement, de modélisation et de visualisation dans un même environnement.

Ressources utiles