1 <center>'''Documentation Iramuteq'''</center>
4 <center>version 0.1</center>
7 <center>Pierre Ratinaud</center>
10 == '''Table des matières''' ==
11 1 Présentation d'iramuteq3
21 2.1 Format des données en entrée3
23 2.2 Statistiques textuelles4
31 2.6 Classification par matrice des distances5
33 3 Analyses de tableaux de données5
35 3.1 Format des données en entrée5
45 3.5.1 Par matrice des distances5
47 3.5.2 Méthode ALCESTE5
55 5 Annexes5= Présentation d'iramuteq =
56 Iramuteq est un logiciel d'analyse de textes et de tableaux de données. Il s'appuie sur le logiciel de statistique R ([http://www.r-project.org/ http://www.r-project.org]), sur le langage python ([http://www.python.org/ http://www.python.org]) et sur la base de données lexicales Lexique ([http://www.lexique.org/ http://www.lexique.org]).
59 <center>ATTENTION</center>
62 Iramuteq est en cours de développement. Regardez les informations disponibles sur la page [http://repere.no-ip.org/logiciel/iramuteq http://repere.no-ip.org/logiciel/iramuteq] pour connaître la fiabilité des différentes analyses.
65 [http://www.r-project.org/ http://www.r-project.org]
69 [http://www.python.org/ http://www.python.org]
73 [http://www.lexique.org/ http://www.lexique.org]
76 = Analyses de textes =
77 == Format des données en entrée ==
78 Les fichiers d'entrée doivent être au format texte brut (.txt) et respecter les règles de formatage des corpus ALCESTE.
80 Dans ce formatage, l'unité de base est appelée « unité de contexte initiale » (uci). Une uci peu représenter un entretien, un article, un livre ou tout autre type de documents. Un corpus peut contenir une ou plusieurs uci (mais au minimum une).
83 [[Image:]] Les noms des fichiers ne doivent pas contenir d'espace ou de caractères spéciaux.
85 'Mon corpus.txt' ne fonctionnera pas alors que 'moncorpus.txt' ou 'mon_corpus.txt' ne posent pas de problèmes.
88 Les uci sont introduites par quatre étoiles (****) suivies d'une série de variables étoilées séparées par un espace. Il est possible de placer des variables étoilées à l'intérieur des corpus en les introduisant en début de ligne par un tiret et une étoile (-*). La ligne ne doit contenir que cette variable.
94 <nowiki>**** *var_1 *var_2</nowiki>
97 texte texte texte texte texte texte texte texte texte texte texte texte texte texte texte texte texte texte texte texte texte texte texte texte texte texte texte texte texte texte texte texte texte texte texte texte texte texte texte texte texte texte texte texte texte texte texte texte texte texte texte texte texte texte texte texte texte texte texte texte texte texte
100 texte texte texte texte texte texte texte texte texte texte texte texte texte texte texte texte texte texte texte texte texte texte texte texte texte texte texte texte texte texte texte texte texte texte texte texte texte texte texte texte texte texte texte texte texte texte texte texte texte texte texte texte texte texte texte texte texte texte texte texte texte texte
102 <nowiki>**** *var_2 *var_3</nowiki>
105 texte texte texte texte texte texte texte texte texte texte texte texte texte texte texte texte texte texte texte texte texte texte texte texte texte texte texte texte texte texte texte texte texte texte texte texte texte texte texte texte texte texte texte texte texte texte texte texte texte texte texte texte texte texte texte texte texte texte texte texte texte texte
108 texte texte texte texte texte texte texte texte texte texte texte texte texte texte texte texte texte texte texte texte texte texte texte texte texte texte texte texte texte texte texte texte texte texte texte texte texte texte texte texte texte texte texte texte texte texte texte texte texte texte texte texte texte texte texte texte texte texte texte texte texte texte
111 [[Image:]] Les variables étoilées et les thématiques introduites dans le corpus ne doivent pas contenir d'espaces ou de caractères spéciaux. Elles ne doivent contenir que des caractères parmi a-z, A-Z, 1-9 et des tirets bas (_).
113 <nowiki>*age 18 ans n'est pas un bon codage</nowiki>
115 <nowiki>*age_18 est un bon codage</nowiki>
117 <nowiki>*entretien_d'Emilie n'est pas un bon codage</nowiki>
119 <nowiki>*ent_emilie est un bon codage</nowiki>
122 == Statistiques textuelles ==
125 == Analyses ALCESTE ==
126 == Classification par matrice des distances ==
130 = Analyses de tableaux de données =
131 == Format des données en entrée ==
136 === Par matrice des distances ===
137 === Méthode ALCESTE ===