Analyse de données avec SPSS
Résumé :
Cet ouvrage
est disponible en version PDF uniquement. Progressif et pédagogique, il
s'articule autour des étapes clés d'une analyse de données : la définition
de la problématique, la description des données, la validation des instruments
de mesure. La suite du livre met l'accent sur le choix d'une méthode d'analyse,
qu'elle soit descriptive (tris croisés, analyse factorielle) ou plus technique
(ANOVA, régression, analyse conjointe).
Le dernier chapitre traite de la rédaction du rapport, élément essentiel de la
communication des résultats. Le livre inclut de nombreux exemples illustratifs
et applications. La plupart de ces dernières font appel à SPSS afin que le
lecteur se familiarise avec ce logiciel. Le lecteur pourra ainsi appliquer ses
connaissances théoriques et mettre en pratique une démarche d'analyse. Ce livre
s'adresse aux étudiants de premier et de second cycle (IUT, BTS, universités et
écoles de commerce).
Rappel méthodologique sur la réalisation d'une analyse de données et outil
concret d'utilisation de SPSS, il sera également utile aux chargés d'études en
activité.
À propos
des auteurs :
Manu Carricano
est professeur à l'EADA Business School, à Barcelone, où il enseigne le Pricing
et les méthodes d'analyse de données en master, MBA et Executive Education. Il
est également consultant au sein du cabinet Pricing Solutions et intervient
régulièrement auprès des grandes entreprises en Europe. Fanny Poujol est maître
de conférences à l'ISEM - Université Montpellier 1 et chercheur associé au
Laboratoire de recherche Inseec.
Elle enseigne le marketing et la méthodologie en licence et master. Ses travaux
ont été présentés dans des congrès internationaux et publiés dans des revues
académiques. Roland Gillet est professeur de finance à l'Université Paris 1
Panthéon-Sorbonne, directeur du Master Pro «Gestion financière et fiscalité»,
et membre du laboratoire de recherche (PRISM) et du Labex «Régulation
financière». Il est également professeur visiteur à l'Université Libre de
Bruxelles (Solvay).
SPSS (Statistical Package for the Social Sciences) est un logiciel utilisé pour l'analyse statistique. C'est aussi le nom de la société qui le revend (SPSS
Inc). En 2009, la compagnie décide de changer le nom de ses produits en PASW, pour Predictive Analytics Software et est rachetée par IBM pour 1,24 milliard de dollars
. La première version de SPSS a
été mise en vente en 1968 et fait partie des programmes utilisés pour l'analyse
statistique en sciences sociales. Il est utilisé par des chercheurs en
économie, en science de la santé, par des compagnies d'études, par le
gouvernement, des chercheurs de l'éducation nationale, etc. En plus de
l'analyse statistique, la gestion des données (sélection de cas, reformatage de
fichier, création de données dérivées) et la documentation des données (un
dictionnaire de métadonnées est sauvegardé avec les données) sont deux autres
caractéristiques du logiciel.
Les fonctionnalités de SPSS sont accessibles via les menus
déroulants ou peuvent être programmées avec un langage en ligne de commande
appelé 4GL (licence propriétaire). La programmation par lignes de
commande permet la reproductibilité et de la manipulation et de l'analyse de
données complexes. L'interface des menus déroulants génère également une
syntaxe de commandes, bien que, par défaut, elle soit invisible à
l'utilisateur. Les programmes peuvent être lancés de manière interactive ou de
façon non surveillée en utilisant le Production Job
Facility fourni. Un langage de macro peut être utilisé pour
écrire des routines et une extension pour le langage python permet
d'accéder aux informations dans les données ou dans le dictionnaire des données
et de construire des programmes en syntaxe de ligne de commande de façon
dynamique. Cette extension de programmation Python, introduite dans la version
14, a remplacé les scripts SAX Basic moins fonctionnels pour la
plupart des besoins, bien que SaxBasic reste disponible. Depuis la version 14,
SPSS peut être piloté extérieurement en utilisant un programme en Python ou
en VB.NET en utilisant les "plug-ins" fournis.
SPSS impose des contraintes concernant la structure interne des
fichiers, les types des données, le traitement des données et les fichiers de
correspondance. Les séries de données de SPSS ont une structure en tableau à
deux dimensions où les rangées représentent typiquement les cas (tels des
individus ou des foyers) et où les colonnes représentent les mesures (telles
que âge, sexe, ou revenu du foyer). Il n'y a que deux types définis de
données : nombres ou chaines de caractères. Tous les traitements de
données se déroulent de façon séquentielle les cas à la suite les uns des
autres dans l'ordre du fichier. Les fichiers peuvent être comparés un à un, un
envers les autres, mais pas plusieurs d'un coup envers les autres.
Différentes versions de SPSS existent pour Windows, Mac
OS X et Unix. La version pour Windows est mise à jour plus
fréquemment et possède plus de caractéristiques que les versions pour les
autres systèmes d'exploitation.
SPSS peut lire et écrire des données à partir et dans des fichiers
texte en caractères ASCII (incluant les fichiers hiérarchiques),
d'autres paquetages statistiques, des feuilles de calcul et des bases
de données (des tables de base de données relationnelles
externes via ODBC et SQL).
[Wikipedia]
Télécharger gratuitement ce livre :