Medizinische Statistik Mit SAS Studio Unter SODA Complete DOCX Download
Medizinische Statistik Mit SAS Studio Unter SODA Complete DOCX Download
Visit the link below to download the full version of this book:
https://medidownload.com/product/medizinische-statistik-mit-sas-studio-unter-sod
a/
Vorwort
In der medizinischen Forschung ist SAS® ein wichtiges und weit verbreitetes Software-
system, das im universitären wie kommerziellen Umfeld, z. B. der Pharmaindustrie, als
Standardsoftware zum Einsatz kommt. Zentrale Elemente stellen dabei das Aufbereiten
und die statistische/biometrische Auswertung von Patienten- und Studiendaten dar.
Eine Anwendung von SAS ist eigentlich an den Erwerb einer Lizenz gebunden, die
jährlich erneuert werden muss. Der in dem vorliegenden Buch beschriebene Zugang
über SAS OnDemand for Academics (SODA) dagegen erlaubt einen kostenfreien, brow-
ser-basierten Zugang zu der SAS-Software. Lediglich eine Registrierung ist notwendig.
Während die ursprüngliche Arbeitsoberfläche von SAS fundierte Programmierkennt-
nisse voraussetzt, die sich die SAS-Anwender in Kursen, Fortbildungen oder auf-
wendigem Eigenstudium beibringen müssen, finden unter SAS Studio die Nutzerinnen
und Nutzer einen leichten Zugang zu einer Vielzahl von Auswertungsmöglichkeiten.
Unterstützt werden sie dabei von einer menügesteuerten Oberfläche, über die direkt
verschiedenste statistische Analysen (Tasks) angefordert werden können. Dabei wird
automatisch SAS-Code generiert, der dann ausgeführt werden kann. Gerade Nutzer,
die nur einmal eine Auswertung z. B. für eine medizinische Dissertation benötigen
bzw. nur selten kleine Standardauswertungen durchführen, profitieren von dieser
Möglichkeit. Die deutschsprachige Version von SAS Studio erleichtert den Einstieg
zusätzlich noch. Auch Benutzer, die an einem tieferen Einstieg in die Programmierung
mit SAS interessiert sind, finden über den automatisch generierten SAS-Code eine gute
Einstiegshilfe.
Das vorliegende Buch wurde so konzipiert, dass es sich zum Selbststudium vor allem
für Studierende der Medizin, im Gesundheitswesen, im Bereich Life Science oder
anderer verwandter Fachrichtungen bei der Erstellung ihrer Qualifikationsarbeiten
eignet, aber auch alle anderen Leserinnen und Leser bei der Auswertung von empiri-
schen Daten mit statistischen, biometrischen Methoden unterstützt. Darüber hinaus
werden auch viele praktische Tipps zu Datenhaltung und Datenaufbereitung der zu
analysierenden Daten gegeben. Dabei kommt zusätzlich zu SAS auch Microsoft Excel
als ein gebräuchliches Tabellenkalkulationsprogramm, das vielfach für die Eingabe
und Verarbeitung von Daten in Tabellenform genutzt wird, zum Einsatz. Im Buch wird
zuerst eine kurze Einführung in die Welt von SAS, SODA und SAS Studio (7 Kap. 1)
gegeben. In 7 Kap. 2 und 3 werden ausführlich gängige und häufig eingesetzte Arbeits-
schritte zur Datenverwaltung und zum Datenmanagement in SAS Studio und Excel
gezeigt. Es folgen in 7 Kap. 4 einige Grundlagen der Statistik sowie speziellere Aus-
wertungshinweise. Besonderen Wert wurde auf die Erläuterung der deskriptiven Sta-
tistik in 7 Kap. 5 und der Zusammenhangsanalysen (u. a. Korrelation, lineare und
logistische Regression) in 7 Kap. 6 gelegt. Ebenfalls ausführlich dargestellt sind Metho-
den der schließenden Statistik mit verschiedenen statistischen Tests und Konfidenz-
intervallen (7 Kap. 7, 8 und 9). Abgerundet werden die Auswertungsmöglichkeiten mit
je einem Kapitel zur Überlebenszeitanalyse (7 Kap. 10) und zur Fallzahlberechnung
(7 Kap. 11). Diese ausgewählten Analysen stellen zwar nur einen kleinen Umfang der
statistischen Möglichkeiten und der Tasks in SAS Studio dar, decken aber wichtige
VI Vorwort
Ein ganz besonderer Dank gilt Leonie Hezler und Judith Vilsmeier, die im Rahmen
eines Praktikums die Anpassung der Buchvorlage an SAS Studio übernommen und
darüber hinaus viele wertvolle Vorschläge eingebracht haben. Des Weiteren danken die
Autoren den Kolleginnen und Kollegen des Instituts für Epidemiologie und Medizini-
sche Biometrie der Universität Ulm, speziell Marianne Meule, für ihre konstruktiven
Anregungen und Hinweise. Für weitere Änderungsvorschläge und Hinweise auf Fehler
und missverständliche Formulierungen sind wir jederzeit dankbar.
Gisela Büchele
Martin Rehm
Rainer Muche
Ulm
Deutschland
März 2019
VII
Inhaltsverzeichnis
1 Allgemeine Information . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1
1.1 Was sind SAS, SODA und SAS Studio?. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2
1.2 Einführung in SAS Studio. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3
1.3 Datenhaltung und Datenaufbereitung mit MS-Excel . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7
5 Deskriptive Statistik . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 57
5.1 Auswertung qualitativer bzw. diskreter Variablen. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 58
5.2 Auswertung stetiger Variablen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 59
5.3 Gruppenspezifische Auswertungen stetiger Variablen . . . . . . . . . . . . . . . . . . . . . . . . . . . 63
10 Überlebenszeitanalyse. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 115
10.1 Datentransformation für Überlebenszeitanalysen. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 116
10.1.1 Zensierungsvariable erzeugen. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 116
10.1.2 Datumsvariable ergänzen. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 117
10.1.3 Zeitvariable erzeugen. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 117
Inhaltsverzeichnis
IX
10.2 Kaplan-Meier-Überlebenswahrscheinlichkeiten. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 118
10.3 Konfidenzbereich um Kaplan-Meier-Schätzung. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 119
10.4 Vergleich von Überlebenswahrscheinlichkeiten. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 120
11 Fallzahlberechnungen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 125
11.1 t-Test für unabhängige Stichproben . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 126
11.2 t-Test für gepaarte Stichproben. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 126
11.3 χ2-Test für Proportionen. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 128
Serviceteil
Anhang. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 134
A.1 Registrierung in SAS Studio . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 134
A.2 Der Beispieldatensatz. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 134
A.3 SAS Studio Menü Baum . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 138
A.4 SAS-Syntax . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 145
A.5 SAS Studio Hilfe. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 147
A.6 Grafiken bearbeiten. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 148
A.7 Literaturhinweise . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 150
Sachverzeichnis. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 155
Über die Autoren
Gisela Büchele
arbeitet als wissenschaftliche Angestellte im Institut für Epidemiologie und
Medizinische Biometrie an der Universität Ulm. Sie hat einen Masterabschluss
in Gesundheitswissenschaften und ist seit 1991 in der Medizinischen
Fakultät in Ulm beschäftigt, an der sie auch promoviert hat. Berufliche
Schwerpunkte stellen einerseits die Planung, Durchführung und Auswertung
von epidemiologischen Studien und andererseits die Ausbildung von
Studierenden aus verschiedenen Bereichen des Gesundheitswesens dar.
Seit über 25 Jahren unterrichtet sie mit und in SAS®.
Martin Rehm
arbeitet als Medizinischer Dokumentar im Institut für Epidemiologie
und Medizinische Biometrie an der Universität Ulm. Er studierte
Gesundheitswissenschaften an der LMU München und ist seit 2017 in der
Medizinischen Fakultät in Ulm beschäftigt. Wesentliche Arbeitsschwerpunkte
sind die Auswertung von epidemiologischen Studien und die Ausbildung
von Studierenden in der statistischen Analyse von Daten.
Rainer Muche
ist Professor für Biometrie im Institut für Epidemiologie und Medizinische
Biometrie an der Universität Ulm. Er hat sein Diplom in Statistik an der
Universität Dortmund erhalten. Nach sechs Jahren an der Universität
Göttingen ist er seit 1991 wissenschaftlicher Mitarbeiter in der Medizinischen
Fakultät in Ulm. Schwerpunkt der Arbeit ist die Ausbildung von Medizinern
in die Biometrie, gerade auch mit Statistiksoftware. Neben der Lehre ist die
Beratung von Klinikern in Bezug auf Studienplanung und Auswertung ein
wesentlicher Arbeitsschwerpunkt.
1 1 1
Allgemeine Information
1.1 Was sind SAS, SODA und SAS Studio? – 2
1.2 Einführung in SAS Studio – 3
1.3 Datenhaltung und Datenaufbereitung mit MS-Excel – 7
SAS® wurde Anfang der 1970er Jahre von Forschern an der NC State University als
Datenanalyseprogramm entwickelt. Der Name SAS wurde ursprünglich als Abkürzung
für statistical analysis system geführt. Heute wird die SAS-Software von dem US-ameri-
kanischen Unternehmen SAS Institute Inc. (Cary, North Carolina) vertrieben, alle Rechte
dieser Trademark sind dem SAS Institut vorbehalten.
Weit verbreitet ist die Anwendung von SAS u. a. zur statistischen und biometrischen
Analyse von wissenschaftlichen Daten im Gesundheitsbereich. Die SAS-Software
beinhaltet dazu neben einer umfangreichen Sammlung von geprüften Auswertungs-
routinen (die s. g. Prozeduren), die Möglichkeit, Daten einzulesen und zu bearbeiten,
sowie eine eigene Syntax („SAS Language“) zur Erstellung von Programm-Code.
Aus lizenzrechtlicher Sicht ist für den Gebrauch von SAS der Erwerb einer jährlich zu
erneuernden Nutzungsberechtigung notwendig.
Bei SAS OnDemand for Academics (SODA) handelt es sich um eine online bereit-
gestellte Oberfläche für das Lehren und Lernen von Datenmanagement und Datenana-
lyse mit SAS. Die Verwendung von SODA ermöglicht einen kostenlosen Zugriff auf die
SAS-Software, lediglich eine Online-Verbindung zum SAS-Server muss verfügbar sein.
Für die Nutzer entfällt das sonst beim Anwenden einer Software übliche Herunter-
laden, Installieren und Konfigurieren. Die Software ist auch immer in der aktuellsten
Version in der Cloud verfügbar. Voraussetzungen für die Verwendung des Angebotes
sind eine nicht-kommerzielle Nutzung und eine Registrierung für SODA. Bei der Regis-
trierung wird ein SAS-Profil mit einem Benutzernamen und einem Passwort angelegt.
Im Anhang A.1 wird die Registrierung als „unabhängiger Lerner“ ausführlich gezeigt.
Nach einer erfolgreichen Registrierung können die Nutzer SAS jederzeit und überall
nutzen. Einmal hochgeladene und gespeicherte Dokumente (Excel- oder SAS-Daten-
sätze, Programme u. s. w.) können in der personalisierten, passwort-geschützen
Umgebung aufbewahrt werden. Dem Benutzer steht ein Speicherplatz von bis zu 5 Giga-
byte zur Verfügung. Zusätzlich zu der im vorliegenden Buch dargestellten Nutzung
als unabhängiger Lerner bietet SODA auch die Möglichkeit, in einer Lehr- und Lern-
situation als Dozent einen Kurs einzurichten und Studierende gezielt zu diesem Kurs
einzuladen. Dabei sind Unterrichtsmaterialien für alle Kursteilnehmer einsehbar und
Lehrende können ohne weiteren Wartungs- oder IT-Aufwand die Softwareanwendungen
unterrichten.
SAS Studio ist eine webbrowser-basierte Programmierumgebung für die SAS-Soft-
ware. Zum einen kann in dieser Umgebung SAS-Code (von jedem beliebigen Endgerät
aus) über den Webbrowser geschrieben und ausgeführt werden. Dabei werden Program-
mierer und Programmiererinnen bei der Erstellung von SAS-Code durch eine Autover-
vollständigungsfunktion zur SAS-Syntax sowie durch Popup-Tipps zu Schlüsselwörtern
und Prozeduren unterstützt. Dadurch eignet sich SAS Studio auch gut für den Einstieg
in die Programmierung mit SAS. Zum anderen besteht auf der SAS Studio Oberfläche
1.2 · Einführung in SAS Studio
3 1
die Möglichkeit, über eine Point-and-Click-Steuerung (Tasks) SAS-Code generieren
zu lassen, der dann ausgeführt wird. Die Tasks basieren auf SAS-Prozeduren und bie-
ten Zugriff auf einige der am häufigsten verwendeten Grafik- und Analyseverfahren.
Somit ermöglicht SAS Studio die Auswertung von Daten mit einer großen Bandbreite
an datentechnischen, deskriptiven, grafischen und test-statistischen Methoden sowie
Regressionsanalysen bis hin zu multivariaten Analysen, Clusteranalysen und Data
Mining. Einen leichten Einstieg und einen niederschwelligen Zugang stellt dabei die
deutschsprachige, menü-basierte Oberfläche dar. Auf der Vorstellung und Anwendung
dieser vordefinierten Tasks liegt das Hauptaugenmerk dieses Buches.
SAS Studio wurde in HTML5 entwickelt und erfordert somit keine zusätzlichen Plu-
gins. Es läuft auf allen gängigen Betriebssystemen wie Windows, Linux und macOS und
auch alle üblichen Browser werden unterstützt. Die in diesem Buch vorgestellte Ver-
sion läuft unter Microsoft Internet Explorer 11, Mozilla Firefox 21+, Google Chrome
27+ sowie Apple Safari 6.0+ (auf Apple OS X). Da in der Menü-Auswahl von SAS Stu-
dio noch zahlreiche Menüpunkte und Auswertungsmethoden enthalten sind, die in
dem vorliegenden Buch nicht angesprochen wurden (vergleiche dazu Anhang A.3 SAS
Studio Menü Baum), sind Kenntnis und Anwendung der SAS Studio Hilfe oftmals von
großer Bedeutung. Hinweise zum Aufrufen und einem Einstieg zu den wichtigsten
Anwendungen finden sich im Anhang Abschn. A.5 SAS Studio Hilfe.
Bei der Vorstellung von Tasks, die SAS Studio als vordefinierte Auswertungsmöglich-
keiten anbietet, wurde in dem vorliegenden Buch eine durchgängige Darstellung
gewählt, bei der Menübegriffe, die genauso in SAS Studio vorkommen, als fettgedruckte
Worte zu sehen sind (z. B. Graph oder Box-Plot). Sollen nacheinander verschiedene
Menü- und Untermenü-Punkte ausgewählt werden, so sind die einzelnen Schritte mit
dem Symbol → verbunden, z. B. Tasks → Graph → Box-Plot. Das hier ausgewählte Bei-
spiel Tasks → Graph → Box-Plot (siehe auch die folgende Abbildung) bedeutet, dass die
entsprechenden Felder jeweils nacheinander mit der Maus ausgewählt und (teilweise mit
Doppelklick) angeklickt werden müssen. Unterstützend zum Text sind in den folgenden
Kapiteln die wichtigsten Auswertungsschritte zusätzlich durch Screen-Shots verdeut-
licht. Häufig wird dabei über Markierungen, wie z. B. durch Einkreisen, explizit auf die
anzuklickenden Punkte hingewiesen (. Abb. 1.1).
Vor einer Nutzung von SAS Studio ist eine Registrierung bei SAS OnDemand for Aca-
demics (SODA) nötig (siehe dazu auch Anhang Abschn. A.1 Registrierung in SODA).
Danach kann man sich jederzeit über einen Webbrowser bei SODA online über die Inter-
net-Adresse 7 https://odamid.oda.sas.com/SASODAControlCenter/ anmelden (s. . Abb. 1.2).
Auf der nach dem Anmelden folgenden Übersichtsseite (Dashboard) erhält man
Informationen zu SODA allgemein und zum eigenen Account (z. B. verbrauchter/ver-
fügbarer Speicherplatz) sowie die Möglichkeit, über die Application SAS® Studio die
Oberfläche von SAS Studio zu starten – wodurch eine Anmeldung und Initialisierung
gestartet wird (. Abb. 1.3).
Nach Anklicken des SAS Studio-Links wird man automatisch auf die SAS
Studio-Oberfläche geleitet. Wie im folgenden Bild zu sehen, ist die Oberfläche von SAS
Studio in zwei Teile aufgeteilt. Auf der linken Seite findet sich eine Navigationsleiste
4 Kapitel 1 · Allgemeine Information
mit einer Vielzahl von Auswahlmöglichkeiten und auf der rechten Seite die eigentliche
Arbeitsfläche mit verschiedenen Reitern (. Abb. 1.4).
Die Navigationsleiste dient dazu, Ordner zu erstellen, Daten zu importieren und
Tasks auszuwählen. Sie ist wiederum aufgeteilt in die Bereiche Serverdateien und -ord-
ner, Tasks und Utilities, Snippets, Bibliotheken und Dateiverknüpfungen. Durch Kli-
cken auf die einzelnen Teile öffnen sich weitere Unterrubriken. Im Fenster unten wurde
Tasks und Utilities ausgewählt, da hierauf der Fokus des Buches liegt. Die Tasks ermög-
lichen es, über einfaches Durchklicken und Variablen auswählen, Code zu generieren
und Auswertungen durchzuführen.
Die Arbeitsfläche rechts besteht aus drei Unterfenstern: Code, Log und Ergeb-
nisse (. Abb. 1.5). Man kann durch Klicken auf den gewünschten Reiter hin- und her-
wechseln. Im Code-Unterfenster können die SAS-Programme geschrieben werden, und
auch die von SAS Studio-Tasks generierten Codes werden hier angezeigt. Im Log-Fens-
ter werden Informationen über die eingelesenen Daten und Programme angezeigt. Hier
6 Kapitel 1 · Allgemeine Information
werden auch, falls aufgetreten, Fehler im Programmcode und Warnungen angezeigt mit
Hinweisen auf deren Entstehung. Nach der Anwendung eines Tasks können eigentlich
keine aktuellen Fehler oder Warnungen im Log-Fenster angezeigt sein. Interessierte
Benutzer und Benutzerinnen finden in den Log-Hinweisen Informationen u. a. zur Ver-
arbeitung der Daten, benötigter Rechnerzeit sowie zu ausgegebenen Ergebnissen. Im
Ergebnisfenster werden schließlich die automatisch erstellten Tabellen, Grafiken und
Statistiken angezeigt.
Die unten dargestellte Abbildung zeigt als Beispiel die SAS Studio-Oberfläche mit der
Auswahl eines Tasks zu einer Tabellenanalyse sowie deren Ergebnisse nach Ausführen
eines automatisch generierten Codes (. Abb. 1.6).
Dabei wurde links in der Navigationsleiste unter Tasks und Utilities → Tasks → Sta-
tistiken → Tabellenanalyse ausgewählt. Angefordert wurde dabei eine Kreuztabelle
zwischen den Merkmalen vorhandene_KHK und Anzahl_befallener_Gefaesse des
Datensatzes KHKGESAMT. Im Bereich der Arbeitsfläche erscheint dann links ein Fens-
ter, in dem der Datensatz und die zu analysierenden Variablen ausgewählt werden kön-
nen. Daraufhin wird automatisch von SAS Studio lauffähiger Syntax-Code generiert,
den man durch Klicken auf das „Ausführen“-Symbol in der oberen Leiste der Arbeits-
fläche ausführen kann. Die Ergebnisse erscheinen danach in der Arbeitsfläche rechts als
Kreuztabelle zusammen mit den passenden Grafiken. Man kann dort unter Inhalt den
gewünschten Menüpunkt auswählen. Dieser erscheint dann in der Ausgabe. Der Blick
in das LOG-Fenster ist nach dem Ausführen von Tasks nicht zwingend nötig, da keine
Fehler und Warnungen auftreten können.
1.3 · Datenhaltung und Datenaufbereitung mit MS-Excel
7 1
Wie im Anhang Abschn. A.2 ausführlich beschrieben, entstammen die in den Bei-
spielen benutzten KHK-Daten einer realen Studie aus dem Bereich der Herz-Kreislauf-
forschung. Die Daten werden dabei überwiegend im Excel-Format gehalten. Neben
Word, Outlook und PowerPoint ist Excel ein wichtiges Programm aus Microsofts Office-
Software-Paket. Eine gängige Einsatzmöglichkeit ist das Eingeben und Bearbeiten von
Studien- und Patientendaten. Man kann mit Excel nicht nur Tabellen erstellen, sondern
auch Berechnungen mit Formeln und Funktionen durchführen. In Excel können ver-
schiedene Arbeitsblätter angelegt werden, die als Register angezeigt werden. In jedem
Arbeitsblatt befinden sich Zellen, angeordnet in Zeilen und Spalten, in denen die einzel-
nen Messwerte eingetragen werden. Jede Zelle wird durch die Kombination aus Buch-
stabe (Spalte) und Zahl (Zeile) eindeutig identifiziert, die Zelle links oben beginnt mit
A1. Pro Arbeitsblatt können über eine Million Zeilen und 16.000 Spalten genutzt wer-
den. Für die Weiterverarbeitung der Daten in SAS ist es empfehlenswert, den Datensatz
so aufzubauen, dass immer in einer Zeile die Werte zu einer Beobachtungseinheit (z. B.
zu einem Patienten) und in den Spalten die einzelnen Merkmale (z. B. Geschlecht) ein-
getragen werden. In 7 Abschn. 2.1 wird ausführlicher gezeigt, wie Daten von Hand in
Excel eingegeben, bzw. in 7 Abschn. 2.2 wie eine vorhandene Excel-Datei geöffnet und in
7 Abschn. 2.3 wie eine Excel-Datei in SAS Studio hochgeladen und importiert wird.
Meistens müssen eingegebene oder von anderen Systemen übernommene Studien-
daten noch aufbereitet werden, damit sie für die gewünschten Fragestellungen und
geplanten Auswertungen passend sind. Einige, häufig vorkommende Datenänderungen
sind in 7 Kap. 3 dargestellt. Dabei wird die Vorgehensweise der Datenänderungen in
Excel und, sofern sinnvoll und möglich, auf der SAS Studio-Oberfläche beschrieben.
In 7 Abschn. 2.5 zeigen wir, wie unformatierte Daten (s. g. Textdateien, die im
ASCII-Format gespeichert sind), in SAS importiert werden. Diese Art des Dateneinlesens
8 Kapitel 1 · Allgemeine Information
ist deutlich aufwendiger als das Einlesen von Excel-Daten, da die Bezeichnung der einzel-
1 nen Variablen und Formatierung z. B. von Datumswerten nicht automatisch vorliegen,
sondern SAS erst mitgeteilt werden müssen. Da es hierzu in SAS Studio keinen ent-
sprechenden Task gibt, wird an dieser Stelle Syntax-Code zum Dateneinlesen gezeigt.
9 9 2