You are on page 1of 7

2 Sozialwissenschaftlich relevante Variablen

und ihre Messung

Quantitative und qualitative Variablen. Objekte konnen sich der Quan-


titat Oder Qualitat nach unterscheiden. Dem entspricht eine herkomm-
liche Unterscheidung von quantitativen und qualitativen Variablen. Wir
werden diese Unterscheidung nicht verwenden. Eine differenziertere, an
vier Skalenniveaus orientierte Klassifikation von Variablen ist in Ab-
schnitt 2.1 beschrieben.

Kann man Objekte im Hinblick auf eine bestimmte Eigenschaft der


GroBe nach unterscheiden, d. h., konnen Objekte im Hinblick auf eine
bestimmte Eigenschaft groBer oder kleiner, hoher oder niedriger oder
mehr oder weniger sein, so spricht man von einer quantitativen Varia-
blen. Beispiele quantitativer Variablen sind die Variablen Lebensalter,
KorpergroBe, Einkommen, FamiliengroBe, Geburtenrate, Religiositat,
soziale Distanz, Arbeitszufriedenheit und Anzahl vollendeter Schul-
jahre.

Kann man Objekte im Hinblick auf eine bestimmte Eigenschaft der Art
oder Qualitat nach unterscheiden, so spricht man von einer qualitativen
Variablen. Beispiele qualitativer Variablen sind die Variablen Ge-
schlechtszugehOrigkeit mit den Auspragungen (den Kategorien) mann-
lich und weiblich, Nationalitat mit den Auspragungen britisch, deutsch,
franzosisch, italienisch, andere, keine, und Konfessionszugehorigkeit mit
den Auspragungen evangelisch, katholisch, andere, keine. Da die Aus-
pragungen qualitativer Variablen nicht groBenmaBig geordnet sind, kann
ein Objekt beztiglich einer qualitativen Variablen nicht groBer, hoher
oder mehr sein als ein anderes Objekt; die Objekte sind entweder gleich
oder ungleich. Dennoch sind auch qualitative Variablen der statistischen
Analyse zuganglich.
2 Sozialwissenschaftlich relevante Variablen und ihre Messung 21

Kontinuierliche und diskrete Variablen. Quantitative Variablen werden


des weiteren danach unterschieden, ob sie kontinuierliche (stetige) oder
diskrete (diskontinuierliche) Variablen sind. Kontinuierliche konnen in
einem bestimmten Bereich jeden beliebigen Wert annehmen, z. B. die
Variablen Entfemung, Lebensalter und KorpergroBe. Der Ausdehnungs-
bereich einer kontinuierlichen Variablen kennt keine Liicken oder
Sprungstellen. Diskrete Variablen konnen nur ganz bestimmte Werte
annehmen, z. B. die Variablen Anzahl eigener Kinder oder Haushalts-
groBe in Personen. Obwohl die Werte einer diskreten Variablen eben-
falls einen groBen Bereich abdecken konnen (siehe z. B. die Variable
Einwohner), sind sie stets isolierte Werte, zwischen denen Liicken bzw.
Sprungstellen bestehen. Diskrete Variablen beruhen im allgemeinen auf
einem Zahlvorgang, kontinuierliche Variablen auf einem MeBvorgang.

Die Unterscheidung von kontinuierlichen und diskreten Variablen ist je-


doch eher eine graduelle als prinzipielle. So ist beispielsweise das - in
kleinsten Zeiteinheiten gemessene - Lebensalter eine kontinuierliche
Variable, das Einkommen hingegen eine diskrete Variable, weil es -
auch in kleinsten Wahrungseinheiten ausgedriickt - nur ganzzahlige
Werte annehmen kann. In der statistischen Behandlung besteht zwischen
derart fein abgestuften diskreten und kontinuierlichen Variablen kein
Unterschied. So werden mitunter diskrete Variablen wie kontinuierliche
Variablen behandelt, etwa wenn die durchschnittliche GroBe der Privat-
haushalte einer bestimmten Region mit, sagen wir, 2.73 Personen ange-
geben wird, mit einem Wert also, der in der Realitat nicht vorkommt, der
aber einen bestimmten Aspekt der Realitat sehr gut beschreibt.

Kontinuierliche Variablen werden im ubrigen haufig durch Zusammen-


fassung benachbarter Werte klassiert, man sagt auch gruppiert, und
dadurch fur die statistische Behandlung zu diskreten Variablen mit einer
(meist drastisch) reduzierten Anzahl von Auspragungen.
22 2 Sozialwissenschaftlich relevante Variablen und ihre Messung

2.1 MeBniveaus bzw. Skalentypen

Die verbreitetste Klassifikation sozialwissenschaftlich relevanter Varia-


blen folgt der von dem Psychophysiker STEVENS vorgeschlagenen
Klassifikation nach Mafigabe formaler Relationen zwischen den Varia-
blenauspragungen bzw. Skalenwerten. Nach STEVENS (1946) besteht
Messen in der Zuordnung von Zahlen zu Objekten oder Ereignissen
gemafi Regeln, so da6 bestimmte Relationen zwischen den Zahlen ana-
loge Relationen zwischen den Objekten oder Ereignissen reflektieren. Je
nachdem, welche Relationen zwischen den Zahlen im gegebenen Fall
empirischen Sinn haben, kann man vier MeBniveaus bzw. Typen von
Skalen (oder Variablen) unterscheiden, namlich Nominal-, Ordinal-,
Intervall- und Ratioskalen.

Nominalskalen. Die grundlegendste und zugleich simpelste Operation in


jeder Wissenschaft ist die der Klassifizierung oder Klassifikation. Klassi-
fizieren bedeutet Einordnen von Objekten oder Ereignissen in Klassen
oder Kategorien im Hinblick auf eine bestimmte Eigenschaft oder
Dimension. Alle anderen MeBoperationen, gleichgtlltig wie prazise sie
sind, schlieBen die Klassifizierung als Minimaloperation ein. Nominal-
skalen, auch qualitative Klassifikationen genannt, bestehen lediglich aus
einem Satz rangmaBig nicht geordneter Kategorien; sie reprasentieren
das niedrigste MeBniveau.

Fur Nominalskalen ist konstitutiv, daB die Kategorien vollstandig sind


(d. h. alle Falle einschlieBen) und sich gegenseitig ausschlieBen (d. h.,
kein Fall darf in mehr als eine Kategorie gelangen). Beispielsweise ist
die Variable Geschlechtszugehorigkeit eine nominale Variable oder
Nominalskala: Fersonen konnen entweder der Kategorie mannlich oder
der Kategorie weiblich zugeordnet werden; keine Person kann beiden
Kategorien zugeordnet werden. Weitere Beispiele solcher Altemativ-
klassifikationen sind: berufstatig / nicht berufstatig, unter 18 Jahre alt /
18 Jahre und alter, Ja- / Nein-Antworten auf eine Frage. Die Varia-
blen konnen beliebig viele Auspragungen oder Kategorien haben, z. B.
2.1 Mef3.niveaus bzw. Skalentypen 23

Berufsstatus: Arbeiter / Angestellter / Beamter / Selbstandiger, oder


Familienstand: ledig / verheiratet / verwitwet / getrennt lebend / ge-
schieden, oder Nationalitat: Belgier / Brite / Franzose / Italiener / son-
stige / keine. (Hat eine Variable zwei Auspragungen, so spricht man von
einer dichotomen (zweistufigen) Variablen oder Dichotomie, hat sie drei
Auspragungen, von einer trichotomen (dreistufigen) Variablen oder
Trichotomie, generell, bei mehr als zwei Auspragungen, von einer
polytomen (mehrstufigen) Variablen oder Polytomie.) Wenn die Kate-
gorien vollstandig sind und sich gegenseitig ausschlieBen, sind die
minimalen Voraussetzungen filr die Anwendung bestimmter statisti-
scher Verfahren gegeben. Fur die Benennung der Kategorien benotigen
wir keine Zahlen, sondem nur eindeutige Zeichen. Diese konnen natilr-
lich auch Zahlen sein, ebensogut aber auch Buchstaben, Worter oder
geometrische Figuren. Zahlen v^erden hier nur in ihrer Zeichenfunktion
zugeordnet.

Nehmen wir als Beispiel einen intemationalen Sportwettbewerb, dessen


aktive Teilnehmer Ruckennummem tragen, etwa die Teilnehmer der
Nation A die Nummern 1 bis 17, die Teilnehmer der Nation B die
Nummem 18 bis 43, die Teilnehmer der Nation C die Nummern 44 bis
57 usw. Normalerweise implizieren diese Zahlen weder eine Rangord-
nung der Nationen noch eine Rangordnung der teilnehmenden Sportier;
sie sind nichts weiter als Namen, die Kategorien bezeichnen bzw. der
Identifizierung der Aktiven dienen. Wenn Zahlen lediglich dem Zweck
dienen, Kategorien voneinander zu unterscheiden, ist es nicht sinnvoll,
sie den iiblichen arithmetischen Operationen zu unterwerfen. Die
Ruckennummem von Sportlem oder die Nummem von Autoschildem,
Personalausweisen, Hotelzimmem usw. zu addieren, ware offensicht-
licher Unsinn.

Ordinalskalen. Haufig ist es moglich, Objekte im Hinblick auf den Grad,


in dem sie eine bestimmte Eigenschaft besitzen, zu ordnen, obwohl wir
nicht genau wissen, in welchem MaUe sie diese Eigenschaft besitzen. In
solchen Fallen kann man sich die Objekte auf einem Kontinuum ange-
2.1 MeBniveaus bzw. Skalentypen 25

alle Eigenschaften einer Intervallskala und uberdies einen absoluten


(invarianten) Nullpunkt, so ist sie eine Ratioskala, auch Verhaltnisskala
genannt. Eigenschaften, die mit Skalen gemessen werden, bei denen die
Distanz zwischen den Skalenpositionen 0 und 1, 1 und 2, 2 und 3 usw.
gleich sind, werden haufig Intervallvariablen (oder metrische Variablen)
und die erlangten Messungen intervallskalierte (oder metrische) Daten
genannt. Diese Bezeichnungen bringen die sogenannte Aquidistanz der
Intervalle zum Ausdruck. So ist z. B. die Entfemung von einem Kilo-
meter stets dieselbe Distanz, gleichgtiltig ob es sich um den ersten oder
letzten Kilometer einer Reise handelt. Gleicherweise ist die Differenz
zwischen 110 und 100 Euro dieselbe wie die Differenz zwischen 20 und
10 Euro. In beiden Fallen, Kilometer und Euro, ist der Abstand zwischen
nebeneinanderliegenden Werten an jedem Ort der Skala gleich. Der mit
der Erreichung metrischen MeBniveaus verbundene Vorteil besteht darin,
daB die elementaren Rechenoperationen der Addition, Subtraktion,
Multiplikation und Division sinnvoU auf die Differenzen zwischen den
MeBwerten angewendet werden konnen.

Bei Intervallskalen gibt es zwei willkiirliche Momente, namlich die Wahl


der IntervallgroBe (der MaBeinheit) und die Wahl des Nullpunktes.
Beispielsweise ist unsere Kalenderrechnung eine Intervallskala, deren
IntervallgroBe ein Jahr (oder zwOlf Monate) und deren Nullpunkt das
Geburtsjahr Christi (nicht etwa das Geburtsjahr Mohammeds) ist. Die
Eigenschaften von Intervallskalen werden gewohnlich am Beispiel der
Temperaturmessung illustriert. Betrachten wir dazu die folgenden drei
Skalen:

Temperaturskala nach
Celsius Fahrenheit Kelvin

Gefrierpunkt des Wassers 0° 32° 273°


Siedepunkt des Wassers 100° 212° 373°
26 2 Sozialwissenschaftlich relevante Variablen und ihre Messung

Die Verhaltnisse der TQmpQmtxrdifferenzen (Intervalle) sind unabhangig


von der Einheit der Skala und der Lage des Nullpunktes. Der Gefrier-
punkt des Wassers (nicht der Gefrierpunkt des Athylalkohols) liegt auf
der Celsiusskala bei 0° und der Siedepunkt bei 100°, auf der Fahren-
heitskala bei 32° und 212°. Wenn wir dieselben Temperaturen auf beiden
Skalen ablesen, erhalten wir zum Beispiel

c 0° 10° 30° 100°


F 32° 50° 86° 212°

Das Verhaltnis der Differenzen zwischen den Temperaturwerten der


einen Skala ist gleich dem Verhaltnis der entsprechenden Differenzen
der anderen Skala. Auf der Celsiusskala ist z. B. das Verhaltnis der
Diflferenz zwischen 30 und 10 und der zwischen 10 und 0 gleich
(30 - 10) / (10 - 0) = 2, und auf der Fahrenheitskala gleich (86 - 50) /
(50 - 32) = 2. Es ware allerdings nicht sinnvoll zu sagen, dafi es bei einer
Temperatur von 10° C halb so warm sei wie bei einer Temperatur von
20° C. Das leuchtet sofort ein, wenn man die Celsiuswerte in Fahren-
heitwerte transformiert: 20° C entsprechen 68° F, und 10° C entsprechen
50° F. Zwar ist 10/20 = 0.5, aber 50/68 = 0.74 :7^ 0.5. Es hat also keinen
Sinn, hier Verhaltnisse (Quotienten) zu bilden. Das ist erst sinnvoll beim
hochstwertigen Skalentyp, der Ratioskala.

Wenn, wie erwahnt, eine Skala alle Eigenschaften der Intervallskala und
auBerdem einen invarianten Nullpunkt hat, dann ist sie eine Ratioskala
(Verhaltnisskala). Beispiele von Ratioskalen sind das Lebensalter, das
Einkommen, die Kelvinsche Temperaturskala (mit dem absoluten Null-
punkt bei -273° C), die KorpergroBe und das Korpergewicht. Auch die
Skala der Kardinalzahlen ist eine Ratioskala, jene Skala, die wir be-
nutzen, um Individuen, Objekte oder Ereignisse zu zahlen, z. B. die
Anzahl der Personen des Haushalts, die Anzahl eigener Blicher oder die
Anzahl der Verwandtenbesuche. (Die auf Abzahlen basierende Skala
28 2 Sozialwissenschaftlich relevante Variablen und ihre Messung

wird, da6 B mehr als A verdient, verzichtet man auf die verfilgbare
Information, daB die Differenz 2000 Euro betragt. Im allgemeinen ist es
deshalb von Vorteil, das erzieite MeBniveau bzw. den Informations-
gehalt der Daten nicht zu „verschenken". Wenn wir den umgekehrten
Weg gehen und z. B. ordinalskalierte Daten wie intervallskalierte Daten
behandeln, miissen wir uns daruber im klaren sein, daB dieser Schritt
nicht durch die arithmetischen Operationen, die wir durchfuhren,
iegitimiert wird. Vielmehr setzt die Anwendung bestimmter Verfahren
schon voraus, daB ein bestimmtes MeBniveau erreicht wurde. Wie er-
wahnt, sind die iiblichen arithmetischen Operationen nur bei intervall-
und ratioskalierten (bei metrischen bzw. quantitativen) Daten sinnvoll.
Andererseits sind gerade nominales und ordinales Messen die am haufig-
sten erreichten Typen in der empirischen Sozialforschung. Infolge-
dessen kommt jenen Methoden und MaBzahlen, die fur nominale und
ordinale Daten konzipiert wurden, in der Analyse sozialwissenschaft-
licher Daten eine besondere Bedeutung zu.

You might also like