実際にデータを収集し分析するためには、各サンプルの状態を何らかの形で測定するわけであるから、測定可能な尺度を設定しなければならない。このときの測定尺度が名義尺度、序数尺度(順位尺度)、間隔尺度、比例尺度の4つである。このうち、名義尺度と序数尺度によるデータは質的データ、間隔尺度と比例尺度によるデータは量的データである。
量的データは長さや重さのように計量可能なものと、人数のように数えて得られる計数値に分けられる。したがって、間隔尺度において計測されたデータは、比例尺度においても利用できる。前者の例としては、温度やテストの点数などが上げられるし、後者の例は入場者数、購買確率などで絶対的な大きさを尺度とする場合である。
これに対して名義尺度は、対象を排他的なカテゴリーに識別する場合の尺度である。例えば、どのタレントのフアンであるといった尺度はフアンの数を問題にする場合は、比例尺度としてカウントできるが、○○のフアンであるといったデータ自体を問題にするのであれば、つまり、符号としての意味しかないのである。
例えば和食派は1、洋食派は2というコード化して分析する場合、このデータは名義尺度あり、どちらに属するかという符号的価値しかないわけであるが、何らかの形で数量化して分析する場合は、この名義尺度(符号)をどれだけの人が属しているかという尺度に変換して数量データとしてみると、比例尺度として扱うことも可能になる。
序数尺度は名義尺度とは異なり、単にカテゴリーを識別するだけではなく、数値の大小関係を示す尺度である。対象を共通の変数について順序づけることによって数値として得られるが、順位間の違いについて情報は得られない。例えば、1位は3位の3倍の価値があるといった情報にはならないということである。
序数尺度の例としては、食品の嗜好順位(好きな順序に上げてください)といったアンケートの場合などである。この場合は順位が高い(数値が少ないほど人気がある)ので一般的な演算は馴染まないことになる。つまり1位のブランドと2位のブランドの選好度は測定できないから、中央値や最頻値を算出できるに止まる。
コメント