更新日:2026年2月27日  Version 4.0
練習用の社会調査データについて

職業分類変数作成のプログラムについて

社会調査実習

村瀬 洋一

 実際の生きている社会からデータを取り、初心者でもデータ分析をする達人になれる科目(*^.^*)

 調査の企画から報告書作成までの社会調査の全過程を実際に行いながら学習する。社会調査の一連の過程を理解し、前期はその前半部分(調査の企画、仮説構築、調査項目の設定、質問文作成、対象者の選定、調査実施、収集されたデータの点検)までを行えるようになる。

 実習形式のため、PC教室にて全回対面で行う。社会調査を設計するにあたり、質問項目を考えるための課題を課し、各自が質問項目案を発表し、それにより授業を進めていく。MSエクセルや、各種のデータ分析ソフトを用いたデータ分析を活用する。また、データ収集やデータ分析のために、授業時間以外にも調査活動を行う。

 社会調査に関するサンプリングやコウディングなどの実習を実際に行う。一対一での面接調査を実際に行う。
 その他に、統計学やPCの予備知識はとくに不要であり、やる気があればそれでよい。エクセルの他に、SPSSなどのデータ分析ソフトを使う予定。
 

調査実習ページ 目次

1.目的と日程   2.SPSSの基本操作   3.SPSSシンタックス解説
4.職業コウディングの解説
5.その他資料 調査票ファイル、線の引き方など
6.参考書   7.調査実施時の注意点   8.調査結果のデータ入力について
 

 データの検索

  東大SSJデータアーカイブ

  立教大学社会調査データアーカイブRUDA

  ISSP 国際比較調査

  ★文献や統計リンク     ここをクリック
      文献リストを作る時は、国会図書館の雑誌記事索引、Cinii, Google Scholar, JSTORなどを活用してください。必ず、冒頭で著者名と発行年(半角数字)を書くこと。雑紙タイトルやページ数が分からないリストにはしないよう注意。

  データ分析ソフトSPSS

  SPSS 学生版

  フリーソフトPSPP ダウンロード


各種資料


 

1.目的と日程

 大規模な社会調査を実施し、データを分析するためには、専門的な技術を身につける必要があります。小規模な観察や自己流のインタビューは、問題探索としては有効で、おもしろいと感じることもありますが、社会のごく一部を見ているのみとなります。データの偏りに注意しなくてはなりません。これだけでは、大規模な現代社会を分析し十分な成果を挙げることはできません。また、いいかげんなアンケートは世の中に多数ありますが、正確な調査を行うためには、適切な方法論を理解する必要があります。この実習では、本格的な統計的社会調査の実施法と分析法について学びます。

 社会調査実習は、社会調査法を履修済みの人のみが履修できます。


1.1.目的
・統計的社会調査の実施能力を習得 ―自分で本格的な調査を実施できるように
・科学的なデータ分析能力を身につける ―直感や印象での分析でなく

とくに以下の内容を重視します
 無作為抽出のやり方
 よい質問文の作り方
 社会調査は、大きく2つに分類すると、統計的調査と記述的調査に分かれます。
 この科目では、本格的な統計的社会調査の実習を行います。


1.2.主な内容
・科学的な無作為抽出のやり方 −母集団が不明な、ばらまき調査は意味がありません
・よい調査票の作り方 −あいさつ文や質問文によって、回収率は大きく変わります
・データファイルの作成法など −データ行列とは何か
・適切なデータ分析法 −調査したけど分析せず、とならないよう

 RやSPSSやSASなどの統計分析ソフトを用いた統計分析については、この科目では時間の
都合上、基本的なことのみを行います。分析法は、データ分析や統計学関連の科目でしっかり学んでください。


 社会調査法についてはこれまでの講義内容を復習し、『社会調査演習』第1章か、以下のページを見てください。

  社会調査の部屋 


1.3.日程

前期
・調査法概要、仮説構築法、コウディング実習
・データ分析ソフトを用いた多変量解析

後期
・無作為抽出法
・尺度構成法
・調査票作成と実査(実際に統計的調査を行う)
◆2026年度内容予定
前期
1 社会調査法の概要 生きている社会からデータを取る方法の大切さと、社会調査の各種の方法、方法の選択
2 社会調査の企画1 調査目的と仮説の作り方、因果関係とは何か、調査倫理、先行研究の探し方
3 社会調査の企画2 調査対象者の選定、企画書を作ろう!
4 社会調査の企画3 仮説構築と因果関係、質問項目案の発表
5 基礎的データ分析1 統計分析の基本的な考え方、平均値と分散、関連とは何か、単純集計表の作成
6 基礎的データ分析2 クロス集計とカイ二乗検定
7 基礎的データ分析3 三重クロス集計によるエラボレイション、統計的因果関係の考え方
8 基礎的データ分析4 平均値の差の検定、t検定とF検定
9 多変量解析1 分散分析
10 多変量解析2 相関係数と回帰分析の基礎
11 多変量解析3 単回帰分析
12 多変量解析4 重回帰分析
13 多変量解析5 因子分析
14 分析結果のまとめ方 グラフ作成の注意点、グラフを用いた可視化の方法
15 調査実施の反省とまとめ 調査実施とデータ作成などについて反省会と討論
 
後期
1 調査計画の確認 社会調査の全過程の復習、調査法と分析法
2 調査票の作成1 調査票の構成
3 調査票の作成2 質問文のワーディング
4 調査票の作成3 質問項目の尺度や選択肢の作り方
5 調査票の作成4 質問文の作成、調査項目案の発表、調査票を完成させる 小規模な予備調査の実施
6 標本抽出法1 無作為抽出法の考え方、系統抽出法、確率比例抽出法
7 標本抽出法2 調査対象の選定
8 調査の準備 調査員説明会、調査依頼文の作成、調査票の修正と印刷
9 調査の実施 調査票の配布と回収(授業時以外の時間帯)、調査実習時の問題と解決
10 調査データの整理1 回収した調査票の点検、データ入力へ向けた準備(非該当や無回答のコードを決定)
11 調査データの整理2 データ入力、データクリーニング
12 調査データ入力1 データクリーニング、入力データと調査票の照合と訂正
13 調査データ入力2 完成したデータファイルの確認、不適切なデータの修正
14 分析結果の発表 パワーポイントを用いて分析結果を発表する
15 調査報告書の作成 分析結果の検討、仮説検証、結果の解釈、適切な結果のまとめ方、報告書作成法のポイント
 
 

 

2.SPSSの基本操作

 SPSSを起動すると、データ画面、出力画面、シンタックス画面の3つがある。シンタックス画面に、自分の命令文を書き込むとよい。最後は必ずピリオドで終わる。また、全角空白を入れてはいけない。詳しくは統計のテキストにあるSPSSシンタックス解説や、以下の動画などを見ること。

SPSSシンタックスについて説明動画1
  

SPSSシンタックスについて説明動画2
  

◆SPSSシンタックスの基本PDF

◆SPSSクロス集計 基礎の基礎PDF

◆SPSSシンタックス 基礎の基礎PDF


SPSS出力をエクセルで編集説明動画
  

 ★SPSS出力のままでは表やグラフが見にくいので、自分でエクセルを使って、適切な形式の図表を作ることが大切。図表には必ずタイトルをつけ、図1、図2のように必ず通し番号をつけること。図表形式見本のエクセルファイルをよく見ること。


2-1 SPSSデータ画面
 SPSSは、データ、シンタックス(分析命令文の簡単なプログラム)、出力画面の3つの画面からなる

SPSSを起動すると、まず空のデータ画面が出てくる(以下はデータビューの例)。


       図1. SPSSデータ画面の例

  ・300人分のデータなら300行ある。
  ・画面下の「変数ビュー」を押すと変数の説明画面になる。
  ・「分析」をクリックすると各種分析ができる。


分析の前に準備すべきファイル
・テキストファイル形式のデータ(拡張子はtxtかcsvが多い)
・SPSSシンタックス(命令文、プログラム、拡張子sps)
 この2つがあれば、SPSS形式データファイル(拡張子savとつくもの)を作成できる。

要するに、SPSSでまず初めに使うファイルは3種類あることを理解すること。
 最初の2つ(あるいはsavのファイル1つだけ)があれば分析結果を出すことができる。分析結果のファイルはまた別に保存する。
 savのファイルの代わりに、por(古いSPSS形式データファイル)やxls(エクセル形式)ファイルなども、SPSSではデータとして使うことができる。
  エクセルでデータを作った場合は、最初の1行を変数名にすること。変数名は半角英数字8文字以内にするとよい。


 シンタックスウィンドウを出す時は、 SPSS画面上「ファイル」をクリック→ 新規作成 →シンタックス。
  以下は無料ソフトPSPPの画面例。


       図2. 新規にシンタックスを開く
      画面下にある「変数ビュー」をクリックすると、各変数(質問項目)の説明が出る


2-2 シンタックス作成時の注意点   
・全角空白を入れてはいけない。
・命令文の文末には必ずピリオドつける。また、それ以外に余計なピリオドを付けない。
・フォルダ名、ファイル名、変数名を正確に書く(Cドライブのdataフォルダなど)。
・全角文字は、ラベル以外では使うことはできない。

 とくに、シンタックスの途中で余計な全角空白を入れると、実行しても止まってしまうので注意すること。
 半角空白は、途中でたくさん入れても問題はない。

文字化けについて

 自分のパソコンにエディターソフトを入れてシンタックスを編集してもよい。その際に、文字コードはUTF-8にすること。  動作の軽いエディターソフトがあると、仕事の効率が何かと上がるのでおすすめ。秀丸エディターなどを使うとよい。  文字化け対策については「SPSS 文字化け」などでGoogle検索すること。ChatGPTなどのAIは嘘を言うことも多いので気をつけること。

データの形式見本(2人分)

1101 32400232 10100011 110113110 22099 9621 4317 1102 13101421 11212111 121114112 12299 9631 4317  この例だと、はじめの4桁はサンプル番号。その後、問1で3、問2で2、問3で4と答えている。 2-3 データをSPSSで読み込む  SPSSでのデータの読み込み法は、大きく2つのやり方がある。 2-3-1 テキスト形式データをシンタックスで処理する(一括処理)  あらかじめ上記のようにテキスト形式データ(半角数字のみのデータ)のファイルを作っておく  ・画面上「ファイル」をクリック →開く →シンタックス    →シンタックスファイルの場所を選んで開く  ・画面上「実行(R)」をクリック →すべて(あるいはシンタックス画面にて、ctrl+Aですべて選択してからctrl+R、 あるいは▲ボタンを押して実行)     実行はRun、全て選択はAllである。        図3. シンタックス実行  シンタックスの中には、以下のように、冒頭でDATA LIST FILEコマンドを書けばよい。  具体的には、データファイルがおいてある場所(ドライブ名やフォルダ名)を書く。    Cドライブのpractフォルダ内のabcdat.txtを読む場合の例    DATA LIST FILE='C:\pract\abcdat.txt' fixed RECORDS=4      1人のデータが4行の場合はRECORDS=4 と書く      最後のピリオドを忘れずに。  この後、スラッシュのあとに続くのが、問の名前とケタ指定。1-3桁目にIDが入り、 4桁目にQ1 5桁目にQ2 の場合は、以下のように書く。 / ID 1-3 Q1 4 Q2 5 Q3 6 Q4A 7 Q4B 8  ケタ指定をすべて書いたら、シンタックスを実行すればよい。  シンタックス内では、ケタ指定文の後に、欠損値処理や分析命令文を書く。  このようなシンタックスを用いた一括処理の方が、大量なデータを扱う場合に向いている。  シンタックスを書くと、データの加工などについて記録が残るので良い。  以下のようにデータ画面で、画面上「分析」をクリックすればクロス集計などは簡単にできる。        図4. クロス集計を実行 ポイント 1)パソコンのドライブは、ふつうハードディスクがCドライブ、フロッピーがAかB。しかし最近は、フロッピーがない。 2)DVDドライブがDかEドライブ。着脱式記憶装置やその他の増設ハードディスクがEやF以降になることが多い。 3)データファイルが Hドライブにあるなら、C:\でなくH:\ と書く。 4)フォルダ名は \ マークで区切る。データファイルがあるフォルダ名を正確に書く。 2-3-2 SPSS形式データを開く  あらかじめSPSS形式データファイルができている時は、以下のGET FILE文を使う。 この文1行のみで、行指定文は書かなくて良い。  あらかじめSPSS形式データ(sav)を作っておく  ・以下のように、シンタックスのGET FILEコマンドを書いて実行。    GET FILE='C:\Users\murase\Documents\abcsubset.sav'. この例ではmurase というユーザーのドキュメント内にsavファイルがある。  ・あるいは画面上「ファイル」をクリック →開く →データ    →データファイルの場所を選んで開く 2-4 設定の変更  画面上「編集」をクリック →「オプション」 で各種設定を変更できる  ・表形式などを好みのものに変えると良い  ・動作が軽い方がいい場合はドラフトビューアーを指定  ・変数リストは「アルファベット順」でなく「ファイル」にすると、分析時に    ファイルに書いてある順序で変数が表示される 2-5 分析結果の保存  出力画面で「ファイル」をクリックして分析結果を保存する  保存場所は、自分のUSBメモリーやデスクトップか、あるいはハードディスク(Cドライブ)内の分かりやすいフォルダにすること  ドライブ構成はWindowsエクスプローラーにてPCをクリックして確認。   普通はA(とB)がフロッピードライブでCがハードディスクである(しかし最近のPCはフロッピードライブはない)。   その他にDVDドライブや共有ハードディスクがあることも 2-6 分析結果をエクセルファイルとして保存  保存時に出力画面にて「ファイル」をクリックして「エクスポート」を選ぶと、テキスト形式やエクセルでの保存ができる。その方が汎用的である。  エクスポートのメニュー画面が出たら、まず「ファイルの種類」ボックスをクリックして、エクセル形式を選ぶこと。  無料ソフトPSPPでは、出力画面にて「ファイル」→「書き出し」。        図5. 分析結果の保存  その後、出力(分析結果)を分かりやすい名前を付けて保存する。保存場所はハードディスク Cドライブ (Windows C)などを選ぶ。  保存形式をcsvにすると、あとでエクセルなどで読み込んで、出力を自分で編集することができる。あらかじめCドライブの中にoutputフォルダなどを作っておく。  この例では、PSPPで、Cドライブの中の、dapフォルダの中にあるoutputフォルダの中に、出力をCT1という名前を付けて、csv形式で保存している。        図6. CSV形式での保存 2-7 出力をエクセルで読み込む  分析結果をcsv形式で保存したら、エクセルで結果を開く。ただし、csvファイルをダブルクリックすると文字化けすることがある (全角文字の文字コードがエクセルだとシフトJIS形式のため)。最近の分析ソフトの多くは文字コードがUTF-8形式。 詳しくはグーグルなどで「エクセルでcsvを開くと文字化け」で検索すること。  以下のように、エクセルの「データ」をクリックして「テキストまたはcsv」を選ぶ。        図7. CSVファイルを開く  先ほど、Cドライブの中のdapフォルダに分析結果を保存したので、データの場所を選ぶ。        図8. データの場所を選択  ファイルの中が表示されるので、文字化けしていなければ「読み込み」ボタンを押す。 文字化けしている場合は、文字コードのUTF-8の部分をクリックして他に変更してみる。        図9. データ読み込み  正常に読み込むと、普通のエクセル画面として表示される。その後、シート左上すみをクリックすると、シート全体を選択状態になる。 右クリックして「セルの書式設定」を選び「配置」タブをクリックして「セルを結合する」を外す。全て外すと、自分で編集して、 グラフ作成などをやりやすくなる。        図10. セルの書式設定 2-8 その他  エクセルファイルをデータとして使うには ・SPSSのデータ画面にて、「ファイル」→「開く」で、「ファイルの種類」ボックスをクリックし、Exelを選ぶ。 ・エクセルファイルは、横1行が1人のデータとして数字を入力する。千人分なら千行ある。 ・最初の1行目は変数名(半角英数字で8文字以内の名前)にしておくこと。そうでないと、SPSSのバージョンによっては文字化けすることがある。 ・PSPPでは、エクセルファイルを直接、読み込むことはできない。事前にcsvファイルを作っておくこと。   まずエクセルにて、エクセル形式ファイルを開く。その後「名前を付けて保存」でcsv形式を選んで保存する。

 

3.SPSSシンタックスの解説

 シンタックスを書くと、自分がやった分析の記録が残るほか、大量なデーの加工や分析が一度にできるので便利です。
 シンタックスは、初めにデータの場所とデータけた(カラム)指定文などのデータ定義文を書き、その後、データの加工や、分析命令文を書きます。

 まずデータ定義文を実行してから、以下のようなデータ加工や分析命令のシンタックスを自分で書いて実行すること。

 以下の例1以降の内容を理解し、COMPUTE文やIF文を使えるようになるとよいだろう。RECODEリコードをレコードとつづりを間違う人が多いので注意。


★シンタックスについての解説は、

村瀬洋一他.2007.『SPSSによる多変量解析』オーム社.

三宅一郎・山本嘉一郎編著.1986.『新版SPSSX 基礎編』東洋経済新報社.
酒井麻衣子.2001.『SPSS完全活用法 データの入力と加工』東京図書.

 などを見るか、WEB上にいろいろな人のシンタックス見本があるので、
それを見て、真似して書くとよい。



/*****   シンタックスによる変数の処理について        *****/
/*****   カテゴリー合併の例  基本的な例              *****/
/*****    行末のピリオドを忘れるとエラーがでるので注意*****/

COMPUTE         N3  = Q3  .
RECODE          N3  (1,2=1)(3,4=2)  .
MISSING VALUES  N3  (9)  .

/*****    上記の1行目は、新変数名(新しい質問項目)として*****/
/*****    N3を設定し、その中身をQ3と同じにています。N3は  *****/
/*****    好きな名前で良い。                              *****/
/*****    初めに新変数N3を作っていることを理解すること。  *****/
/*****    2行目はリコード文でのカテゴリー合併            *****/
/*****    3行目は欠損値処理                              *****/


/*****    以下によりうまく新変数ができているか確認する    *****/
CROSSTABS
  /TABLES= N3 BY Q3 .


/*****    新変数を使った分析                              *****/
CRO
  /TAB= N3 BY Q1SEX
  /CEL= COL .


/*****  3重クロス集計の例                                       *****/
/*****  変数名は、シンタックス冒頭で指定した名前を正確に書くこと *****/
/*****  ピリオドは最後に1つだけつけること                       *****/
CROSSTABS
  /TABLES=Q8  BY  Q9A  BY  Q9B
  /STATISTIC=CHISQ
  /CELLS= COUNT COLUMN ROW ASRESID .


/*****  記述統計                                            *****/
/*****  名義尺度に関して量を計算しても意味がないことに注意  *****/
DESCRIPTIVES
  VARIABLES=Q2 to Q4  .


/*****  記述統計量と平均値比較のグラフ(一元配置分散分析)  *****/
ONEWAY    Q6A BY Q16
  /STATISTICS DESCRIPTIVES
  /PLOT MEANS .



/*****   シンタックスによる変数の処理について        *****/
/*****   例1 カテゴリー合併の例                    *****/
/*****    はじめに新変数としてEDUCTを設定している     *****/
/*****   新変数名は何でも好きな名前で良い            *****/
COMPUTE        EDUCT =Q16.
RECODE         EDUCT(1,2=1)(3,4=2)(5,6=3)(7,9=9).


/*****   例2 計算   新変数として合計得点を作る     *****/
/*****    はじめに新変数としてKOHDOを設定している     *****/
/*****    最後のピリオドを忘れずに書くこと            *****/
/*****    また計算の前に欠損値処理をすること          *****/

COMPUTE   KOHDO =Q7A+Q7B.



/*****   例3 計算その2  合計得点 財産項目の例    *****/
/*****    はじめに新変数としてPROPERTYを設定している  *****/
COMPUTE      PROPERTY=Q14S01+Q14S02+Q14S03+Q14S04+Q14S05+Q14S06+Q14S07
             +Q14S08+Q14S09+Q14S10+Q14S11+Q14S12+Q14S13+Q14S14.

/*****   例4 計算その3   SUMを使っても上記と同じになる  *****/
/*****    はじめに新変数としてPROP2   を設定している        *****/
COMPUTE      PROP2   =SUM(Q14S01 to Q14S14).

/*****   例5  財産カテゴリーの作成 上の例の続きで       *****/
COMPUTE      ZAISANCT=PROP2.
RECODE       ZAISANCT (0 thru 4=1)(5,6,7=2)(8,9=3)(10,11=4)(12,13,14=5).


FRE VAR=ZAISANCT.


/*****    例6 変数の逆転                  *****/
/*****       問6の値1234を4321に変換       *****/
/*****    重回帰分析の前に変数の向きをそろえると良い   *****/
/*****    逆転の前に必ず欠損値処理をすること           *****/
COMPUTE      OTOKOSO=5-Q6A.
COMPUTE      YARITA =5-Q6B.
COMPUTE      DENTO  =5-Q6C.

COMPUTE      KOKUMIN=5-Q6H.

COMPUTE   MURYOKU = YARITA+KOKUMIN .


/*****    以下によりうまく新変数ができているか確認する    *****/
CRO
  /TAB= OTOKOSO BY Q6A .


/*****    相関係数(r)を出す  *****/
CORR
 /VAR =OTOKOSO Q6A Q4.


CORR
  /VARIABLES= Q6A AGE Q6C
  /PRINT= NOSIG
 .

/*****   相関係数を出す前に、分布を確認すること  *****/
FRE VAR = Q6A AGE Q6C.


/*****    例7 問7Aの値1〜5を 100〜0に変換   *****/
COMPUTE         YUONEGAI=Q7A.
RECODE          YUONEGAI (1=100)(2=75)(3=50)
                      (4=25)(5=0) .
MISSING VALUES  YUONEGAI (9).


/*****  例8 ダミー変数作成 0,1の変数を作る        *****/
/*****        この例では自営なら1、そうでないなら0    *****/
COMPUTE       JIEI    =0.
IF (Q19BS2=6) JIEI    =1.


COMPUTE       SENMON  =0.
IF (Q19DS2=5) SENMON  =1.
IF (Q19DS2=6) SENMON  =1.


/*****  例9 学歴を教育年数に変換                     *****/
COMPUTE         EDU=Q16.
RECODE          EDU(1=6)(2=9)(3=12)(4=13)(5=14)(6=16)(7,9=99).
MISSING VALUES  EDU (99).


/*****  例10 年齢変数AGE を作成  *****/
COMPUTE          AGE = 71-Q1NEN.
IF (Q1GETU < 5)  AGE = AGE+1.


/*****  例11 変数AGE をもとに、新変数として NENDAI を設定し、       *****/
/*****  20〜70までの51段階の年齢を、2から6までの5カテゴリーに合併   *****/
COMPUTE      NENDAI  =AGE.
RECODE       NENDAI(20 THRU 29 =2)(30 THRU 39 =3)(40 THRU 49 =4)
                   (50 THRU 59 =5)(60 THRU 70 =6) .


/*****  以下のように書いてもよい  *****/
/*****  TRUNCは引数の小数点を切り捨てる関数  *****/
/*****  この例は、年齢を10で割り、小数点以下を切捨てとなる  *****/
  COMPUTE NENDAI = TRUNC (age / 10).


/*****  例12 計算                             ******/
/*****  かけ算は* わり算は/  で表す   ******/
COMPUTE      SEINEN=Q1SEX*10+NENDAI.

COMPUTE living= age-q11.
COMPUTE livrate= living/age.


/*****  例13 標準得点の作成                   ******/
/*****  記述統計の分析で、SAVEコマンドを使う   ******/
/*****  以下の例ではQ4を標準化し、新変数ZQ4ができている******/
/*****  データウィンドウの最後にZQ4ができている******/
DESCRIPTIVES
  VARIABLES=Q4  /SAVE
  /STATISTICS=MEAN STDDEV MIN MAX .


/*****  例14 標準得点を平均値50になおす                        ******/
/*****   上記のZQ4 は平均0、分散1の変数(Z得点)である。      ******/
/*****   いわゆる偏差値(平均が50になる得点)にしたいときは、以下のように******/
/*****   10倍してから50を足せばよい            ******/
COMPUTE      NZQ4 =ZQ4*10+50.


/*****  例15  COMPUTE文でダミー変数を簡単につくる           *****/
/*****   COMPUTE文は右辺が計算式と条件式とで機能が異なる。  *****/
/*****  「COMPUTE 新変数名 = 条件式」で条件に適合するとき1、*****/
/*****  それ以外のとき0を割り当てる。                       *****/

/*****  「主婦」ダミー変数をつくる  *****/
  COMPUTE shuhu = q19bs2 = 1.

/*****  「支持政党あり」ダミー変数をつくる  *****/
  COMPUTE n10 = q10 <= 8.


/*****  例16  RECODE文で一気に複数の新変数をつくる                       *****/
/*****  新変数名の末尾を数字にすれば、自動的に連番の変数をつくってくれる *****/
  RECODE q6a to q6n (1,2 = 1)(3,4 = 2) INTO n6_1 to n6_14.               *****/




/*****  例17  相関係数を出す                    *****/
COR
  /VAR =q6a q6b q6c q6d .


/*****  例18  重回帰分析                        *****/
/*****    Q6を被説明変数とした例                *****/
REG
  /DEPENDENT Q6A
  /METHOD=ENTER age edu property Q8A.


/***** 例19  値ラベルの貼り付け 複数の変数を処理する時はtoを使う *****/
VALUE LABELS
 Q1SEX  1 '男' 2'女'
/Q2   1 '満足している'         2 'どちらかといえば満足'
      3 'どちらかといえば不満' 4 '不満である'  9 'わからない'
/Q3   1 '公平だ'   2 'だいたい公平だ'   3 'あまり公平でない'   4 '公平でない'
      9 'わからない'  .
/Q27A  TO   Q27H   1 '重要である' 2 'やや重要である' 3 'あまり重要ではない'
                4 '重要ではない' 9 'わからない'
.


/***** 例20  変数ラベルの貼り付け *****/
VARIABL LABELS  Q16 '本人学歴' 
 /Q33A'子どもには高い教育がよい' /Q33B'子どもには塾がよい' 
 /Q35A '性別役割女は家庭を守る'  /Q35B '性別役割男女は違った育て方'
 /Q36 '生活水準変化' /Q37 '生活満足感' 
 .




/***** 例21  変数の数をカウントしたり、変数情報を出すには *****/
/*****   シンタックスで                                   *****/
DISPLAY DICTIONARY.

/*****   と書き実行。                                     *****/
/*****   もしくは、画面上「ユーティリティ」をクリックし「ファイル情報」*****/



/***** 例22  シンタックスにより欠損値を除く処理     *****/
/***** AMOS使用の前に欠損値のないデータを作る *****/
/*****   場合など  問4の欠損値が9ならば9を除けばよい *****/
/*****      ne  は  not equal       *****/
/*****   回答が9の人がデータから削除され人数が減る *****/

select if q4 ne 9.
SELECT IF edu ne 99.

/***** あるいは回答が1から4で欠損値が9の場合は以下でもよい *****/

select if q5 <5.




/*****   その他の例          *****/
/*****            *****/
/*****            *****/



/*****  職業8分類 新変数 JOB8  を作成          *****/
/*****   初めは、JOB8 の中身は全員9としている  *****/
/*****   それを後で他の値に変えている           *****/
COMPUTE        JOB8=9.
IF (              Q19DS2=5 OR Q19DS2=6           ) JOB8=1.
IF (              Q19DS2=1                       ) JOB8=2.
IF (Q19CS2>5 AND (Q19DS2=2 OR Q19DS2=3       )) JOB8=3.
IF (Q19CS2>5 AND (Q19DS2=4                   )) JOB8=4.
IF (Q19CS2<6 AND (Q19DS2=2 OR Q19DS2=3       )) JOB8=5.
IF (Q19CS2<6 AND (Q19DS2=4                   )) JOB8=6.
IF (              Q19DS2=7                       ) JOB8=7.

VALUE LABELS
  JOB8  1 '専門' 2 '管理' 3 '大W' 4 '大B' 5 '中小W' 6 '中小B' 7 '農業' .




/*****  総合職業分類  新変数SJを作成                            *****/
/*****  問19B、C、Dを使って11種類の職業大分類を作る        *****/

/*****  新総合職業分類については                                *****/
/*****  安田・原『社会調査ハンドブック』p88参照                 *****/
/*****  職業の4次元はp87参照                                   *****/
/*****      産業、従業先の規模、狭義の職業、従業上の地位        *****/
/*****      その他に、課長、部長などの役職も場合によっては重要  *****/
/*****      普通、課長以上を管理職とする                        *****/

COMPUTE        SJ=10.
IF (Q19CS2>5 AND (Q19DS2=2 OR Q19DS2=3          )) SJ=5.
IF (Q19CS2>5 AND (Q19DS2=4                      )) SJ=6.
IF (Q19CS2<6 AND (Q19DS2=2 OR Q19DS2=3          )) SJ=7.
IF (Q19CS2<6 AND (Q19DS2=4                      )) SJ=8.
IF (              Q19DS2=1                       ) SJ=4.
IF ( Q19BS2=6 OR Q19BS2=7                        ) SJ=1.
IF ((Q19BS2=6 OR Q19BS2=7) AND Q19DS2=4          ) SJ=2.
IF (              Q19DS2=5 OR  Q19DS2=6          ) SJ=3.
IF (              Q19DS2=7                       ) SJ=9.
IF (Q19BS2=2                                     ) SJ=11.

VALUE LABELS SJ   1 '自営ノン'  2 '自営マニ'  3 '専門'   4 '管理'  
 5 '大W'   6 '大B'  7 '中小W' 8 '中小B' 9 '農業'  10 '無職' 11 '学生'.


/*****   上記の職業カテゴリーごとに平均値を出す    *****/
ONEWAY
   Q6A Q6B edu BY sj(1 15)
   /STATISTICS DESCRIPTIVES
   /MISSING ANALYSIS .





/*****  ★その他詳しくは se97v1.sps内の、新変数作成の部分を参照      *****/


 


 

4.職業コウディングの解説

 
 社会学において、職業は極めて重要である。職業が社会的地位と役割分業の2つを表しているからである。巨大な現代社会においては、多くの役割分業があり地位があるが、これらを捉えることは難しい。調査において適切に職業をきくことは難しいのである。職業と産業を間違えている調査や、不適切な質問文もたくさんある。例えば職業の回答が「銀行」のみだった場合、銀行で事務をやっているのか守衛なのか管理職なのか、本人の仕事内容は何も分からないことになる。以下をよく理解して、適切に職業を把握できることが、社会調査の基本として極めて重要である。
 統計的社会調査では、○つけ型回答(事前に選択肢の数字が決まっているプリコウディング)で質問することが大半である。しかし職業に関しては事情が異なる。職業を正確に把握するには、自由回答形式の問にして、後で調査者が数字か記号をつけ分類する(コウディングをする)ことが必要なのである。○つけ型の問だと、専門職や事務職が多くなりがちになるなど、回答に偏りが起こるし、本人が実際に何をやっているのか不明なことも多いからである。コウディングを正確に行うことは重要だが、職業分類とコウディングのルールをよく理解しないと正確に分類できないので注意が必要。

2.1.基本的方針
 職業については、年齢、学歴、従業先規模などの情報も使い、総合的に判断してコウドを決めることが重要。
 とくに、販売と修理、など2つの仕事内容がある場合に注意。技能が高い方を優先してコウドを決める。
 以下の職業の4次元をよく理解した上でコウドを決める。
 
2.2.職業の4次元
 安田・原『社会調査ハンドブック 第3版』によれば、4次元とは、

・産業(金融業、小売業、製造業など、従業先組織の分野)
・従業先の規模
・従業上の地位
・狭義の職業(本人の仕事内容)

の4つ
である。その他に組織内での役職も質問することが多い。対象者の職業を正確に把握するためには、これら5つについて質問項目を設けなくてはならない。『社会調査演習 第2版』の巻末の調査票見本を参考にすること。とくに職業コウディングは、本人の仕事内容についての自由回答を、正確に分類することが重要である。あくまでも、本人が何をやっているかを判断して、コウドすること。

 例えば「コンピューターの会社で事務をやっている」という回答は、一般事務のコウドとなる。実際に本人がやっている仕事内容をもとに職業コウドを決めること。
 従業先規模は、営業所や支店の人数でなく、会社全体の人数となる。町役場などの小さい役所も、国全体とつながっていることを考えると大きいので、他の公務員と同様に扱う。
 また、年齢や学歴その他の情報も十分に生かして、総合的な判断をすることが重要である。
 
2.3.職業コウドの具体的注意点
1)職業が2つある場合
 『社会調査演習 第2版』コウディングの注意点 とくにpp.105-をよく読む。
 基本的に、技量がより高度な仕事の内容を優先してコウドする。例えば、調理と販売の場合、販売は比較的簡単で誰にでもできると考え、調理を優先してコウドする。修理と販売も、同様に修理を優先する。
 
2)管理職について 小分類コウドを決める場合
 課長以上が管理職となるが、仕事の内容を見て判断する。とくに従業員数30人未満の場合は注意する。人間の管理をしているならば管理職だが、小規模なところで、肩書きは管理職だが、実際の仕事内容は、販売を主にやっているような場合も多い。その場合は販売とする。これは前述のように総合的に判断し、コウドを決める。
 ただし、本人の回答が管理職ならばそのままコウドし、後で、分析ソフト上で修正することも多い。コウドの方針を明確に決めなくてはならないが、調査によりまちまちとなっていることが多い。これが職業コウディングの大きな問題である。その他、注意点は『1995年SSM調査コード・ブック』pp.112-114を読むこと。
 
SSM調査での方針
 経営者と自営 85年では、規模が30人以上のみを経営とした。95年は、本人の回答内容を生かしてコウドした(後で分析ソフト上で修正できるので)。
 
一般的な注意点
 経営か自営かは本人の回答内容を生かしてコウドする
 規模が30人以上で役職が課長以上なら管理職550
 専門職の管理職は、専門職となる。病院長や校長は管理職ではない。
 
3)技術者
 自動車修理や整備などの技術者は、専門職の技術者でなく、技能工、作業者となる。職業分類での専門職とは、おおむね短大や高専卒以上の学問的知識を必要とする職業のことである。その意味で看護婦や保育士も専門職である。宗教家は、多くの場合、地域での知識階層であり専門職である。
 熟練とは、伝統工芸などの職人のことを言うことが多い。
 
4)現場監督
 自営業主の場合   678土木・建築請負師
 非自営で大卒の場合 504建築・土木技術者
 上記以外      684現場監督,その他の建設作業者
 
5)557営業・販売事務員
 商品を直接売買するもの、外交活動を行なうものは含まないので注意。
 
6)公務員
 本人の仕事内容で判断。事務ならば事務のコウドとする。ただし警察や自衛隊はすべて593自衛官や 594警察官のコウドとする。なお国鉄や公社など現業の産業コウドは、公務ではなく民間産業と同様のコウドとする。
 
7)飲食店で店長や管理
 人の管理を主にしているならば管理職コウドだが、本人が調理もしている場合は、568飲食店主や581料理人。本人の仕事は接客が主であれば583給仕係。
 
2.4.分析時に用いる職業大分類
 職業小分類は、300以上に分けることができるが、実際のクロス集計では、8前後の分類を使うことが多い。ただし、どの分類が決定版かは、とくに定説はない。研究者の目的に応じた、さまざまな分類が使われているのが実情である。つまり、日本社会をいくつの職業階層に分けるかについて定説はない。最近は、以下の3)SSM職業新8分類が使われることが多い。だが2bの方が、管理職というカテゴリーが明確にあり使いやすいかもしれない。以下を参考に、自分の分析に適した分類を使うとよい。

1)日本標準職業分類の大分類(『社会調査演習』2.5 p.103参照)9個 − 社会学の実際の分析ではあまり使われない


2)SSM総合職業分類  12分類(簡略版は9分類)
 − 安田・原.『社会調査ハンドブック 第3版』pp87-89や、『SSM産業分類・職業分類95年版』p.105 を参照


a 12分類
   1 '自営ノンマニュアル'  2 '自営マニュアル'   3 '専門'  4 '管理'  5 '大ホワイトカラー' 
      6 '中小事務'  7 '中小販売'    8 '大熟練'    9 '大非熟練'
      10 '中小熟練' 11 '中小非熟練' 12 '農業'     96 '無職'     98 '学生'


b 簡略版9分類
      1 '自営ノンマニュアル'  2 '自営マニュアル'  3 '専門'   4 '管理'      5 '大ホワイト'
      6 '中小ホワイト'  7 '大ブルーカラー' 8 '中小ブルーカラー' 9 '農業' 
     96 '無職' 98 '学生'


3)SSM職業新8分類 −SSM調査報告書1巻の巻末pp200-201や、原・盛山『社会階層』の巻末用語解説等に解説がある
      1 '専門'  2 '大W'       3 '小W'       4 '自営W'     
                5 '大ブルー'   6 '小ブルー'   7 '自営ブルー'   8  '農業' 
               96 '無職'      98 '学生'


4)SSM職業大分類の旧8分類 −SSM調査報告書1巻の巻末pp200-201に解説がある
    従業先規模や従業上の地位などを考慮しない単純な分類であり、最近はあまり使われない。
      1'専門' 2 '管理' 3 '事務' 4 '販売' 5 '熟練' 6 '半熟練' 7 '非熟練' 8 '農林'
     96 '無職' 98 '学生'


5)国際比較で比較的よく用いられる職業分類EGPカテゴリー −『日本の所得格差と社会階層』pp.108- 参照
 エリクソン、ゴールドソープ、ポルトカレロによる6分類。欧米では有名なEGP分類。
 専門管理が多くなりすぎ、自営が1カテゴリーになるなど問題がある分類のため、日本ではあまり用いられない。
 ここでいう上層ホワイトカラーは、専門職と管理職だが、日本の管理職よりも定義が広い。例えば事務職でも部下が
いれば管理となる。また高度な事務職は専門職となるが、日本の事務職は欧米より仕事の範囲が広く高度な仕事も
しているため、多くが上層ホワイトカラーとなる。
 農業を自営農業と農業労働者にわけて7分類としたり、さらに細かく分類することもある。
      1 '上層W'  2 '下層W'       3 '自営(非農業の自営業主)'       4 '農業'     
                5 '上層ブルー(熟練工)'   6 '下層ブルー(半熟連と非熟練工)'
               96 '無職'      98 '学生'



 なお、大企業は従業員数300人以上、中小企業は300人未満とすることが多い。
 また、ノンマニュアルとは、専門、管理、事務、販売職、マニュアルとは熟練や労務作業者など
いわゆるブルーカラーである。マニュアルを読む職業という意味ではなく、英語のmanual workerと
いう意味である。

 自分の分析目的に応じて、適切な分類を使うとよい。少人数となるカテゴリーが多いと、分析時に
問題であろう。何が適切かは、分析結果を見つつ、よく考えるとよい
 日本のデータを分析する際は、総合職業分類を簡略化したもの(2-b)か、SSM新8分類(3)が使いやすいだろう。
これは分類が細かすぎず、かつ自営かと、企業規模を考慮しているという点で適切な分類である。


以下は過去の内容

分析法について追記

1)分析で用いる職業分類については、以下の職業コウディングの解説をよく読むこと。

2)重回帰分析をやる時は、必ず事前に欠損値処理をすること。また、新変数を作り、変数の方向をそろえること。
 また、男女や一人暮らしなど、0、1型の変数(ダミー変数)を作ると良い。やり方は「4.シンタックスの解説」を見てください。

  SSJデータアーカイブ

  相関係数と散布図 アニメ

  職業の自動コーディングについて

  エクセルで散布図作成

  日本人の国民性調査

  社会階層と社会移動全国調査 SSM調査

  SSP調査

  NHK 国民生活時間調査


★都道府県の魅力度ランキングなど、無作為抽出をしないネット調査の結果は非科学的でまったくデタラメです。結果を信用してはいけません。あのような調査を取り上げるマスコミも問題です。


分析法の種類

1)被説明変数と説明変数を設定するもの  −分散分析、重回帰分析、ロジスティック回帰分析、ログリニア分析、HLM、エラボレイション等

2)とくに設定しないもの  −因子分析、クラスター分析、数量化3類、MDS等

 1)と2)を組み合わせたもの −構造方程式モデル(共分散構造分析)等


 

5.その他資料

  S7hyo.pdf  仙台調査の調査票(PDF)


5-1 1998年仙北調査 分析用SPSSシンタックスとデータ(2つともテキストファイル)


  Senp98.sps  SPSSシンタックス

  Senp.txt   練習用データ

 これら2つのファイルを、各自で保存してください。

 SPSSを用いて分析するときは、SPSSシンタックスとデータの2つのファイルを用います。この2つのファイルのデータがあれば、多変量解析が簡単にできます。シンタックス内を見てください。前半はデータの定義文、後半が分析のための命令文になっていることが分かると思います。

★分析の前に、シンタックス内のデータ位置指定の部分を、各自で書き換えてください。例えば、データファイルがHドライブにある場合は、C:\でなくH:\と書きます。フロッピーの場合はa:\です。各自で書き換え、必ずテキストファイル形式で保存してください。


  Senp98b.sps  SPSSシンタックス(発展版)

 このシンタックス内には、さまざまな新変数作成の例文があるので、興味がある人は参考にしてください。

  S8hyo.pdf  仙北調査の調査票(PDF)



  その他の資料(社会調査法ページ)


5-2 SPSSクロス集計のこつ

 データを読み込んだ後、分析→記述統計→クロス集計をクリック。
1)変数を選ぶ。
 「セル」ボタンを押し、列%などを選ぶ。
 「統計」ボタンを押し、カイ二乗や相関係数やファイ係数を選ぶ。変数が3カテゴリー以上の時は、クラマーのV(質的変数)、タウC(量的変数)を選ぶとよい。
2)「貼り付け」ボタンを押すと、シンタックスの見本が出る。
 関連係数は、有意水準が0.05未満なら、統計的に有意と考えて良い。

★クロス集計表の形式は、『社会調査演習』のエラボレイションの表をまねすれば良い。
★3重クロス集計のシンタックスを書くときは、一番最後にtにあたる変数を書くと良い。シンタックスの中で、変数を書く順番にご注意。


 表内の各変数の位置は、出力画面で、表をダブルクリックしてアクティブにした状態で、画面上の「ピポット」をクリックして入れ替えを選べば、移動できる。

 重回帰では、変数の値は細かい方が良いが、3重クロス集計は、2か3カテゴリーに合併してから行った方が良い。あまり細かくすると人数の少ないセルができるので。

5-3 ワードやエクセルでの図や線の書き方

 ワード画面上の「罫線」をクリックすると表になってしまうので、線だけを引きたいときは以下のようにする。

・ワードの画面上「表示」をクリック
・ツールバーや図形描画、またはオートシェイプを選ぶ
・画面下に線や矢印のボタンが表示されるので、ボタンを押して線をかく。
 書いた図を微調整したいときは、書いた線や図を右クリックして書式設定を選ぶ。線の太さや矢印種類などを変更できる。その他、画面下の「オートシェイプ」ボタンを押し、曲線などを選ぶとよい。曲線を書くのを終えるときはダブルクリックする。曲線を書いた後、右クリックして書式設定を選ぶと、線種を変えたり、矢印などにすることができる。

 詳しくは重回帰の資料の最後の方を参照。二乗などの、小さい2を書きたいときは、2を書いてからマウスで選んで右クリックし「フォント」を選ぶ。「文字飾り」の中の上付ボックスをチェックする。

 ワード画面内にエクセルの表を貼るときは、ワード画面上の「挿入」をクリックし、オブジェクトを選び、エクセルワークシートを選ぶ。

 エクセルで単純に直線を引くだけならば、線を引きたいセルをマウスで選び(またはシフト+矢印キー)、その後、画面上「書式」をクリックし、セルの書式設定を行い、罫線ボタンを押しても良い。

 


 

6.参考書

テキスト
原純輔・海野道郎. 2004. 『社会調査演習 第二版』東京大学出版会. ISBN 4130520199.
参考書 ★は村瀬による解説 ボーンシュテット・ノーキ著=海野道郎・中村隆監訳.1990.『社会統計学 −社会調査   のためのデータ分析入門』ハーベスト社.  ★社会統計学の入門書として分かりやすい 原純輔ほか編.2000.『日本の階層システム』1〜6巻.東京大学出版会.  ★日本の3大社会調査の1つであるSSM調査の最新成果をまとめた本 林拓也. 2024. 『社会統計学入門〔三訂版〕』放送大学教育振興会. 神林博史・三輪哲. 2024. 『社会調査のための統計学: 生きた実例で理解する〔改訂新版〕』技術評論社. 井上文夫・井上和子・小野能文.1991.『よくわかる社会調査の実践』ミネルヴァ書房. 井上文夫他編.1995.『よりよい社会調査をめざして』創元社.  ★郵送調査の具体的な実施法の記述は分かりやすい。 狩野裕.1997.『グラフィカル多変量解析』現代数学社.  ★共分散構造分析の解説書。AMOSやEQSの操作法が分かりやすい。 栗田宣義編.1996.『メソッド/社会学』川島書店. 栗田宣義編.1998.『データブック/社会学』川島書店.  ★戦後日本の代表的な社会調査データについて解説。 村瀬洋一他編. 2007. 『SPSSによる多変量解析』オーム社. ISBN 4274066266.
内閣総理大臣官房広報室編『世論調査年鑑 : 全国世論調査の現況』大蔵省印刷局.  ★日本でどのような調査が行われたかの報告書 毎年発行 直井優編.1983.『社会調査の基礎』サイエンス社.  ★少し古いが社会調査法についてよくまとまっている。 直井優他編.1990.『現代日本の階層構造』第1〜4巻.東京大学出版会. 西田春彦・新睦人編.1976.『社会調査の理論と技法 −アイディアからリサーチへ』   川島書店. NHK放送文化研究所世論調査部編.1996.『世論調査事典』.東京: 大空社.  ★調査の紹介、調査手法について詳しく記述がある。倫理、著作権についても記述がある。 大谷信介他編.2023.『最新・社会調査へのアプローチ: 論理と方法』ミネルヴァ書房.
佐藤郁哉.1992.『フィールドワーク −書を持って街へ出よう』新曜社. 盛山和夫. 2004. 『社会調査法入門』有斐閣.
谷岡一郎.2000.『「社会調査」のウソ −リサーチ・リテラシーのすすめ 』文芸春秋.  ★調査の実態や問題のある調査について、具体例を挙げて説明。わかりやすい新書。 轟亮・杉野勇・平沢和司編,2026,『入門・社会調査法: 2ステップで基礎から学ぶ・第5版』法律文化社.
統計数理研究所国民性調査委員会編.1992.『第5 日本人の国民性』出光書店.  ★日本の3大調査の1つである国民性調査結果 辻新六・有馬昌宏.1987.『アンケート調査の方法 −実践ノウハウとパソコン支援』.   朝倉書店. 渡部洋編.1988.『心理・教育のための多変量解析法入門 基礎編』福村出版.  ★分析法について、初心者向けに分かりやすくまとまっている。 山際勇一郎・田中敏.1997.『ユーザーのための心理データの多変量解析法』教育出版.  ★初心者向けに、SASによるさまざまな多変量解析法を分かりやすく解説している 安田三郎・原純輔.1982.『社会調査ハンドブック(第3版)』有斐閣.  ★同様のタイトルの本は多数あるが、この本が内容的にもっとも整備されている。ただし、改訂が繰り返されてはいるが、もはや少し古い部分がある。 安田三郎・海野道郎.1977.『改訂2版 社会統計学』丸善. 1995年SSM調査研究会.1998.『1995年SSM調査シリーズ』第1〜21巻.1995年SS   M調査研究会.  ★1995年SSM調査の報告書論文集。日本の社会階層研究に関する最先端の研究成果が掲載されている。
 文献リストを作る時には、著者名と発行年(半角数字)をまず書くこと。著者名のアルファベット順に並べること。


 

7.調査実施時の注意点

 企画書を作り、質問項目を作り、サンプリングを行い、関係部署に挨拶し、予備調査を実施した後、調査票を完成させれば、調査準備は完了である。調査準備として何が必要か、具体的に書いていない調査法のテキストは、実は多いのである。本を読んでも、どうすれば高回収率でかつ歪みの少ない、適切なデータを得られるかは、分からないだろう。ただ『社会調査演習』の巻末資料には、「調査員の手引き」見本がある。具体的で参考になるので、見てみるとよい。

 回収率を上げるためには、とくに以下のことに注意すること。
 1)事前に対象者へお願い状を送る
    対象者の選び方、調査主体、調査の意義等を丁寧に説明。対象者の選び方を詳しく書かないと、なぜ住所を知ったのか、という苦情電話がたくさんくる。
    白やクリーム色の紙に角印を押し、固い文書だと印象がよく信用がある。
    できれば手書きで数行、書き添えると良い。
    大学の封筒で、連絡先をきちんと書き、インチキ調査でなく、調査主体が大学だということを分かってもらえるように。
    電話の他、Eメールやホームページアドレスを書いても良い。
 2)調査員配置
    賃貸アパートが多い場所や、土日の夜は、調査員を多めに配置する。
    できれば男女1組で。女性は郊外の安全な住宅地が良い。
 3)調査員への指示
    不在のお宅には、繰り返し何度も訪問することを徹底させる。
 4)調査本部を設置
    調査員へ連絡、苦情受け付け、事故待機、現場を巡回。
    何人かで調査現場を巡回し、調査員の様子を見て励ますとよい。


8.調査結果のデータ入力について

  ★データ入力資料の例PDF

  データ読み込みシンタックスの例

 調査が終わったら、結果を数字のテキストファイルにすれば、SPSSなどの分析ソフトで簡単に分析できる。

 以下の例のように、半角数字のみを入力する。数字のみを入れる方法だと、エクセルやSPSSのセルに直接数字を入力するのと 比べ、半分以下の時間ですむ。詳しくは上記「データ入力資料の例PDF」を読むこと。

8.1.基本的な作業内容
 回答の数字を入力。ただし半角数字のみを入れる。余計な空白、とくに全角空白や余計な改行は入れないよう注意。その点に注意すれば、とくに難しいところはない。
 改ページごとに半角空白を1つ入れる。分かりやすくするためでとくに意味はないが、ケタずれを発見しやすくなる。
普通、11地区の1番目の人は1101にするなど、調査票にサンプル番号を書いておき、その順番で入力する。

データの形式見本(2人分)

1101 32400232 10100011 110113110 22099 9621 4317
1102 13101421 11212111 121114112 12299 9631 4317

 この例だと、1行目はじめの4桁はサンプル番号1101。その後、1つ空白をあけて、問1で3、問2で2、問3で4と答えている。
 なお、1人のデータが2行以上になる時は、適当に左端あたりに空白を入れて、右端か、どこかの空白ががそろうようにするとよい。そうすれば、
データチェックの時に、ケタずれがないかどうか見やすい。



8.2.その他注意点
・複数回答項目(Multiple Answers)は、○がついているものは1、ついていなければ0と入力
  例えば、問11の中に項目1から7まであり、234に○の場合、0111000 と入力
・無回答は9または99を入力
・ワードやメモ帳など何で入力しても良いが、保存時は「テキストファイル形式」(MS-DOS書式なし形式)で保存する。
 保存時に「名前をつけて保存」を選び、「ファイルの種類」(保存形式)ボックスをクリックして形式を選択する。
 ワードを使う場合、MSゴシックなどの等幅フォントを使うこと。上記「データ入力資料の例」PDFファイル参照。
 メモ帳や秀丸エディターなどのソフトを使って、半角テキストのみ(書式なしテキスト形式ファイル)を保存するのが良い。


8.3.データクリーニングについて
 入力が終わったら、数字の打ち間違いがないか確認してミスを修正する(データクリーニング)。

もっとも確実なデータクリーニング法は、2回データを打ち込み2つのデータファイルを作ることである(ダブルインプット)
という。アルバイトを2人雇って入力すると良いだろう。そしてファイル比較ソフトを使い、2つのデータファイルの
異なる部分を探す。異なる部分は入力ミスである。

その後、異なる部分を修正した第3のファイルを作ればよい。以下のようなファイル比較ソフトを使うこと。「ちゃうちゃう」
というソフトは、異なる部分を文字単位で比較した結果を出してくれるので使いやすい。

ソフトを動かす前に、まずケタずれがないかチェックするとよい。すべてのデータの行末や空白位置が
そろっているかどうか注意。各行の右端の位置がすべて同じならよい。データの最後に
余計な空白や改行マークがないかも調べる。また、途中で空白行などがあるとよくない。

 全角スペースが入っているとエラーになるので注意。半角スペースのみとする。MSワードや
エディターソフトの検索機能を使い、全角スペースがないか確認すればよい。

ファイル比較ソフトfilecomp  maka氏作 2つのテキストファイルを比較

ファイル比較ソフトちゃうちゃう 無料ダウンロード

ファイル比較ソフトちゃうちゃう 無料ダウンロード


あるいは2人1組で、調査票の数字を読み上げ、ファイルの数字と合っているか確認してもよい。読み上げソフトを使ってもよい。
しかしこの方法だと、当然ながら作業する人の集中力によるので、ミスを完全になくすことはできない。

 データファイルが完成したら、SPSSやSASのプログラムを書いて分析する。応用調査実習やSPSSホームページなどを参照。
見本のSPSSシンタックスを見てデータ定義文を書くと良い。


8.4.データ読み込み命令文について
 データファイルが完成したら、SPSSやSASのプログラムを書いて、分析する。
 SPSSシンタックスのデータ読み込み命令文については、上記の3を参照。基本的に、
データのケタの説明を書けばよいだけである。つまり以下のようなシンタックスを書く。
上記のデータの形式見本(2人分の数字の例)は、1-4桁目がID番号、5桁目は空白、6桁目が問1、7桁目が問2、8桁目が問3
という例。以下のように、シンタックスに桁を書けばよい。問の名前(変数名)は調査票に合わせて自由につければよい。変数によって1桁の
ものと2桁のものがある。

DATA LIST FILE='C:\foldername\abcdat.txt' NOTABLE RECORDS=1 FIXED
   / ID 1-4 Q1 6 Q2 7 Q3 8 Q4A 9 Q4B 10 Q4C 11 Q5 12-13 Q6 15 Q7 16


つまり、シンタックスとテキストファイル形式データの、2つのファイルが必要となる。以下の見本を参考に2つを作ればよい。
シンタックスは、一見難しそうに見えるが、例を参考に書き換えて書けば簡単である。まず、1人分のデータを打ち込み、
その後、それを参考にシンタックスを書けばいい。エクセルやSPSSのセルに直接入力するよりも、はるかに早く入力できる。
なお、1人のデータが2行ならば、RECORDS=2 と書いて、スラッシュが2カ所つく。


   ★データファイルの見本
     2人分のデータ。1人が2行の場合の例。

   ★シンタックスファイルの見本
     1人のデータが2行の場合、RECORDS=2と書く。


あなたは2009年06月03日以来 回目のアクセスです。


目次に戻る


All Rights Reserved, Copyright(c), MURASE,Yoichi