実際の生きている社会からデータを取り、初心者でもデータ分析をする達人になれる科目(*^.^*)
調査の企画から報告書作成までの社会調査の全過程を実際に行いながら学習する。社会調査の一連の過程を理解し、前期はその前半部分(調査の企画、仮説構築、調査項目の設定、質問文作成、対象者の選定、調査実施、収集されたデータの点検)までを行えるようになる。
実習形式のため、PC教室にて全回対面で行う。社会調査を設計するにあたり、質問項目を考えるための課題を課し、各自が質問項目案を発表し、それにより授業を進めていく。MSエクセルや、各種のデータ分析ソフトを用いたデータ分析を活用する。また、データ収集やデータ分析のために、授業時間以外にも調査活動を行う。
自分が作ったファイルを保存する時は、ドライブに、IDは大学のメールアドレス、パスワードでログインすること。
★文献や統計リンク ここをクリック
文献リストを作る時は、国会図書館の雑誌記事索引、Cinii, Google Scholar, JSTORなどを活用してください。必ず、冒頭で著者名と発行年(半角数字)を書くこと。雑紙タイトルやページ数が分からないリストにはしないよう注意。
Windowsの the latest-release の部分を見る。debug install でなく普通のinstallをクリックして自分のPCに保存する。保存後に、そのファイルをダブルクリックすれば良い。the most recent nightly build のファイルは最新版だがやや未完成で不安定なバージョン。
|
その他参考資料 SPSS AMOSについて
|
1.1.目的 ・統計的社会調査の実施能力を習得 ―自分で本格的な調査を実施できるように ・科学的なデータ分析能力を身につける ―直感や印象での分析でなく とくに以下の内容を重視します 無作為抽出のやり方 よい質問文の作り方 社会調査は、大きく2つに分類すると、統計的調査と記述的調査に分かれます。 この科目では、本格的な統計的社会調査の実習を行います。 1.2.主な内容 ・科学的な無作為抽出のやり方 −母集団が不明な、ばらまき調査は意味がありません ・よい調査票の作り方 −あいさつ文や質問文によって、回収率は大きく変わります ・データファイルの作成法など −データ行列とは何か ・適切なデータ分析法 −調査したけど分析せず、とならないよう RやSPSSやSASなどの統計分析ソフトを用いた統計分析については、この科目では時間の 都合上、基本的なことのみを行います。分析法は、データ分析や統計学関連の科目でしっかり学んでください。 社会調査法についてはこれまでの講義内容を復習し、『社会調査演習』第1章か、以下のページを見てください。 社会調査のページ 1.3.日程 前期 ・調査法概要、仮説構築法、コウディング実習 ・データ分析ソフトを用いた多変量解析 後期 ・無作為抽出法 ・尺度構成法 ・調査票作成と実査(実際に統計的調査を行う)
2-1 SPSSデータ画面 SPSSは、データ、シンタックス(分析命令文の簡単なプログラム)、出力画面の3つの画面からなる SPSSを起動すると、まず空のデータ画面が出てくる(以下はデータビューの例)。図1. SPSSデータ画面の例 ・300人分のデータなら300行ある。 ・画面下の「変数ビュー」を押すと変数の説明画面になる。 ・「分析」をクリックすると各種分析ができる。 分析の前に準備すべきファイル ・テキストファイル形式のデータ(拡張子はtxtかcsvが多い) ・SPSSシンタックス(命令文、プログラム、拡張子sps) この2つがあれば、SPSS形式データファイル(拡張子savとつくもの)を作成できる。 要するに、SPSSでまず初めに使うファイルは3種類あることを理解すること。 最初の2つ(あるいはsavのファイル1つだけ)があれば分析結果を出すことができる。分析結果のファイルはまた別に保存する。 savのファイルの代わりに、por(古いSPSS形式データファイル)やxls(エクセル形式)ファイルなども、SPSSではデータとして使うことができる。 エクセルでデータを作った場合は、最初の1行を変数名にすること。変数名は半角英数字8文字以内にするとよい。 シンタックスウィンドウを出す時は、 SPSS画面上「ファイル」をクリック→ 新規作成 →シンタックス。 以下は無料ソフトPSPPの画面例。
図2. 新規にシンタックスを開く 2-2 シンタックス作成時の注意点
・全角空白を入れてはいけない。全角のかっこやピリオドも不可。 ・命令文の文末には必ずピリオドつける。また、それ以外に余計なピリオドを付けない。 ・フォルダ名、ファイル名、変数名を半角文字で正確に書く(Cドライブのrensyuフォルダなど)。 ・全角文字は、ラベル以外では使うことはできない。 とくに、シンタックスの途中で余計な全角空白を入れると、実行しても止まってしまうので注意すること。 半角空白は、途中でたくさん入れても問題はない。 シンタックスは大文字でも小文字でも、どちらでもよい。 空白や改行は見やすくなるように入れているだけで、なくてもよい。 最初の3文字だけで動く。compute と書かずにcomだけでよい。 しかしPSPPの相関係数CORRELATION はCORREL まで書かないと動かない。
データの形式見本(2人分)
1101 32400232 10100011 110113110 22099 9621 4317 1102 13101421 11212111 121114112 12299 9631 4317 この例だと、はじめの4桁はサンプル番号。その後、問1で3、問2で2、問3で4と答えている。
文字化けについて
SPSSの設定を「unicode」にしている場合は、全角文字を含めた各種言語の文字を表示できる。しかし、古いSPSSデータファイル(sav)は 文字コードがWindowsの標準(シフトJIS形式)でありunicodeではないので、文字化けすることがある。その場合は、 以下のようにSPSS画面上の「編集」→「オプション」→「言語」で、文字コードを、unicodeでなくロケールにするとよい。図3. SPSSの設定画面 あるいは、何らかのエディターソフトで、データラベルのシンタックスを全角文字で書いてから、シフトJISでなくUTF-8で保存する。 その後にSPSSでシンタックスを開いて実行する。すると、データ画面のラベルが日本語で正常に表示される。
図4. 秀丸エディターの例 自分のパソコンにエディターソフトを入れてシンタックスを編集すると便利。その際に、文字コードはUTF-8にしてシンタックスを保存する。 動作の軽いエディターソフトがあると、仕事の効率が何かと上がるのでおすすめ。秀丸エディターなどを使うとよい。 秀丸エディターで全角文字(変数ラベルなど)を含むシンタックスを書き、UTF-8で保存してから、分析ソフトで使えば、 文字化けしない。以下の例では文字コードを変更している。UTF-8の部分をクリックすること。 文字化け対策については「SPSS 文字化け」などでGoogle検索すること。ChatGPTなどのAIは嘘を言うことも多いので気をつけること。 Windowsやエクセル内は全角文字の文字コードがSHIFT-JIS。欧米製の分析ソフトの多くは文字コードがUTF-8なので、日本語ラベルは文字化けすることがある。 シンタックス内で /* と */に囲まれている部分はコメント行であり、この中では全角文字を使ってもよい。 秀丸エディタ サクラエディタ CotEditor
SPSS形式データ(sav)のラベルがPSPPにおいて文字化けする時
まずSPSSを起動して、空のデータファイルを表示した状態にする。 SPSS画面上の「編集」→「オプション」→「言語」で、文字コードをunicodeに変更する。 その状態で、SPSSでsavファイルを開く。そして、オプションの画面にして「適用」ボタンを押す。 データを「名前をつけて保存」にして、savファイルを保存する(ラベルがunicodeとして保存される)。 unicodeで保存されたsavファイルをPSPPで開くと、データのラベルが正常に保存される。 2-3 データをSPSSで読み込む SPSSでのデータの読み込み法は、大きく2つのやり方がある。 2-3-1 テキスト形式データをシンタックスで処理する(一括処理) あらかじめ上記のようにテキスト形式データ(半角数字のみのデータ)のファイルを作っておく ・画面上「ファイル」をクリック →開く →シンタックス →シンタックスファイルの場所を選んで開く ・画面上「実行(R)」をクリック →すべて(あるいはシンタックス画面にて、ctrl+Aですべて選択してからctrl+R、 あるいは▲ボタンを押して実行) 実行はRun、全て選択はAllである。図5. シンタックス実行 シンタックスの中には、以下のように、冒頭でDATA LIST FILEコマンドを書けばよい。 具体的には、データファイルがおいてある場所(ドライブ名やフォルダ名)を書く。 Cドライブのpractフォルダ内のabcdat.txtを読む場合の例 DATA LIST FILE='C:\pract\abcdat.txt' fixed RECORDS=4 1人のデータが4行の場合はRECORDS=4 と書く 最後のピリオドを忘れずに。 この後、スラッシュのあとに続くのが、問の名前とケタ指定。1-3桁目にIDが入り、 4桁目にQ1 5桁目にQ2 の場合は、以下のように書く。 / ID 1-3 Q1 4 Q2 5 Q3 6 Q4A 7 Q4B 8 ケタ指定をすべて書いたら、シンタックスを実行すればよい。 シンタックス内では、ケタ指定文の後に、欠損値処理や分析命令文を書く。 このようなシンタックスを用いた一括処理の方が、大量なデータを扱う場合に向いている。 シンタックスを書くと、データの加工などについて記録が残るので良い。 以下のようにデータ画面で、画面上「分析」をクリックすればクロス集計などは簡単にできる。
図6. クロス集計を実行 ポイント 1)パソコンのドライブは、ふつうハードディスクがCドライブ、フロッピーがAかB。しかし最近は、フロッピーがない。 2)DVDドライブがDかEドライブ。着脱式記憶装置やその他の増設ハードディスクがEやF以降になることが多い。 3)データファイルが Hドライブにあるなら、C:\でなくH:\ と書く。 4)フォルダ名は \ マークで区切る。データファイルがあるフォルダ名を正確に書く。 2-3-2 SPSS形式データを開く あらかじめSPSS形式データファイルができている時は、以下のGET FILE文を使う。 この文1行のみで、行指定文は書かなくて良い。 あらかじめSPSS形式データ(sav)を作っておく ・以下のように、シンタックスのGET FILEコマンドを書いて実行。 GET FILE='C:\Users\murase\Documents\abcsubset.sav'. この例ではmurase というユーザーのドキュメント内にsavファイルがある。 ・あるいは画面上「ファイル」をクリック →開く →データ →データファイルの場所を選んで開く 2-4 設定の変更 画面上「編集」をクリック →「オプション」 で各種設定を変更できる ・表形式などを好みのものに変えると良い ・動作が軽い方がいい場合はドラフトビューアーを指定 ・変数リストは「アルファベット順」でなく「ファイル」にすると、分析時に ファイルに書いてある順序で変数が表示される 2-5 分析結果の保存 出力画面で「ファイル」をクリックして分析結果を保存する 保存場所は、自分のUSBメモリーやデスクトップか、あるいはハードディスク(Cドライブ)内の分かりやすいフォルダにすること ドライブ構成はWindowsエクスプローラーにてPCをクリックして確認。 普通はA(とB)がフロッピードライブでCがハードディスクである(しかし最近のPCはフロッピードライブはない)。 その他にDVDドライブや共有ハードディスクがあることも 2-6 分析結果をエクセルファイルとして保存 保存時に出力画面にて「ファイル」をクリックして「エクスポート」を選ぶと、テキスト形式やエクセルでの保存ができる。その方が汎用的である。 エクスポートのメニュー画面が出たら、まず「ファイルの種類」ボックスをクリックして、エクセル形式を選ぶこと。 無料ソフトPSPPでは、出力画面にて「ファイル」→「書き出し」。
図7. 分析結果の保存 その後、出力(分析結果)を分かりやすい名前を付けて保存する。保存場所はハードディスク Cドライブ (Windows C)などを選ぶ。 保存形式をcsvにすると、あとでエクセルなどで読み込んで、出力を自分で編集することができる。あらかじめCドライブの中にoutputフォルダなどを作っておく。 この例では、PSPPで、Cドライブの中の、dapフォルダの中にあるoutputフォルダの中に、出力をCT1という名前を付けて、csv形式で保存している。
図8. CSV形式での保存 2-7 出力をエクセルで読み込む 分析結果をcsv形式で保存したら、エクセルで結果を開く。ただし、csvファイルをダブルクリックすると文字化けすることがある (全角文字の文字コードがエクセルだとシフトJIS形式のため)。最近の分析ソフトの多くは文字コードがUTF-8形式。 詳しくはグーグルなどで「エクセルでcsvを開くと文字化け」で検索すること。 以下のように、エクセルの「データ」をクリックして「テキストまたはcsv」を選ぶ。
図9. エルセルでCSVファイルを開く 先ほど、Cドライブの中のdapフォルダに分析結果を保存したので、データの場所を選ぶ。
図10. データの場所を選択 ファイルの中が表示されるので、文字化けしていなければ「読み込み」ボタンを押す。 文字化けしている場合は、文字コードのUTF-8の部分をクリックして他に変更してみる。
図11. データ読み込み 正常に読み込むと、普通のエクセル画面として表示される。その後、シート左上すみをクリックすると、シート全体を選択状態になる。 右クリックして「セルの書式設定」を選び「配置」タブをクリックして「セルを結合する」を外す。全て外すと、自分で編集して、 グラフ作成などをやりやすくなる。
図12. エクセルのセルの書式設定 2-8 その他 エクセルファイルをデータとして使うには ・SPSSのデータ画面にて、「ファイル」→「開く」で、「ファイルの種類」ボックスをクリックし、Exelを選ぶ。 ・エクセルファイルは、横1行が1人のデータとして数字を入力する。千人分なら千行ある。 ・最初の1行目は変数名(半角英数字で8文字以内の名前)にしておくこと。そうでないと、SPSSのバージョンによっては文字化けすることがある。 ・PSPPでは、エクセルファイルを直接、読み込むことはできない。事前にcsvファイルを作っておくこと。 まずエクセルにて、エクセル形式ファイルを開く。その後「名前を付けて保存」でcsv形式を選んで保存する。
まずデータ定義文を実行してから、以下のようなデータ加工や分析命令のシンタックスを自分で書いて実行すること。
以下の例1以降の内容を理解し、COMPUTE文やIF文を使えるようになるとよいだろう。RECODEリコードをレコードとつづりを間違う人が多いので注意。
★シンタックスについての解説は、
村瀬洋一他.2007.『SPSSによる多変量解析』オーム社.
三宅一郎・山本嘉一郎編著.1986.『新版SPSSX 基礎編』東洋経済新報社.
酒井麻衣子.2001.『SPSS完全活用法 データの入力と加工』東京図書.
などを見るか、WEB上にいろいろな人のシンタックス見本があるので、
それを見て、真似して書くとよい。
/***** シンタックスによる変数の処理について *****/
/***** 例1 カテゴリー合併の例 基本的な例 *****/
/***** 行末のピリオドを忘れるとエラーがでるので注意*****/
COMPUTE N2A = Q2A .
RECODE N2A (1,2=1)(3,4=2) .
MISSING VALUES N2A (9) .
/***** 上記の1行目は、新変数名(新しい質問項目)として *****/
/***** N2Aを設定し、その中身をQ2Aと同じにしている。N2Aは *****/
/***** 好きな名前で良い。 *****/
/***** 初めに新変数N2Aを作っていることを理解する *****/
/***** 2行目はリコード文でのカテゴリー合併 *****/
/***** 3行目は欠損値処理 *****/
/***** RECODEをRECORDと書いたりするとエラーになるので注意 *****/
/***** 例2 以下によりうまく新変数ができているか確認する *****/
CROSSTABS
/TABLES= N2A BY Q2A .
/***** 例3 新変数を使った分析 クロス集計の例 *****/
CRO
/TAB= N2A BY Q46SEX
/CEL= COL .
/***** 例4 カテゴリー合併の例 年齢2段階の新変数NEN2を作る *****/
COMPUTE NEN2 =Q46AGE.
RECODE NEN2 (10 THRU 49 =1)(50 THRU 98 =2) .
/***** 例5 カテゴリー合併の例 学歴2段階の新変数ED2を作る *****/
COMPUTE ED2=Q43.
RECODE ED2(1 thru 3 =1)(4 thru 6=2)(7,9=99).
MISSING VALUES ED2(99).
/***** 例6 3重クロス集計の例 *****/
/***** 変数名は、シンタックス冒頭で指定した名前を正確に書くこと *****/
/***** ピリオドは最後に1つだけつけること *****/
/***** 合併した新変数をまず3つ作り、その後にクロス集計をしてもよい *****/
CRO
/TAB = N2A BY ED2 BY NEN2
/STA = CHISQ PHI COR
/CEL = COUNT COL ROW ASRESID .
/***** 例7 記述統計量を出す命令文の例 *****/
/***** 名義尺度に関して量を計算しても意味がないことに注意 *****/
DESCRIPTIVES
VARIABLES=Q2A to Q2C .
/***** シンタックスによる変数の処理について *****/
/***** 例8 学歴を3段階カテゴリーに合併した新変数EDUCTを作る例 *****/
/***** はじめに新変数としてEDUCTを設定している *****/
/***** 新変数名は何でも好きな名前で良い *****/
COMPUTE EDUCT =Q43.
RECODE EDUCT(1,2=1)(3,4=2)(5,6=3)(7,9=9).
/***** 例9 記述統計量と平均値比較のグラフ(一元配置分散分析) *****/
ONEWAY Q6A BY Q16
/STATISTICS DESCRIPTIVES
/PLOT MEANS .
/***** 例10 計算 新変数として合計得点を作る *****/
/***** はじめに新変数としてKOHDOを設定している *****/
/***** 最後のピリオドを忘れずに書くこと *****/
/***** また計算の前に欠損値処理をすること *****/
COMPUTE KOHDO =Q7A+Q7B.
FREQUENCIES
/VARIABLES= Q32_08
/FORMAT=AVALUE TABLE.
/***** 例11 計算その2 合計得点 財産項目の例 *****/
/***** はじめに新変数としてPROPERTYを設定している *****/
COMPUTE PROPERTY=Q32_01+Q32_02+Q32_03+Q32_04+Q32_05+Q32_06+Q32_07
+Q32_08+Q32_09+Q32_10+Q32_11+Q32_12+Q32_13+Q32_14+Q32_15.
/***** 例12 計算その3 SUMを使っても上記と同じになる *****/
/***** はじめに新変数としてPROP2 を設定している *****/
COMPUTE PROP2 =SUM(Q32_01 to Q32_15).
/***** 例13 財産カテゴリーの作成 上の例の続きで *****/
COMPUTE ZAISANCT=PROP2.
RECODE ZAISANCT (0 thru 4=1)(5,6,7=2)(8,9=3)(10,11=4)(12,13,14=5).
FRE VAR=ZAISANCT.
/***** 例14 変数の逆転 *****/
/***** 問15の値1234を4321に変換 *****/
/***** 重回帰分析の前に変数の向きをそろえると良い *****/
/***** 逆転の前に必ず欠損値処理をすること *****/
COMPUTE YARITA =5-Q15A.
COMPUTE HYOBAN =5-Q15B.
COMPUTE OTOKOSO=5-Q15C.
COMPUTE tsukare=5-Q17A.
/***** 以下によりうまく新変数ができているか確認する *****/
CRO
/TAB= OTOKOSO BY Q15C .
/***** 例15 相関係数(r)を出す *****/
CORRELATION
/VAR =YARITA OTOKOSO Q15A Q15B Q16 .
CORREL
/VAR= Q9A Q9B Q9C.
/***** 相関係数を出す前に、分布を確認すること *****/
FRE VAR = Q15 Q18A Q18D.
/***** 例16 問7Aの値1〜5を 100〜0に変換 *****/
COMPUTE YUONEGAI=Q7A.
RECODE YUONEGAI (1=100)(2=75)(3=50)
(4=25)(5=0) .
MISSING VALUES YUONEGAI (9).
/***** 例17 ダミー変数作成 0,1の変数を作る *****/
/***** この例では自営なら1、そうでないなら0 *****/
COMPUTE JIEI =0.
IF (Q33=6) JIEI =1.
IF (Q33=7) JIEI =1.
COMPUTE HISEIKI =0.
IF (Q33=3 OR Q33= 4) HISEIKI =1.
IF (Q33=5 OR Q33= 8) HISEIKI =1.
COMPUTE SENMON =0.
IF (Q19DS2=5) SENMON =1.
IF (Q19DS2=6) SENMON =1.
/***** 例18 学歴を教育年数に変換 *****/
COMPUTE EDU=Q43.
RECODE EDU(1=6)(2=9)(3=12)(4=13)(5=14)(6=16)(7,9=99).
MISSING VALUES EDU (99).
/***** 例19 元の変数AGE をもとに、新変数として NENDAI を設定し *****/
/***** 20〜70までの51段階の年齢を、2から6までの5カテゴリーに合併 *****/
COMPUTE NENDAI =AGE.
RECODE NENDAI(20 THRU 29 =2)(30 THRU 39 =3)(40 THRU 49 =4)
(50 THRU 59 =5)(60 THRU 70 =6) .
/***** 以下のように書いても同じ結果になる *****/
/***** TRUNCは引数の小数点を切り捨てる関数 *****/
/***** この例は、年齢を10で割り、小数点以下を切捨てとなる*****/
COMPUTE NENDAI = TRUNC (age / 10).
/***** 例20 計算 ******/
/***** かけ算は* わり算は/ で表す ******/
COMPUTE SEINEN=Q1SEX*10+NENDAI.
COMPUTE living= age-q11.
COMPUTE livrate= living/age.
/***** 例21 標準得点の作成 ******/
/***** 記述統計の分析で、SAVEコマンドを使う ******/
/***** 以下の例ではQ4を標準化し、新変数ZQ4ができている******/
/***** データウィンドウの最後にZQ4ができている******/
DESCRIPTIVES
VARIABLES=Q4 /SAVE
/STATISTICS=MEAN STDDEV MIN MAX .
/***** 例22 標準得点を平均値50になおす ******/
/***** 上記のZQ4 は平均0、分散1の変数(Z得点)である。 ******/
/***** いわゆる偏差値(平均が50になる得点)にしたいときは、以下のように******/
/***** 10倍してから50を足せばよい ******/
COMPUTE NZQ4 =ZQ4*10+50.
/***** 例23 COMPUTE文でダミー変数を簡単につくる *****/
/***** COMPUTE文は右辺が計算式と条件式とで機能が異なる。 *****/
/***** 「COMPUTE 新変数名 = 条件式」で条件に適合するとき1、*****/
/***** それ以外のとき0を割り当てる。 *****/
/***** 「主婦」ダミー変数をつくる *****/
COMPUTE shuhu = q19bs2 = 1.
/***** 例24 「支持政党あり」ダミー変数をつくる *****/
COMPUTE n24 = q24 <= 10.
/***** 例25 RECODE文で一気に複数の新変数をつくる *****/
/***** 新変数名の末尾を数字にすれば、自動的に連番の変数をつくってくれる *****/
RECODE q6a to q6d (1,2 = 1)(3,4 = 2) INTO n6a to n6d.
/***** 例26 相関係数を出す *****/
COR
/VAR =q6a q6b q6c q6d .
/***** 例27 重回帰分析 *****/
/***** Q6A を被説明変数とした例 *****/
/***** 分析前に必ず度数分布表を出して欠損値処理をしているか確認すること*****/
/***** 説明変数同士の相関係数を出して関連が強いものがないか確認すること*****/
/***** 回答の方向を逆転した新変数を作るなどして変数の方向はそろえておく*****/
REG
/DEP Q6A
/MET = ENT age edu Q2A Q10.
/***** Q10を被説明変数とした例 *****/
REG /DEP Q10
/MET = ENT q46AGE q2a q15c Q16 .
/***** 方向を逆転した新変数YARITAを被説明変数とした例 *****/
REG
/DEPT YARITA
/MET=ENTER Q46age edu tsukare.
/***** 例28 値ラベルの貼り付け 複数の変数を処理する時はtoを使う *****/
VALUE LABELS
Q1SEX 1 '男' 2'女'
/Q2 1 '満足している' 2 'どちらかといえば満足'
3 'どちらかといえば不満' 4 '不満である' 9 'わからない'
/Q3 1 '公平だ' 2 'だいたい公平だ' 3 'あまり公平でない' 4 '公平でない'
9 'わからない' .
/Q27A TO Q27H 1 '重要である' 2 'やや重要である' 3 'あまり重要ではない'
4 '重要ではない' 9 'わからない'
.
/***** 例29 変数ラベルの貼り付け *****/
VARIABL LABELS Q43 '本人学歴'
/Q33A'子どもには高い教育がよい' /Q33B'子どもには塾がよい'
/Q35A '性別役割女は家庭を守る' /Q35B '性別役割男女は違った育て方'
/Q36 '生活水準変化' /Q37 '生活満足感'
.
/***** その他の例 *****/
/***** *****/
/***** *****/
/***** 例30 シンタックスにより欠損値を除く処理 *****/
/***** AMOS使用の前に欠損値のないデータを作る *****/
/***** 場合など 問4の欠損値が9ならば9を除けばよい *****/
/***** ne は not equal *****/
/***** 回答が9の人がデータから削除され人数が減る *****/
select if q4 ne 9.
SELECT IF edu ne 99.
/***** あるいは回答が1から4で欠損値が9の場合は以下でもよい *****/
select if q5 <5.
/***** 例31 職業8分類 新変数 JOB8 を作成 *****/
/***** 初めは、JOB8 の中身は全員9としている *****/
/***** それを後で他の値に変えている *****/
COMPUTE JOB8=9.
IF ( Q19DS2=5 OR Q19DS2=6 ) JOB8=1.
IF ( Q19DS2=1 ) JOB8=2.
IF (Q19CS2>5 AND (Q19DS2=2 OR Q19DS2=3 )) JOB8=3.
IF (Q19CS2>5 AND (Q19DS2=4 )) JOB8=4.
IF (Q19CS2<6 AND (Q19DS2=2 OR Q19DS2=3 )) JOB8=5.
IF (Q19CS2<6 AND (Q19DS2=4 )) JOB8=6.
IF ( Q19DS2=7 ) JOB8=7.
VALUE LABELS
JOB8 1 '専門' 2 '管理' 3 '大W' 4 '大B' 5 '中小W' 6 '中小B' 7 '農業' .
/***** 例32 総合職業分類 新変数SJを作成 *****/
/***** 問19B、C、Dを使って11種類の職業大分類を作る *****/
/***** 新総合職業分類については *****/
/***** 安田・原『社会調査ハンドブック』p88参照 *****/
/***** 職業の4次元はp87参照 *****/
/***** 産業、従業先の規模、狭義の職業、従業上の地位 *****/
/***** その他に、課長、部長などの役職も場合によっては重要 *****/
/***** 普通、課長以上を管理職とする *****/
COMPUTE SJ=10.
IF (Q19CS2>5 AND (Q19DS2=2 OR Q19DS2=3 )) SJ=5.
IF (Q19CS2>5 AND (Q19DS2=4 )) SJ=6.
IF (Q19CS2<6 AND (Q19DS2=2 OR Q19DS2=3 )) SJ=7.
IF (Q19CS2<6 AND (Q19DS2=4 )) SJ=8.
IF ( Q19DS2=1 ) SJ=4.
IF ( Q19BS2=6 OR Q19BS2=7 ) SJ=1.
IF ((Q19BS2=6 OR Q19BS2=7) AND Q19DS2=4 ) SJ=2.
IF ( Q19DS2=5 OR Q19DS2=6 ) SJ=3.
IF ( Q19DS2=7 ) SJ=9.
IF (Q19BS2=2 ) SJ=11.
VALUE LABELS SJ 1 '自営ノン' 2 '自営マニ' 3 '専門' 4 '管理'
5 '大W' 6 '大B' 7 '中小W' 8 '中小B' 9 '農業' 10 '無職' 11 '学生'.
/***** 例33 上記の職業カテゴリーごとに平均値を出す *****/
ONEWAY
Q6A Q6B edu BY sj(1 15)
/STATISTICS DESCRIPTIVES
/MISSING ANALYSIS .
/***** ★その他詳しくは見本シンタックス内の、新変数作成の部分を参照 *****/
1)日本標準職業分類の大分類(『社会調査演習』2.5 p.103参照)9個 − 社会学の実際の分析ではあまり使われない
2)SSM総合職業分類 12分類(簡略版は9分類)
− 安田・原.『社会調査ハンドブック 第3版』pp87-89や、『SSM産業分類・職業分類95年版』p.105 を参照
a 12分類
1 '自営ノンマニュアル' 2 '自営マニュアル' 3 '専門' 4 '管理' 5 '大ホワイトカラー'
6 '中小事務' 7 '中小販売' 8 '大熟練' 9 '大非熟練'
10 '中小熟練' 11 '中小非熟練' 12 '農業' 96 '無職' 98 '学生'
b 簡略版9分類
1 '自営ノンマニュアル' 2 '自営マニュアル' 3 '専門' 4 '管理' 5 '大ホワイト'
6 '中小ホワイト' 7 '大ブルーカラー' 8 '中小ブルーカラー' 9 '農業'
96 '無職' 98 '学生'
3)SSM職業新8分類 −SSM調査報告書1巻の巻末pp200-201や、原・盛山『社会階層』の巻末用語解説等に解説がある
1 '専門' 2 '大W' 3 '小W' 4 '自営W'
5 '大ブルー' 6 '小ブルー' 7 '自営ブルー' 8 '農業'
96 '無職' 98 '学生'
4)SSM職業大分類の旧8分類 −SSM調査報告書1巻の巻末pp200-201に解説がある
従業先規模や従業上の地位などを考慮しない単純な分類であり、最近はあまり使われない。
1'専門' 2 '管理' 3 '事務' 4 '販売' 5 '熟練' 6 '半熟練' 7 '非熟練' 8 '農林'
96 '無職' 98 '学生'
5)国際比較で比較的よく用いられる職業分類EGPカテゴリー −『日本の所得格差と社会階層』pp.108- 参照
エリクソン、ゴールドソープ、ポルトカレロによる6分類。欧米では有名なEGP分類。
専門管理が多くなりすぎ、自営が1カテゴリーになるなど問題がある分類のため、日本ではあまり用いられない。
ここでいう上層ホワイトカラーは、専門職と管理職だが、日本の管理職よりも定義が広い。例えば事務職でも部下が
いれば管理となる。また高度な事務職は専門職となるが、日本の事務職は欧米より仕事の範囲が広く高度な仕事も
しているため、多くが上層ホワイトカラーとなる。
農業を自営農業と農業労働者にわけて7分類としたり、さらに細かく分類することもある。
1 '上層W' 2 '下層W' 3 '自営(非農業の自営業主)' 4 '農業'
5 '上層ブルー(熟練工)' 6 '下層ブルー(半熟連と非熟練工)'
96 '無職' 98 '学生'
なお、大企業は従業員数300人以上、中小企業は300人未満とすることが多い。
また、ノンマニュアルとは、専門、管理、事務、販売職、マニュアルとは熟練や労務作業者など
いわゆるブルーカラーである。マニュアルを読む職業という意味ではなく、英語のmanual workerと
いう意味である。
自分の分析目的に応じて、適切な分類を使うとよい。少人数となるカテゴリーが多いと、分析時に
問題であろう。何が適切かは、分析結果を見つつ、よく考えるとよい
日本のデータを分析する際は、総合職業分類を簡略化したもの(2-b)か、SSM新8分類(3)が使いやすいだろう。
これは分類が細かすぎず、かつ自営かと、企業規模を考慮しているという点で適切な分類である。
22TKhyov7mihon.pdf 2022東京調査の調査票(PDF)
22TKhyov7mihon.docx 2022東京調査の調査票(MS-Word)
22inst2mihon.docx 2022東京調査 調査員説明会の資料(調査員マニュアル)
クロス集計の表形式(卒業研究ページ)その他の資料(社会調査法ページ)
変数が3カテゴリー以上の時は、クラマーのV(名義尺度)、タウBまたはタウC(量的な意味がある変数)を選ぶとよい。3×3など正方形の表ではタウBを使う。
台湾人1、ベトナム人2、香港人3、などの変数には量的意味はない。その場合は名義尺度(質的変数)として考える。
2)「貼り付け」ボタンを押すと、シンタックスの見本が出る。
関連係数は、有意水準が0.05未満なら、統計的に有意と考えて良い。
★クロス集計表の形式は、『社会調査演習』のエラボレイションの表を真似して書くこと。
★3重クロス集計のシンタックスを書くときは、一番最後にtにあたる変数を書くと良い。シンタックスの中で、変数を書く順番にご注意。
表内の各変数の位置は、出力画面で、表をダブルクリックしてアクティブにした状態で、画面上の「ピポット」をクリックして入れ替えを選べば、移動できる。
重回帰では、変数の値は細かい方が良いが、3重クロス集計は、2か3カテゴリーに合併してから行った方が良い。あまり細かくすると人数の少ないセルができるので。
・ワードの画面上「表示」をクリック
・ツールバーや図形描画、またはオートシェイプを選ぶ
・画面下に線や矢印のボタンが表示されるので、ボタンを押して線をかく。
書いた図を微調整したいときは、書いた線や図を右クリックして書式設定を選ぶ。線の太さや矢印種類などを変更できる。その他、画面下の「オートシェイプ」ボタンを押し、曲線などを選ぶとよい。曲線を書くのを終えるときはダブルクリックする。曲線を書いた後、右クリックして書式設定を選ぶと、線種を変えたり、矢印などにすることができる。
なお、二乗などの、小さい2を書きたいときは、2を書いてからマウスで選んで右クリックし「フォント」を選ぶ。「文字飾り」の中の上付ボックスをチェックする。
ワード画面内にエクセルの表を貼るときは、ワード画面上の「挿入」をクリックし、オブジェクトを選び、エクセルワークシートを選ぶ。
エクセルで単純に直線を引くだけならば、線を引きたいセルをマウスで選び(またはシフト+矢印キー)、その後、画面上「書式」をクリックし、セルの書式設定を行い、罫線ボタンを押しても良い。
グラフにしたい部分の数字や、回答選択肢の部分のセル結合を外しておく。セルの間に余計な空白行は入れない。そして、必要なセルの最小限を、マウスで選択し(合計や100%のセルは選択しない)、画面上「挿入」→おすすめグラフで、適切な形式のグラフを選択する(おすすめグラフ→「すべてのグラフ」タブ→横棒→左から3つめの形式)。男女別の集計結果ならば、足して100%になることが分かりやすい形式の横帯グラフにするとよい。グラフを作った後に、形を変えることができる。
・自分が作ったグラフをマウスで選択する(1回だけグラフをクリック)。
・画面の上に「グラフツール」が出る。
・その下に「グラフのデザイン」や「レイアウト」タブが出るので、グラフタイトルやデータラベルなどを選択し、タイトルなどを追加する。
・エクセルのバージョンによっては、グラフを選択した時に、グラフの右に+ボタンが出るので、それを押して、タイトルやデータラベルなどを追加する。書式タブなども必要に応じて使う。
・自分が以前作ったグラフや、形式見本エクセルファイルのグラフ形式を、事前にテンプレートとして保存しておくとよい。その後、グラフを何か作ってから、グラフ種類の変更→すべてのグラフタブ→テンプレートで再利用できる。
テキスト 原純輔・海野道郎. 2004. 『社会調査演習 第二版』東京大学出版会. ISBN 4130520199.文献リストを作る時には、著者名と発行年(半角数字)をまず書くこと。著者名のアルファベット順に並べること。
参考書 ★は村瀬による解説 ボーンシュテット・ノーキ著=海野道郎・中村隆監訳.1990.『社会統計学 −社会調査 のためのデータ分析入門』ハーベスト社. ★社会統計学の入門書として分かりやすい 原純輔ほか編.2000.『日本の階層システム』1〜6巻.東京大学出版会. ★日本の3大社会調査の1つであるSSM調査の最新成果をまとめた本 林拓也. 2024. 『社会統計学入門〔三訂版〕』放送大学教育振興会. 神林博史・三輪哲. 2024. 『社会調査のための統計学: 生きた実例で理解する〔改訂新版〕』技術評論社. 井上文夫・井上和子・小野能文.1991.『よくわかる社会調査の実践』ミネルヴァ書房. 井上文夫他編.1995.『よりよい社会調査をめざして』創元社. ★郵送調査の具体的な実施法の記述は分かりやすい。 狩野裕.1997.『グラフィカル多変量解析』現代数学社. ★共分散構造分析の解説書。AMOSやEQSの操作法が分かりやすい。 栗田宣義編.1996.『メソッド/社会学』川島書店. 栗田宣義編.1998.『データブック/社会学』川島書店. ★戦後日本の代表的な社会調査データについて解説。 村瀬洋一他編. 2007. 『SPSSによる多変量解析』オーム社. ISBN 4274066266.
内閣総理大臣官房広報室編『世論調査年鑑 : 全国世論調査の現況』大蔵省印刷局. ★日本でどのような調査が行われたかの報告書 毎年発行 直井優編.1983.『社会調査の基礎』サイエンス社. ★少し古いが社会調査法についてよくまとまっている。 直井優他編.1990.『現代日本の階層構造』第1〜4巻.東京大学出版会. 西田春彦・新睦人編.1976.『社会調査の理論と技法 −アイディアからリサーチへ』 川島書店. NHK放送文化研究所世論調査部編.1996.『世論調査事典』.東京: 大空社. ★調査の紹介、調査手法について詳しく記述がある。倫理、著作権についても記述がある。 大谷信介他編.2023.『最新・社会調査へのアプローチ: 論理と方法』ミネルヴァ書房.
佐藤郁哉.1992.『フィールドワーク −書を持って街へ出よう』新曜社. 盛山和夫. 2004. 『社会調査法入門』有斐閣.
谷岡一郎.2000.『「社会調査」のウソ −リサーチ・リテラシーのすすめ 』文芸春秋. ★調査の実態や問題のある調査について、具体例を挙げて説明。わかりやすい新書。 轟亮・杉野勇・平沢和司編,2026,『入門・社会調査法: 2ステップで基礎から学ぶ・第5版』法律文化社.
統計数理研究所国民性調査委員会編.1992.『第5 日本人の国民性』出光書店. ★日本の3大調査の1つである国民性調査結果 辻新六・有馬昌宏.1987.『アンケート調査の方法 −実践ノウハウとパソコン支援』. 朝倉書店. 渡部洋編.1988.『心理・教育のための多変量解析法入門 基礎編』福村出版. ★分析法について、初心者向けに分かりやすくまとまっている。 山際勇一郎・田中敏.1997.『ユーザーのための心理データの多変量解析法』教育出版. ★初心者向けに、SASによるさまざまな多変量解析法を分かりやすく解説している 安田三郎・原純輔.1982.『社会調査ハンドブック(第3版)』有斐閣. ★同様のタイトルの本は多数あるが、この本が内容的にもっとも整備されている。ただし、改訂が繰り返されてはいるが、もはや少し古い部分がある。 安田三郎・海野道郎.1977.『改訂2版 社会統計学』丸善. 1995年SSM調査研究会.1998.『1995年SSM調査シリーズ』第1〜21巻.1995年SS M調査研究会. ★1995年SSM調査の報告書論文集。日本の社会階層研究に関する最先端の研究成果が掲載されている。
1)分析で用いる職業分類については、以下の職業コウディングの解説をよく読むこと。
2)重回帰分析をやる時は、必ず事前に欠損値処理をすること。また、新変数を作り、変数の方向をそろえること。
また、男女や一人暮らしなど、0、1型の変数(ダミー変数)を作ると良い。やり方は「4.シンタックスの解説」を見てください。
★都道府県の魅力度ランキングなど、無作為抽出をしないネット調査の結果は非科学的でまったくデタラメです。結果を信用してはいけません。あのような調査を取り上げるマスコミも問題です。
2)とくに設定しないもの −因子分析、クラスター分析、数量化3類、MDS等
1)と2)を組み合わせたもの −構造方程式モデル(共分散構造分析)等
回収率を上げるためには、とくに以下のことに注意すること。
1)事前に対象者へお願い状を送る
対象者の選び方、調査主体、調査の意義等を丁寧に説明。対象者の選び方を詳しく書かないと、なぜ住所を知ったのか、という苦情電話がたくさんくる。
白やクリーム色の紙に角印を押し、固い文書だと印象がよく信用がある。
できれば手書きで数行、書き添えると良い。
大学の封筒で、連絡先をきちんと書き、インチキ調査でなく、調査主体が大学だということを分かってもらえるように。
電話の他、Eメールやホームページアドレスを書いても良い。
2)調査員配置
賃貸アパートが多い場所や、土日の夜は、調査員を多めに配置する。
できれば男女1組で。女性は郊外の安全な住宅地が良い。
3)調査員への指示
不在のお宅には、繰り返し何度も訪問することを徹底させる。
4)調査本部を設置
調査員へ連絡、苦情受け付け、事故待機、現場を巡回。
何人かで調査現場を巡回し、調査員の様子を見て励ますとよい。
調査が終わったら、結果を数字のテキストファイルにすれば、SPSSなどの分析ソフトで簡単に分析できる。
以下の例のように、半角数字のみを入力する。数字のみを入れる方法だと、エクセルやSPSSのセルに直接数字を入力するのと 比べ、半分以下の時間ですむ。詳しくは上記「データ入力資料の例PDF」を読むこと。
8.1.基本的な作業内容 回答の数字を入力。ただし半角数字のみを入れる。余計な空白、とくに全角空白や余計な改行は入れないよう注意。その点に注意すれば、とくに難しいところはない。 改ページごとに半角空白を1つ入れる。分かりやすくするためでとくに意味はないが、ケタずれを発見しやすくなる。 普通、11地区の1番目の人は1101にするなど、調査票にサンプル番号を書いておき、その順番で入力する。 データの形式見本(2人分) 1101 32400232 10100011 110113110 22099 9621 4317 1102 13101421 11212111 121114112 12299 9631 4317 この例だと、1行目はじめの4桁はサンプル番号1101。その後、1つ空白をあけて、問1で3、問2で2、問3で4と答えている。 なお、1人のデータが2行以上になる時は、適当に左端あたりに空白を入れて、右端か、どこかの空白ががそろうようにするとよい。そうすれば、 データチェックの時に、ケタずれがないかどうか見やすい。 8.2.その他注意点 ・複数回答項目(Multiple Answers)は、○がついているものは1、ついていなければ0と入力 例えば、問11の中に項目1から7まであり、234に○の場合、0111000 と入力 ・無回答は9または99を入力 ・ワードやメモ帳など何で入力しても良いが、保存時は「テキストファイル形式」(MS-DOS書式なし形式)で保存する。 保存時に「名前をつけて保存」を選び、「ファイルの種類」(保存形式)ボックスをクリックして形式を選択する。 ワードを使う場合、MSゴシックなどの等幅フォントを使うこと。上記「データ入力資料の例」PDFファイル参照。 メモ帳や秀丸エディターなどのソフトを使って、半角テキストのみ(書式なしテキスト形式ファイル)を保存するのが良い。 8.3.データクリーニングについて 入力が終わったら、数字の打ち間違いがないか確認してミスを修正する(データクリーニング)。 もっとも確実なデータクリーニング法は、2回データを打ち込み2つのデータファイルを作ることである(ダブルインプット) という。アルバイトを2人雇って入力すると良いだろう。そしてファイル比較ソフトを使い、2つのデータファイルの 異なる部分を探す。異なる部分は入力ミスである。 その後、異なる部分を修正した第3のファイルを作ればよい。以下のようなファイル比較ソフトを使うこと。「ちゃうちゃう」 というソフトは、異なる部分を文字単位で比較した結果を出してくれるので使いやすい。 ソフトを動かす前に、まずケタずれがないかチェックするとよい。すべてのデータの行末や空白位置が そろっているかどうか注意。各行の右端の位置がすべて同じならよい。データの最後に 余計な空白や改行マークがないかも調べる。また、途中で空白行などがあるとよくない。 全角スペースが入っているとエラーになるので注意。半角スペースのみとする。MSワードや エディターソフトの検索機能を使い、全角スペースがないか確認すればよい。ファイル比較ソフトちゃうちゃう 無料ダウンロード
あるいは2人1組で、調査票の数字を読み上げ、ファイルの数字と合っているか確認してもよい。読み上げソフトを使ってもよい。 しかしこの方法だと、当然ながら作業する人の集中力によるので、ミスを完全になくすことはできない。 データファイルが完成したら、SPSSやSASのプログラムを書いて分析する。応用調査実習やSPSSホームページなどを参照。 見本のSPSSシンタックスを見てデータ定義文を書くと良い。 8.4.データ読み込み命令文について データファイルが完成したら、SPSSやSASのプログラムを書いて、分析する。 SPSSシンタックスのデータ読み込み命令文については、上記の3を参照。基本的に、 データのケタの説明を書けばよいだけである。つまり以下のようなシンタックスを書く。 上記のデータの形式見本(2人分の数字の例)は、1-4桁目がID番号、5桁目は空白、6桁目が問1、7桁目が問2、8桁目が問3 という例。以下のように、シンタックスに桁を書けばよい。問の名前(変数名)は調査票に合わせて自由につければよい。変数によって1桁の ものと2桁のものがある。 DATA LIST FILE='C:\foldername\abcdat.txt' NOTABLE RECORDS=1 FIXED / ID 1-4 Q1 6 Q2 7 Q3 8 Q4A 9 Q4B 10 Q4C 11 Q5 12-13 Q6 15 Q7 16 つまり、シンタックスとテキストファイル形式データの、2つのファイルが必要となる。以下の見本を参考に2つを作ればよい。 シンタックスは、一見難しそうに見えるが、例を参考に書き換えて書けば簡単である。まず、1人分のデータを打ち込み、 その後、それを参考にシンタックスを書けばいい。エクセルやSPSSのセルに直接入力するよりも、はるかに早く入力できる。 なお、1人のデータが2行ならば、RECORDS=2 と書いて、スラッシュが2カ所つく。 ★データファイルの見本 2人分のデータ。1人が2行の場合の例。 ★シンタックスファイルの見本 1人のデータが2行の場合、RECORDS=2と書く。
あなたは2026年03月02日以来 回目のアクセスです。
All Rights Reserved, Copyright(c), MURASE,Yoichi