FO-29, JTA 統計的解析


● (No.305) FO-29, JTA 統計的解析 (2002年 2月1日)
 ------------------------------------------------

衛星FO-29 の CWテレメトリを解析した中から、アナログ(JTA)送信電力の数値
について、統計的に処理してみます。まず、次は 1月29日に受信したデータを
Fo29cwt2 プログラムにより解析した最新データです。


受信:高山 秀造  JH6MME  , in jas2info #260
解析:脇田美根夫 JE9PEL/1, with Fo29cwt2.exe (Ver 2.43)

29Jan2002, 18:33-18:47(JST), Freq. 435.803-.785MHz

(行頭 "HI HI")
AE C7 88 55 O0 D4 FF 71 09 21 A8 4B 5E 63 9A 97 B0 70 81 83 88 84 81
AE C7 88 55 00 D4 FF 71 09 21 A8 52 58 63 9A 97 B0 73 81 83 88 84 81
AE C7 88 55 00 D4 FF 71 09 21 A7 58 57 63 9A 97 B0 7C 81 83 88 84 81
AE C7 88 55 00 D4 FF 71 09 21 A7 5F 53 63 9A 97 B0 72 81 83 88 85 81
AE C7 88 55 00 D4 FF 71 09 21 A6 65 4E 63 9A 97 AF 72 81 83 89 85 81
AE C7 88 55 00 D4 FF 71 09 21 A5 6A 4B 64 9A 97 AD 6C 81 82 89 85 81
AE C7 88 55 00 D4 FF 71 09 21 A4 6F 48 65 99 95 A9 88 81 82 89 85 81
AE C7 88 55 00 D4 FF 71 09 21 A3 72 45 66 97 94 A5 84 81 82 89 85 81
AE C7 88 55 00 D4 FF 71 09 21 A2 74 43 67 96 93 A1 77 81 82 89 85 81
AE C7 88 55 00 D4 FF 71 09 21 A1 74 44 66 95 92 A2 69 81 82 89 85 81

アナログ送信電力 (# 20mW)
 ( Data 1 )   629.9[mW] : ###############################
 ( Data 2 )   649.4[mW] : ################################
 ( Data 3 )   707.9[mW] : ###################################
 ( Data 4 )   642.9[mW] : ################################
 ( Data 5 )   642.9[mW] : ################################
 ( Data 6 )   603.9[mW] : ##############################
 ( Data 7 )   785.9[mW] : #######################################
 ( Data 8 )   759.9[mW] : ######################################
 ( Data 9 )   675.4[mW] : ##################################
 ( Data10 )   584.4[mW] : #############################


この10個の標本、629.9, 649.4, 707.9, 642.9, 642.9, 603.9, 785.9, 759.9,
675.4, 584.4  の平均値 (統計用語で標本平均) Xを求めると、X=668.3 と
なります。

もしアナログ送信電力の値が、母平均m・母分散σ^2 の分布をもつ母集団で、
ここから大きさnの標本を抽出したとすると、標本平均Xの分布は、nが十分
大きいと、正規分布N(m、σ^2) に近似的に近づく、ということが知られて
います。 これが、統計学の分野で言うところの「中心極限定理」です。

また、標本平均Xの そのまた平均はmで、標本平均Xの分散は(σ^2)/nとな
ることも知られています。 従って、母平均m・母分散σ^2 の母集団から抽出
した大きさnの標本の標本平均Xについて、nが十分大きいとき、次の不等式

  X−1.96*(σ/root(n))< m <X+1.96*(σ/root(n))  ..... (1)

が成立する確率は、0.95 (つまり 95%) となります。この(1)の範囲が統計学
で言うところの、「信頼度95%のmに対する信頼区間」です。つまり、母平均
mの値が、この意味で推定できることになります。

しかし、実際的には母分散σ^2 は一般にはわかっていませんし、また 上記の
アナログ送信電力の値の標本数は 10 と小さいので、(1)で 母平均mを推定す
るわけにはいきません。このような時には、次の不等式で推定すればよいこと
が知られています。

  X−t*(u/root(n))< m <X+t*(u/root(n))  ......... (2)

ここで tは、スチューデント分布 (t分布) における確率0.95 から求めます。
uは、不偏分散(u^2)=[(X1-X)^2+(X2-X)^2+....+(Xn-X)^2]/(n-1)
から求めます。いま、n=10 です。従って、tの自由度νは 10−1=9 です。
t分布表からこの時の値を求めると、t=2.26 です。 つまり 個々の値は、

       標本数    n= 10
       標本平均   X=668.3
       不偏標準偏差 u= 65.1
       自由度    ν=  9
       t値     t=  2.26

これらを(2)式に代入して計算すると、上記のアナログ送信電力の10個の標本値
から、「信頼度95%の母平均mに対する信頼区間」が、次のように求まります。

       621.8<m<714.8


《補足》

>                         「信頼度95%の母平均mに対する信頼区間」
> 
>                                                         |    |
> アナログ送信電力 (# 20mW)                               |    |
>  ( Data 1 )   629.9[mW] : ###############################    |
>  ( Data 2 )   649.4[mW] : ################################   |
>  ( Data 3 )   707.9[mW] : ###################################|
>  ( Data 4 )   642.9[mW] : ################################   |
>  ( Data 5 )   642.9[mW] : ################################   |
>  ( Data 6 )   603.9[mW] : ##############################|    |
>  ( Data 7 )   785.9[mW] : #######################################
>  ( Data 8 )   759.9[mW] : ######################################
>  ( Data 9 )   675.4[mW] : ################################## |
>  ( Data10 )   584.4[mW] : ############################# |    |
>                                                         |    |
> 
> 全体の平均値=668.3
> 全体の中央値=646.2(小さい順に並べて5番目と6番目の平均)
> 
> この信頼区間から、
> 統計的に何がわかり、物理的に何が推定できるのでしょうか。
> 
> 素人ですので統計的推定・判断方法とは異なり、
> 下記推定方法は正しくないのかもしれませんが、
> 何を知ればよいのでしょうか。
> 
> 
> 送信出力の平均値は、数学的な意味合いでしかなく、
> 実際には、信頼区間以外は何らかの異常状態ではないか?
> 異常のデータが4割あるということは、どういうことなのか?
> 原因は発電量なのか?、その原因は衛星の空間的位置なのか?、
> または、衛星の傾きと太陽の関係なのか?
> この変動は最初から想定され、
> 異常とは言えず稼動に問題ない範囲なのか?
> もっと変動が少なくなる送信部の設計が必要なのか?
> 
> 信頼区間内のデータの平均値=658.1
> 信頼区間内のデータの中央値=646.2
> 信頼区間内のデータの平均値が、
> 全体の平均値668.3から中央値に向かう方向にあるということは、
> この辺の660前後が実質的な稼動の中心の値ではないのか?
> 本来あるべき正規分布の中心なのか?
> この660前後が、何の意味合いを持つのか?
> 本来想定した設計電力に合致するのか?
> 
> AO-40のように空間的位置が大きく異なる場合は、
> 今回の値は、
> 大きく変動する内の特定位置で発生する中心値
> ということも考えられますが、
> FO-29ではどうなのでしょうか。
> よくある値なのでしょうか?
> 
> それとも単純に、周期、非周期を問わず
> 機械的な変動なのでしょうか?
> 
> いろいろな推定と問題がでてくると思いますが、
> この信頼区間の結果をどう判断すればよいのでしょうか。
> FO-29の特性や過去のデータ状況もわからないので、
> 単純に今回の結果のみで考えてみました。


補足します。

調査したいものの全体の集まりを「母集団」といい、この母集団から抽出され
たものの集まりを「標本」といいます。その母集団のもつ特質・性質を調べよ
うとした時に、この標本からそれを推定しようというのが目的です。この特質
を表すために、平均や分散・標準偏差を導入するのは自然な流れです。

一般に、母集団のもつ分布や平均・分散(これを母平均・母分散という)がわか
らないので、標本から(標本平均・標本分散という)その母集団の母平均・母分
散を推定しようというわけです。

今、10個の標本 629.9, 649.4, 707.9, 642.9, 642.9, 603.9, 785.9, 759.9,
675.4, 584.4  の標本平均Xを使い、「信頼度95%の未知の母平均mに対する
信頼区間」として、621.8<m<714.8  を求めました。言い換えると、確率を
表す記号Pを用いて、この区間をL1とすれば、P(L1)=0.95  と書けます。
この計算に t-分布を用いたわけです。この式のもつ意味は、真値のmがこの
区間に入る確率は 0.95 であるということです。

同様に、区間 [X−t*(u/root(n))< m <X+t*(u/root(n)]  を用い
て、他の10個の標本から別の区間L2が求まり、やはり P(L2)=0.95 です。
以下同様に、P(L3)=0.95 、P(L4)=0.95  ・・・ です。つまり、大きさ
nの標本を抽出して信頼区間をつくる操作を何回も行うと、その回数が多い時
には、これらの区間のうちmを含むものが、ほぼ 95% あることが期待される
ということ、これが「信頼度 95%」のもつ意味です。


             |                                           
             |          L5 ----+----                     
             |                                           
             |                         ----+---- L4      
             |                                           
             |               L3 ----+----                
             |                                           
             |                                           
             |    L2 ----+----                           
             |                                           
             |          L1 ----+----                     
             |____________________.____________________  
                             |   m   |                 X
                     m-t*u/r(n)      m+t*u/r(n)


上図の例では、信頼区間の L1,L3,L5 の3つが真値mを含み、L2, L4 の
2つは真値mを含んでいない様子を示しています。

従って、ある標本値がこの区間から外れているからといって、それが物理的な
外因による何らかの異常現象が生じた、と結論づけることはできないですし、
また、区間推定の結果から、それ以上の物理的な要因を推測することはできて
も、特定することはできません。

アナログ(JTA)送信電力に関わる統計量の一つとして その平均値を考えた時に、
標本平均を用いて「その母集団の平均mを確率的に推定した」ということです。

つまり、本来 未知の母集団の平均の真値mが、たった 10個の標本からたぶん
確率 95%で この範囲にあるだろう、と統計計算をして推定したにすぎません。
もしかすると 母集団の真値mは、この推定区間からはずれたところ(確率 5%)
にあるかもしれません。確率的ということは、このような意味です。

明らかに大きく外れた数値が多くあったとして、他の統計計算も考慮してその
原因が物理的に、衛星の空間的位置に関係しているのか、太陽との関係なのか、
あるいは送信部の理由によるものなのかが、総合的に判断できるかもしれませ
んが、この区間推定はあくまで今述べたように、母集団や標本という観点から
統計学的・数学的な視点からながめたものです。

今回、その母集団を表す特質の一つを「平均」という尺度で統計学的な考え方
をしてみたわけですが、その尺度には分散や標準偏差の他にも歪度や尖度など
のとらえ方もあります。いずれにしても統計計算というのは、物理学的な扱い
というよりも、どちらかというと数学的な観点からながめていると言えます。

本来、統計学で言う「母集団」とは、例えば「日本の男子全員の身長」とか、
「国民全体の世論調査の集計結果」などを指します。これらの全部のデータを
実際に調査するのは不可能なわけで、このような時にいくつかサンプルを抽出
してその「標本」から「全体」の動向を調べる手法が統計学の趣旨です。

この意味からすると、過去(打ち上げ直後) から未来(墜落直前) に渡って連続
的に送信されて、時間の流れに依存する(時間の関数?)「アナログ送信電力の
デ−タの全集合」を「母集団」とするというのは、かなり無理があります。

また、衛星FO-29 のアナログ送信電力や他の解析データを長期的に眺めると、
大きなサインカーブを描いていることもわかります。そのうちの数分間程度の
部分を時間カットして「母集団」を推定することにも問題があります。

そもそも衛星から送られてくるテレメトリは、信頼される機器からの正確な観
測データで、それが正しく数値変換されたものかどうかも評価のしようがあり
ません。

今回の「統計的解析」は、自分でこの原稿を書いておいて変ですが、物理的に
見ると、はっきり言って意味がないものと思います。

しかし 10個の数値データを純粋な数値とみて、それを統計学的 数学的に処理
するというのは、初めての試みではないでしょうか? このような手法を初め
て紹介して問題提起した、ということでは意味はあったかもしれません。


数理統計学の参考書はたくさんありますが、ここではわかりやすく解説されて
いる、次の3冊を紹介しておきます。

 統計数学入門 本間鶴千代 著 森北出版
 新しい誤差論 吉澤康和 著  共立出版
 確率統計入門 小針明宏 著  岩波書店


 トップ へ戻る.

 次のページ へ移る.

 ホームページ(目次) へ戻る.