
こんなトレードしたことありませんか?

上記はボリンジャーバンドを表示したドル円のチャートです。
ボリンジャーバンドの一番外側(チャートだと3シグマ)にタッチで、「さすがに価格が行き過ぎたから逆張りショートのエントリー」なんてことは誰でも一度は考えたことがある場所かと思います。
しかしこの「行き過ぎた」という考え方は、統計的に滅多にない位置だからこその発想ですが、実は取り扱っているデータが正規分布している時のみに有効であり、正規分布していないデータには通用しません。
ですので、たとえボリンジャーバンドの3シグマで価格が跳ね返ったとしてもそれは偶然であり、統計的には優位なものとは言えないのです。
正規分布しているデータとは?
正規分布とは、統計学でよく使われる「釣鐘型(つりがねがた)」のグラフを描きます。
ベルのような形状から「ベルカーブ」とも呼ばれ、統計の世界では最も重要と言っていいほどの分布です。
データの多くが中心に集まっていて、両端に行くほどデータが少なくなる形状をしており、例えばクラスのテストの点数が正規分布に従っているとすると、平均点の周辺(中央付近)に多くの生徒がいて、高得点や低得点の生徒は両端に分布されて少なくなります。
そして正規分布しているデータというのは変なバイアスがかかっておらず、正規分布の範囲の中でランダムに動いていることを表します。
この正規分布に従ってランダムに動くということは非常に重要で、例えば3σまでデータが飛んでも、それはただのレアケースでいずれ戻ってくると判断ができます。
もしこれが正規分布に従っていないデータの場合だと3σはランダムに付けたレアケースではなく、なんらかのバイアスがかかって4σ、5σと進んでもおかしくないということになります。株の世界では成長バイアスがあるので、サヤが戻ってこないというのはこの正規分布に従っていないというのが理由です。
では次に、なぜ正規分布に従うデータで統計的手法が効果的に働くのかを簡単に解説していきます。
正規分布が統計的に優位な理由
平均、中央値、最頻値が一致する
平均: データを全部足して、データの数で割った値。例えば、3人の身長が100cm、120cm、140cmだったら、全部足して360cm、3人いるので360cm÷3=120cmが平均です。
中央値: データを小さい順に並べたとき、ちょうど真ん中にある値。例えば、3人の身長が100cm、120cm、140cmだったら、120cmが中央値です。
最頻値: データの中でいちばん多く出てくる値。例えば、4人の身長が100cm、120cm、 120cm、140cmだったら、120cmが2人いて最も多いので最頻値は120cmです。
正規分布ではこれら3つの値が同じ場所にあるので、どれを使っても同じことがわかります。そのため、データを見るときにどれか1つを知っていれば有効な値をとることができます。
対称性
正規分布は、グラフが左右に同じ形をしています。これは、平均値(真ん中)から左右に同じ距離にあるデータの数が同じだということです。
例えば、平均値が10だとすると、9と11の間にあるデータの数や、8と12の間にあるデータの数が同じになります。
この対称性があるおかげで、データの性質を見るときに、バランスが良いことがわかりやすくなります。
正規分布を実例で見てみましょう
さて、一旦難しい話は置きまして、正規分布を描くランダムな分布を動画で見てみましょう。
下記の動画はガルトンボードというおもちゃの動画です。
ガルトンボードは上部の中央から大量の小さな球を流すと12段に別れた杭に当たりながらランダムに下の仕切りに散らばっていきます。
球は杭に当たるたびに1/2の確率で左右に別れていき、最終的には下の溝に溜まっていきます。
これが何を意味しているかと言うと、例えば杭に当たるたびに右→右→右→右→右→右→右→右→右→右→右→右とすべて右へ転がった球は一番右側にはいり、逆に左→左→左→左→左→左→左→左→左→左→左→左と転がった球は一番左にはいります。
杭に球があたって転がる方向は1/2の確率で「左と右」に分かれますので、全て同じ方向に流れなければたどり着けない端っこは、かなりレアな現象ということになります。
そのため、中央が高くて両端が低くなる正規分布に収まるわけですね。
価格の異常値
さてここで、価格の異常値について考えてみます。
まずガルトンボードに一つだけ赤い玉を入れてみましょう。これを上から落としてみるとどうなるでしょうか?殆どの場合、中央付近に赤い玉は入っていくかと思います。
ここでボリンジャーバンドがでてくるのですが、統計的に玉が分布する確率は決まっておりまして、2シグマ以内のどこかに玉が収まる率は95%と言われ、3シグマ以内だと99.7%の確率でその中に収まると言われています。
つまり2シグマを超えるのは5/100回(5%)、3シグマを超えるのは3/1000回(0.3%)ということになります。これは結構な異常値といえまして、もしガルトンボードで赤い玉が3シグマを超えたら、次に超えるのはまた300回くらいは落とさないと確率的に超えてこないということになりますね。
この考えは、株価や為替のデータが正規分布していれば同じような考え方が通用します。
例えば株価がボリンジャーバンド+3シグマを超えたところで逆張りのショートをすれば、ほぼ100%に近い確率で勝つことが出来るのですが、残念ながら現実には勝てませんよね。
それはお察しの通り、株価や為替は正規分布していないデータだからなんです。
正規分布していないデータとは?

正規分布していないデータ、つまりランダムではないデータもご紹介しておきましょう。
上記の画像は正規分布していない例としてよく出される、「世帯別の収入」です。100万円ごとに区切っていますが左側に偏っていますね。上限の位置もよくわかりません。
このデータを見て、「国民の平均所得は549万円6千円!」
なんて言われても、実生活を考えるといまいちピンと来ない人が多いと思います。
それはつまり正規分布になっていないデータで平均を出されても、データが偏っているので上位、または下位のデータに引っ張られて全体の平均を動かしてしまうのです。
これは株価や為替のデータに当てはめた場合も同じで、ボリンジャーバンドを表示して「3σにタッチしたらからいずれ真ん中のラインまで戻ってくるはず!」といってエントリーしても、データが偏っているせいで価格がいつまでたっても戻ってこないということが起こります(とても頻繁に)
正規分布していないデータで失敗してしまう色々な例
多くの人が正規分布していないデータに基づいて誤った判断をしてしまう例は他にもたくさんあります。
宝くじの購入
宝くじの当選確率は正規分布していませんが、人々は平均的な確率で当たると考えることがあります。
しかし、宝くじの当選確率はとても低くほとんどの人が当たらないため、正規分布の釣鐘型の形のグラフにはなりません。
誕生日の月
クラスメイトの誕生日が何月に集中しているかを予想する場合、正規分布になっていると考えるのは間違いです。
実際には、誕生日の月は人によってバラバラで、極端に言うと1年の12ヶ月すべてに均等に分布する可能性があります。そのため、正規分布の形にはなりません。
株式投資
株価の変動は正規分布していないことが一般的ですが、ボリンジャーバンドを始めとする多くのインジケーターが正規分布しているデータを前提に作られており、それらを使用することで株価データが正規分布していると間接的に誤認していることになります。
株式投資やFXなどのチャート分析の再現性が低い理由の多くは、分析するデータに対して、分析手法を間違えて選択しているの一言につきます。
正規分布している株価データの見つけ方

株価が正規分布しているかどうかですが、残念ながら単体の銘柄で正規分布しているものは存在しません。
これは会社が「成長し続けることを目的」としているためで、ほぼ全ての株価に一方向の値上がりバイアスがかかっているからです。
そこで株価分析のために正規分布する条件を作ってやる必要があるのですが、当サイトで公開しているBLSシステムを使うと、2銘柄の株価を比較してサヤ(2銘柄の価格差)データの分散をヒストグラムで表すことができ、株価が正規分布しているペアを見つけることができます(上記画像の右下)
正規分布している日本とアメリカの経済
こちらは日経225と米国S&P500の価格差の散らばり
上記は日経225インデックスと米国S&P500インデックスの価格差の分布です。ちょっと右肩が出っ張っていますが、ほぼ正規分布の形に近くなっていますね。
なぜこのように正規分布の形になるのかと言いますとちゃんと理由がありまして、それは日本と米国との経済は密接な関係にあるからです。
アメリカには多くの日本企業が進出していますし、日本にも多くのアメリカ企業が進出しています。クレジットカードやスマートフォンなど、日本人が何気なく使っているものの多くがアメリカの利益に直結しているので、日本の不景気はアメリカにも影響がでます。
また、アメリカと日本の貿易関係に限って言うと、円高になれば日本の輸出企業は落ち込みアメリカの輸出企業が潤い、逆に円安になれば日本企業が潤いアメリカの企業は落ち込みます。
いろいろな要因がありますが、このように経済を共存していると、ビルトインスタビライザー(経済の自動調整機能)が働きますので、どちらかだけが行き過ぎるといったことが起こりにくく、サヤデータは正規分布を描きやすくなるのです。
正規分布しているグループ企業
こちらは8267イオンと7512イオン北海道
企業に落としこんで正規分布しやすいサヤデータと言いますと、上記のイオングループとイオン北海道のように、営業形態が近い企業同士などのデータが正規分布の形になりやすいです。
例えばイオン北海道の経営状況が悪くなれば、イオンから役員が飛んできてイオンで成功した事例を使ったテコ入れが始まりますし、ヒット商品などの情報データ、工場の機能などもグループ内で共有ができます。
そのため、どちらかの株価が極端に高くなり、どちらかが極端に低くなるということが起こりにくく、その結果、正規分布の形に収束していきます。
【分析の疑問】期間は長期を重視?それともきれいな形の期間だけを重視?
BLSシステムでは正規分布を見つけるためのヒストグラムの検証期間を自由に変更することができます。
この際に疑問として浮かぶのが、多少形が崩れていても多くのデータが含まれている長い期間を重視するべきか、それとも期間は短くなるものの、正規分布が崩れていない中で一番長い期間を取るかです。
この答えですが、基本的にはデータが正規分布になっているという条件で、一番長い期間をとってください。
理由として、企業の利益構造は市場環境が変われば大きく変わります。
例えば富士フィルムは元々はカメラや写真関連の企業でしたが、現在では化粧品・医薬品事業に転換しています。
カメラ事業をメインに行なっていた時と、化粧品・医薬品事業を行っている現在の価格データではまったく別の企業になります。
統計というものは前提条件が同じデータの中での数値のばらつきを見るものですので、正規分布がくずれるような業態転換が起きた場合、そのデータを混ぜてはいけないということです。
BLSシステム有料プラン2週間おためしチケット

BLSシステムの無料版では日経225の分析が可能ですが、有料版では東証一部銘柄、マザース、ジャスダックなどの分析も可能になります。
有料版をお試しになりたい方は、BLSシステムメニュー画面の【設定】→【月額利用料お支払い】画面の下部に、2週間フルバージョンの無料チケットがございます。
お一人様一回のみご利用いただけますので、ひとまず無料プランを一通りお試しいただいて一通りの機能を把握してからからぜひご利用くださいませ。
正規分布でわかるボリンジャーバンドの真実【ガルトンボード】 まとめ



