サヤ取り実践

正規分布していない価格データでトレードしてはいけない

サヤ取りの正規分布解説
yuki
yuki
この記事では、株のサヤ取りに使ってはいけない価格データのお話です
カオチャイ
カオチャイ
統計的手法での分析は、効くデータと効かないデータがありまして、特にボリンジャーバンドなどを使ったことがある人にはぜひ読んでいただきたい記事ですよ!
サヤ取りがよくわからないという方はまずこちらの記事から
株のサヤ取りとは?
正しい株のサヤ取りとは?聖杯手法と言われているサヤ取りなのになぜ勝てないのか?それには明確な理由がはっきりと存在します。これまでサヤ取りで勝てていなかった人向けに理由と、無料の統計ソフトを使った分析をご紹介します。 ...

 

こんなトレードしたことありませんか?

ボリンジャーバンド

上記はボリンジャーバンドを表示したドル円のチャートです。

ボリンジャーバンドの一番外側(チャートだと3シグマ)にタッチで、「さすがに価格が行き過ぎたから逆張りショートのエントリー」なんてことは誰でも一度は考えたことがある場所かと思います。

しかしこの「行き過ぎた」という考え方は、統計的に滅多にない位置にあるからこその発想で、取り扱っているデータが正規分布している時のみに有効であり、正規分布していないデータには通用しません。

ですので、たとえボリンジャーバンドの3シグマで価格が跳ね返ったとしてもそれは偶然であり、統計的には優位なものとは言えないのです。

カオチャイ
カオチャイ
統計的手法は正規分布に従うデータに最も効果的に働くことが一般的です。その理由は次から詳しく解説していきますのでお付き合いくださいね

 

正規分布しているデータとは?

正規分布wikipediaより「正規分布」

正規分布とは、統計学でよく使われる「釣鐘型」のグラフを描きます。

ベルのような形状から「ベルカーブ」とも呼ばれ、統計の世界では最も重要と言っていいほどの分布です。

データの多くが中心に集まっていて、両端に行くほどデータが少なくなる形状をしており、例えばクラスのテストの点数が正規分布に従っているとすると、平均点の周辺(中央付近)に多くの生徒がいて、高得点や低得点の生徒は両端に分布されて少なくなります。

さて、なぜ正規分布に従うデータで統計的手法が効果的に働くのでしょうか。それは、正規分布が以下のような特徴を持っているからです。

 

正規分布が統計的に優位な理由

平均、中央値、最頻値が一致する

平均: データを全部足して、データの数で割った値。例えば、3人の身長が100cm、120cm、140cmだったら、全部足して360cm、3人いるので360cm÷3=120cmが平均です。

中央値: データを小さい順に並べたとき、ちょうど真ん中にある値。例えば、3人の身長が100cm、120cm、140cmだったら、120cmが中央値です。

最頻値: データの中でいちばん多く出てくる値。例えば、4人の身長が100cm、120cm、 120cm、140cmだったら、120cmが2人いて最も多いので最頻値は120cmです。

正規分布ではこれら3つの値が同じ場所にあるので、どれを使っても同じことがわかります。そのため、データを見るときにどれか1つを知っていれば有効な値をとることができます。

 

対称性

正規分布は、グラフが左右に同じ形をしています。これは、平均値(真ん中)から左右に同じ距離にあるデータの数が同じだということです。

例えば、平均値が10だとすると、9と11の間にあるデータの数や、8と12の間にあるデータの数が同じになります。

この対称性があるおかげで、データの性質を見るときに、バランスが良いことがわかりやすくなります。

yuki
yuki
このように、正規分布は平均・中央値・最頻値が一致し、左右対称の形をしているので、データを理解しやすくなります
カオチャイ
カオチャイ
ちょっと理解が難しい箇所ですが、「データを理解しやすい」ということは、分析しやすく再現しやすいということに繋がると思っていただければ大丈夫です

 

正規分布を実際に見てみましょう

さて、一旦難しい話は置きまして、正規分布を描くランダムな分布を動画で見てみましょう。

下記の動画はガルトンボードというおもちゃの動画です。

 

ガルトンボードは上部の中央から大量の小さな球を流すと12段に別れた杭に当たりながら均等に下の仕切りに散らばっていきます。

球は杭に当たるたびに1/2の確率で左右に別れていき、最終的には下の溝に溜まっていきます。

これが何を意味しているかと言うと、例えば杭に当たるたびに右→右→右→右→右→右→右→右→右→右→右→右とすべて右へ転がった球は一番右側にはいり、逆に左→左→左→左→左→左→左→左→左→左→左→左と転がった球は一番左にはいります。

杭に球があたって転がる方向は1/2の確率で「左と右」に分かれますので、全て同じ方向に流れなければたどり着けない端っこは、かなりレアな現象ということになります。

そのため、中央が高くて両端が低くなる正規分布に収まるわけですね。

 

価格の異常値

さてここで、価格の異常値について考えてみます。

まずガルトンボードに一つだけ赤い玉を入れてみましょう。これを上から落としてみるとどうなるでしょうか?殆どの場合、中央付近に赤い玉は入っていくかと思います。

実は統計的に分布する確率は決まっておりまして、2シグマ以内のどこかに球が収まる率は95%と言われ、3シグマ以内だと99.7%の確率でその中に収まると言われています。

つまり2シグマを超えるのは5/100回(5%)、3シグマを超えるのは3/1000回(0.3%)ということになります。これは結構な異常値といえまして、もしガルトンボードで赤い玉が3シグマを超えたら、次に超えるのはまた300回くらいは落とさないと確率的に超えてこないということになりますね。

この考えですが、もし株価や為替のデータが正規分布していれば赤い玉と同じような考え方が通用します。

例えば株価がボリンジャーバンド+3シグマを超えたところで逆張りのショートをすれば、ほぼ100%に近い確率で勝つことが出来るのですが・・・、

残念ながら現実には勝てませんよね。

正規分布していないデータの取り扱いって難しいんです。

 

正規分布していないデータとは?

正規分布していない所得金額

参考:民間給与実態統計調査|統計情報|国税庁

 

正規分布していないデータ、つまりランダムではないデータもご紹介しておきましょう。

上記の画像は正規分布していない例としてよく出される、「世帯別の収入」です。100万円ごとに区切っていますが左側に偏っていますね。

このデータを見て、「国民の平均所得は549万円6千円!」

なんて言われても、実生活を考えるといまいちピンと来ない人が多いと思います。

それはつまり正規分布になっていないデータで平均を出されても、データが偏っているので上位、または下位のデータに引っ張られて全体の平均を動かしてしまうのです。

2000万円以上の数は少ないですが、この中には年収10億なんて人もはいってしまっていますからね。

上記のチャートで、より実勢に近い数値は平均値の549万6千円ではなく、中央値の427万円です。 参考:経済統計の基礎知識

 

正規分布していないデータで失敗してしまう例

多くの人が正規分布していないデータに基づいて誤った判断をしてしまう例はたくさんあります。

宝くじの購入

宝くじの当選確率は正規分布していませんが、人々は平均的な確率で当たると考えることがあります。これにより多くのお金や時間を宝くじ購入に費やしてしまいますが、実際には宝くじの当選確率は非常に低く、正規分布しているとは言えません。

誕生日の月

クラスメイトの誕生日が何月に集中しているかを予想する場合、正規分布になっていると考えるのは間違いです。実際には、誕生日の月は人によってバラバラで、特定の月に集中することはほとんどありません。そのため、正規分布を使って誕生日の月を予想することは適切ではありません。

株式投資

株価の変動は正規分布していないことが一般的ですが、ボリンジャーバンドを始めとする多くのインジケーターが正規分布しているデータを前提に作られており、それらを使用することで株価データが正規分布していると間接的に誤認していることになります。

株式投資やFXなどのチャート分析の再現性が低い理由の多くは、分析するデータに対して、分析手法を間違えて選択しているの一言につきます。

 

正規分布している株価データの見つけ方

正規分布しているデータ

株価が正規分布しているかどうかですが、残念ながら単体の銘柄で正規分布しているものは存在しません。

これは会社が「成長し続けることを目的」としているためで、株価に一方向の値上がりバイアスがかかっているからです。

そこで株価分析のために正規分布する条件を作ってやる必要があるのですが、BLSシステムを使うと、2銘柄の株価を比較してサヤ(2銘柄の価格差)データの分散をヒストグラムで表すことができ、正規分布しているペアを見つけることができます(上記画像の右下)

 

正規分布している銘柄ペア

日経225とS&P500こちらは日経225と米国S&P500の価格差の散らばり

 

上記は日経225インデックスと米国S&P500インデックスの価格差の分布です。ちょっと右肩が出っ張っていますが、ほぼ正規分布の形に近くなっていますね。

なぜこのように正規分布の形になるのかと言いますとちゃんと理由がありまして、それは日本と米国との経済は密接な関係にあるからです。

例えばアメリカが潤えばアメリカへ進出している日本企業の多くが潤います。そのため、アメリカの景気が悪くなれば日本の景気も悪くなります。

アメリカと日本の関係に限って言うと、円高になれば日本の輸出企業は落ち込みアメリカの輸出企業が潤い、逆に円安になれば日本企業が潤いアメリカの企業は落ち込みます。

いろいろな要因がありますが、このように経済を共存していると、ビルトインスタビライザー(経済の自動調整機能)が働きますので、どちらかだけが行き過ぎるといったことが起こりにくく、サヤデータは正規分布を描きやすくなるのです。

 

正規分布のグラフこちらは8267イオンと7512イオン北海道

 

あと正規分布しやすいサヤデータと言いますと、上記のイオングループのように営業形態が近い企業同士などのデータが正規分布の形になりやすいです。

例えばイオン北海道の経営状況が悪くなれば、イオンから役員が飛んできてイオンで成功した事例を使ったテコ入れが始まりますし、ヒット商品などの情報データ、工場の機能などもグループ内で共有ができます。

そのため、どちらかの株価が極端に高くなり、どちらかが極端に低くなるということが起こりにくく、その結果、正規分布の形に収束していきます。

カオチャイ
カオチャイ
BLSシステムではこういうペアを見つけてサヤ取りを狙っていきます

 

【分析の疑問】期間は長期を重視?それともきれいな形の期間だけを重視?

BLSシステムでは正規分布を見つけるためのヒストグラムの検証期間を自由に変更することができます。

この際に疑問として浮かぶのが、多少形が崩れていても多くのデータが含まれている長い期間を重視するべきか、それとも期間は短くなるものの、正規分布が崩れていない中で一番長い期間を取るかです。

この答えですが、基本的にはデータが正規分布になっているという条件で、一番長い期間をとってください。

理由として、企業の利益構造は市場環境が変われば大きく変わります。

例えば富士フィルムは元々はカメラや写真関連の企業でしたが、現在では化粧品・医薬品事業に転換しています。

カメラ事業をメインに行なっていた時と、化粧品・医薬品事業を行っている現在の価格データではまったく別の企業になります。

統計というものは前提条件が同じデータの中での数値のばらつきを見るものですので、正規分布がくずれるような業態転換が起きた場合、そのデータを混ぜてはいけないということです。

 

BLSシステム有料プラン2週間おためしチケット

2週間無料チケット

BLSシステムの無料版では日経225の分析が可能ですが、有料版では東証一部銘柄、マザース、ジャスダックなどの分析も可能になります。

有料版をお試しになりたい方は、BLSシステムメニュー画面の【設定】→【月額利用料お支払い】画面の下部に、2週間フルバージョンの無料チケットがございます。

お一人様一回のみご利用いただけますので、ひとまず無料プランを一通りお試しいただいて一通りの機能を把握してからからぜひご利用くださいませ。

 

正規分布でわかるボリンジャーバンドの真実【ガルトンボード】 まとめ

yuki
yuki
これまで正規分布の重要性を説明するのに結構な手間がかかっていたのですが、ガルトンボードのおかげで、完璧ではないにしろ、かなりの方に理解してもらえるようになってきました!
カオチャイ
カオチャイ
トレードで勝つためには正しいデータの扱い方は絶対に知っておかなければいけませんからね
yuki
yuki
BLSシステムには他にも一般的なソフトにはない統計分析が詰まっていますので、ぜひお試しくださいね!
実際にBLSシステムを使ってみよう
ダウンロード
BLSシステムのダウンロードページこちらはバフェットロング・ショートシステム(BLSシステム)のダウンロード専用ページです。 初めてご利用の方は2週間無料チケットもご利用いただけますよ。...
無料版ならこの簡単マニュアルがおすすめ
簡単マニュアル
BLSシステム簡単マニュアル【無料プラン専用】 ※無料プランから有料プランへの移行方法はこちら BLSシステムの有料プランと無料プランの違い バフェットロング・ショートシス...
知っておいて損はないサヤ取りの方法
SBIネオトレード証券の注文方法
SBIネオトレード証券でのサヤ取り注文方法 https://fx-ea-labo.com/sayadori/first_order/ サヤ取りにおすすめのSBIネオトレー...
散布図で相関の強いサヤ取りペアを見つけよう 散布図とは? 上記はとある大学生グループのウェスト(お腹回り)と体重の一覧表です ウェストと体重の関係を散布...