べんきのにっき

いろいろと垂れ流します。

統計検定2級の呪縛から逃れる例

※この記事は data-refinement Advent Calendar3日目の記事です。

概要

以前、自分が統計検定2級に合格した時の勉強法を書いた。

高尚ではなくただ受かればよいという目的を持つ、意識の高くない人の勉強法の一例である。

一例と言いながらも、自分の例だけでなく指導しているときの問題傾向なんかの情報が混ざっている。*1

1行要約

合格するだけなら公式テキストを周回して2016年以降の過去問を解くだけでも十分。


対象になる人

何らかの事情があって、統計検定2級に合格する必要がある人

使いこなせるとか身につくとかよりも、統計検定2級に合格することが目的である人

対象ではない人

統計をきちんと学びたくて、その通過点として統計検定2級を取得したい人

これ書いた人

統計検定対策指導をしている*2。(仕事の一部ではあるけど本業ではない)

過去実施された統計検定2級の全ての問題を解いている(2018年12月現在)*3

統計検定は2級、準1級、1級に合格している

統計検定対策を始める以前には、特に統計について真面目に勉強したことはなかった

数学は苦手*4


目的と勉強方針

1.とりあえず合格すればよい

2.あまり多くの書籍を使いたくない(そんなに何冊も読めないし、出費もしたくないし、WEBで頑張って検索するのも面倒)

3.理論を深追いしない(そんなに意識は高くないし、頭も良くない)

使用した書籍

1冊目:統計検定2級の公式テキスト

Amazonの書評では散々だが、使用する理由はある。

理由1:出題範囲との整合

統計検定2級の出題範囲はそれなりに手広い。(深い部分を問われるかどうかはさておき)

読んだこともない、知らないというだけで本試験で解けない問題が出てくるのは非常に勿体無い*5ため、出題範囲は一通りカバーしておきたい。

しかし、微妙に広い出題範囲のせいか、公式テキスト以外で勉強しようとすると何冊か併用する必要がある。 さらにその何冊かを「必要な部分だけちょっと読む」感じになり、非常に面倒くさい。

その点、公式テキストは出題範囲を一応カバーしており、1冊で事足りるため手軽である。

【補足】

よく、東大出版の赤本を推す人もいるが、あれ1冊では2級の範囲をカバーしきれない。 (例えば、箱ひげ図の話や分散分析が抜けている)

小島寛之の「完全独習 統計学入門」は導入にはよいかもしれないが、その1冊では足りない単元が多すぎる。

この2冊は悪い本ではないが、1冊で2級対策を済ませたいという目的には合わない。

理由2:自身の目的との整合

別に合格するだけなら深い理解は必要ない。

公式テキストは導出がないとか展開が唐突だとか言われているが、そもそも導出には興味ないし、必要な式や内容だけを覚えていればよい。

例えば検定なら、どの場合(1標本、2標本、対応のある2標本、母分散既知、母分散未知etc)に何の式を使えば計算できるかを覚えれば問題は解ける。

天下り的なのはよくないとか、そんなことを言っている場合ではない。問題が解ければそれで良い。

【補足】

一応補足しておくと、各種検定統計量とか回帰分析のあれこれの導出なんてものは真面目にやると1級の範囲になる*6

例えば1標本t検定の検定統計量について、標本平均と標本分散が独立であることまで導出したいのだろうか。

意地の悪い言い方をすると、そもそも確率変数すらガバガバな定義である。そこに疑問はなかっただろうか。(どこまで頑張りたい?私はそんなに頑張る気力はなかった。)

2級に合格するだけならそんな高尚な内容は必要ない、なんとなく結果の使い方を知っていれば大丈夫である。

つべこべ言わず覚えてしまおう。

細かいことが気になるなら、合格してから好きなだけ深入りすればよい。

2冊目:統計検定2級の過去問題集

日本統計学会公式認定 統計検定 2級 公式問題集[2015〜2017年]

日本統計学会公式認定 統計検定 2級 公式問題集[2015〜2017年]

  • 発売日: 2018/03/22
  • メディア: 単行本(ソフトカバー)

過去問は大事、試験1~2ヶ月前くらいからどんどん解いて慣れておこう。 ただし、2016年6月以降の過去問から始めよう。これの理由については後述するけど、試験問題の傾向変化によるもの。

余力があるなら2015年以前の過去問を解いてもいい、ただし必須ではない。


学習方法と経過

ひたすら公式テキストを読む

1〜2ヶ月ほど、適当な時間に公式テキストを読んでいた。 だいたい土日ぐらいにしか読んでいなかった気がするが、少なくとも2~3周はした覚えがある。

2ヶ月経った時点で過去問を解いたら満点だった。

そこで慢心して試験前まで2級については放置した、実に愚かである。

過去問を解く

試験1週間くらい前から、過去問を全て解いた。

結構似通った出題パターンもあり、解いている途中で問題慣れした感じがした*7

結果

優秀成績賞で合格した。


試験対策方法について思うこと

テキストの読み方について

明らかに難しそうな内容は後回しにしてよい。何周かしながら、わかるところを徐々に増やしていこう。

例えば、推定量の性質として不偏性と一致性を学ぶことになるが、一致性についてはその意味が理解しづらい。 最初は不偏性だけよく読み、一致性は何となく読んで次に進む、という読み方をすればよい。

【補足】

一致性は確率収束のアイデアが必要で、チェビシェフの不等式かL2収束かε-Nみたいな方面から解説されることがある。 これは最初は結構難しいし、そのレベルの計算を伴う内容が試験に出題されることは過去に一度もない。*8

一方で「不偏分散は一致推定量である、○か×か?」みたいな出題があるから、代表的な推定量(標本平均、不偏分散、標本分散、標本標準偏差)はそもそも一致性を満たすことを覚えておいた方がいい。それだけで得点できる。

問題傾向について

統計検定2級については、2016年6月試験から少しずつ問題傾向が変わっている。

これに伴い、簡単な積分計算など高校レベルの計算問題や、確率分布の定義っぽいものの出題をちらほら見かけるようになった。

他にも2015以前の過去問と比較し問題構成がやや変化している*9ため、それ以前の過去問が(少し)役に立たなくなった。

計算問題について

確率分布が与えられ、平均や分散、第n四分位を求めよ、といった出題がされる。

基本的に数学2(文系でも習う範囲)の微積で解ける。つまり2次関数の微積までで解ける。

平均や分散は具体的な積分ができないと解けないから、 y= x  y= x ^{2}微分積分を覚えておくとよい。

ただし、密度関数が一次関数で与えられた場合の四分位点については、三角形や台形の面積で解くことができるため、小中学生レベルの計算*10で済む。 あまりに算数が苦手でないなら、解けるようにしておくとよいだろう。


最後に(この記事を書いた理由)

個人的に、こういうタイプの検定試験は足の裏についた米粒みたいなものだと思っている。 (つまり、さっさと取って楽になってしまいたい。)

試験対策で無駄に疲弊したり、試験に合格できなくてやる気を失くしてしまうよりは、正攻法でなくてもササッと合格してから好きな分野を勉強した方がよほど建設的じゃないだろうか。

あと、巷の合格体験記は意識が高いものが結構見受けられたので、意識が低いものも出しておきたかった。

Amazonで悪評高い公式テキストだけ読んでいても優秀成績で合格できるんだから、そこまで頑張らなくてもいいんじゃない?と、それだけ。

*1:私自身は2016以前に取得しているので、問題傾向は指導時の経験

*2:ただし実際に指導するときはこの記事のようにはせず、真面目に全力で教えている。(あまりに意識が低すぎるため)

*3:統計検定オタクではないが、指導する上で問題傾向は把握している

*4:大学の頃、数学と統計にはこの先の人生では関わらないでおこうと誓った程度。後にこの誓いは破られた。

*5:ペラッペラな知識でも知ってさえいれば解けるタイプの問題もある

*6:これを知らずに「原理や導出から!」と息巻くと大抵行列も微積もわからずに詰む。諦めて使い方を覚えるのに徹しよう。

*7:過去問に適応するのを過学習とかいう人もいるけど、受かればいいだけなので傾向を学習するのは問題ないと思う

*8:大学基礎レベルの計算が試験で出題されたことはない。基本的に高校生文系レベルの微積までで全て解けるようになっている。

*9:例えば、第1問では変数の尺度や箱ひげ図について出題される、などの一定の傾向が存在していた

*10:無理数が出てくるため中学生も範囲に入れているが、実際に使う公式は三角形や台形の面積公式である