トランジスタの試聴結果の計算方法を変えてみました。
新しい方法では、以下のようにスコアを計算します。得られた数値は「勝率」になります。
- 「良い」と判断されたら1点とする。
- 「良い」と判断されなかったら0点とする。
- 平均点をスコアとする。
このようにすると、「良い」と判断されたときの偏差は (1 – score) そうでないときには (0 – score) とできるので、ここから分散が
((1 – score)^2 x (勝ち数) + (0 – score)^2 x (負け数)) / 総比較数
と計算でき、標準偏差が得られます。標準偏差が得られれば、信頼区間が計算できます。
一般的な信頼区間の計算方法は以下のとおりです(95% 信頼区間の場合)
信頼区間 = 1.96 x 標準偏差 / sqrt(総比較数)
この計算ができるように結果集計スクリプトを修正しました
https://github.com/naokiiwakami/listening_test/tree/fa6c17847b93b8834b890676cd8debfd4ad6e63f
このスクリプトを元に計算した試聴結果
やはり聴いた印象どおり、2N5087 と 2N5210 以外ははっきりした差がないようです。
この時点でトランジスタを何にするか決めても良いのですがもうすこし興味がわいたのとせっかく試聴試験のフレームワークができたのでもうちょっとだけ追求してみようと思います。