どせいたんさき。

ナスダヨー

clipping-mean についてもやもや

clipping-mean についていろいろと考えたことをもやもやと書き記しておく.

clipping-mean のアルゴリズムについて

おもに idlastromeanclip を参考に勉強.値のメディアン値からのズレ標準偏差の何倍であるかで clip するかどうかを判別するようになっている.平均からのズレじゃないのはハズレ値に引きずられないため.

平均とメディアンでどれくらい変わるのかというのを簡単に計算してみた.

問題設定と計算

宇宙線か何かの影響を受けて値がおかしくなっているピクセルを取り除いて画像の足し合わせをしたい.まったく同じピクセルに宇宙線が何度も当たることは稀なので足し合わせる画像のうち 1 枚だけ値がおかしくなっているような状況を考える.問題のピクセルだけ考えればいいので標本としては以下のようになる.

メディアンが平均と同じになってしまってはおもしろくないので N > 1 としておく.αは適当な数.この X に対してそれぞれ平均値,分散,メディアン値を計算すると以下の通り.

平均値からのズレ,メディアンからのズレをそれぞれ標準偏差で割ると以下のようになる.というわけで平均値からのズレではなくメディアンからのズレを採用することで N+1/N 倍だけ得をする(?)ことがわかった.

   

clipping が効くかどうかは枚数依存

計算結果からすれば clipping が効くかどうかは α に依存しない.ハズレ値が大きくなると標準偏差が引っ張られることでキャンセルされるらしい.というわけで,枚数の平方根あたりに clipping のしきい値をセットしておけば clipping が効くと推定できる.テストデータで試してみたところ,だいたいこの状況が再現できた.

多くの clipping-mean は 3 sigma がデフォルトのしきい値としてセットされているような気がするのだけど,このデフォルト値が有効になるにはだいたい 9 枚くらい足し合わせる画像が必要なんじゃないかと予測できる.枚数が少ない時に 3 sigma で clip しても宇宙線は消えません.たぶん.

……本当かな?間違いとか見つけたらコメントください.