|
|
●概要 初期値は何でも良いと言う訳ではなく、その後収束を決定付ける大切な要素である。多倍長の場合は、一般には、CPUネイティブ除算で、逆数を求め初期値にする。.NET の場合は、Double による初期値なので、15桁程度の精度となる。一般に、初期値の精度の次数倍づつ精度が上がるとされている。 ●収束方程式 2次収束での収束を式で表すと、
DF = 2n・DS となる。上式を変形し、DF = 2F 、DS = 2S とし、2 の対数を取れば、 n = -S + F とむちゃくちゃ簡単な式が得られる。この式で、S = F とすれば、回数は 0 となる。漸化する必要なしとなるので、なんとなく正しいような気がする。
●高い精度で演算する 例えば、初期値を 1024桁、つまり 210 からスタートすれば、上図から、収束回数は6回となる。この初期値は、通常の精度16桁、つまり 24 から求めるとすれば、収束回数は同じく6回となる。結局合計の回数は一定となる。しかし、1024桁の精度では、1024桁の精度で演算すれば良いのだから、演算時間は減るはずである。 ニュートン漸化式の単位演算時間を f(X) (X は演算精度) とすれば、上のことは以下の式で表現できる。 通常の初期値による演算時間 Tu = n・f(Xm) 中間精度による演算時間 Tc = n1・f(Xc) + n2・f(Xm) となる。一般に、FFT乗算なので、f(X) は一次関数以上の次数となる。ところで、 n1 + n2 = n なので、n2 = n - n1、だから、
Tc = n1・f(Xc) + n2・f(Xm) となる。ところが、f(Xc) - f(Xm) < 0 である(少なくとも単調増加関数で Xc < Xmなので)ので、結局、 Tc < Tu となる。つまり、中間の初期値で演算した方が速くなることになる。FFT乗算では、一般には、f(X) ∝ g(X)log(g(X)) と、一次よりは次数が高いので、より期待は持てる。 下図は、ニュートン漸化式をシミュレーションした結果である。
15の列が通常初期値の場合の演算時間で、64、128 と中間初期値を変化した場合の演算時間の表である。緑色が、その目標精度で最も速かった中間初期値となる。ほぼ、倍の速度が得られている。 ●多段初期値 上記を、中間の初期値を求める場合にも適用(相似)すれば、元より速くなると言える。これを一般化すれば、演算精度を徐々に上げながら、複数の初期値を順々に求めていけば、更に速くなると思われる。 T = 馬i・f(Xi) < Tu 但し、n = 馬i である。但し、演算精度を徐々に上げながら が本法のミソである。 下図は、多段初期値方式を高次収束を含めてシミュレーションした結果である。
このシミュレーションでは、高次収束も含めて行っている。しかし、結局、2次収束が最も早かった。1/4単位とは、目標精度の1/4づつ初期値を漸化して行く意味である。刻みを細かくすれば、セットアップやオーバヘッドが増加するし、n < 馬i になる確率が高くなり不利になる。何もしない方式より高い精度域では 5 倍程度の速度が得られる。 結局、ここでは、2次収束、1/4単位多段初期値方式とした。 ●実測値 シミュレーションでは傾向しかつかめないので、実測した。結果を見ると、1/4単位多段初期値が一番成績が良く、シミュレーション通りとなった。図らずも、シミュレーション自体の有用性も確認できた。 図で、初期値15桁が基準となる方式、回数は、ニュートンの収束回数で、基準以外では最終段の回数。()内の桁数は、基準の値との一致桁数で、いずれも精度に近い値となっており、演算に問題がないことが分かる。100万桁では4倍速くなっている。
|