ゲームとアフィン(Afin)変換

平野拓一

概要(ゲームとアフィン変換)

最近のゲーム機(プレイステーション、ゲームキューブ、X-Box など)ではキャラクターが多角形の集合(ポリゴン)で表現されている。多角形は普通簡単のために三角形で表現される。ゲームでコントローラを操作してキャラクターを移動させる場合を考えると、まずポリゴンの座標を計算し直す(この作業を座標変換と言う)。その後、その三次元の座標をテレビのスクリーンに合うように二次元の座標に変換して(投影と言う。これも後で説明するように座標変換の一部としてとらえることができる)、その二次元の座標データをもとに色を塗ったりして画面に絵を描く(レンダリングと言う)。
このような作業が高速で瞬時に行われているために、滑らかに綺麗な映像が動いてゲームができるのである。細かく言うと、普通1/60秒毎に画面を描き変えてパラパラ漫画のようにアニメーションを見せているのである。アニメーションの一つの画面を「フレーム」と言い、一秒間に60回画面を描き変える場合、「秒間60フレーム」と言う。ゲーム機の心臓部のコンピュータであるCPUは画面描画の処理だけを行えば良いという訳ではなく、本来の目的であるゲームの進行状況の処理をする必要もあり、昔の遅いCPUでは画面を描く処理が間に合わなくなることもあった。例えばファミコンのグラディウス(コナミ)で敵や弾がいっぱい出現したときにはものすごく動きがスローになる場合があったが、それは本来のゲームの進行処理(弾が当たったかどうかなど)が間に合わないから画面の更新を例えば1/60秒から1/30秒に一時的に落とすような処理をしているからである(ただし、ファミコンの時代にはポリゴンなど使わず、キャラクターを単にドットの集合で描いていただけである)。テレビ(CRT)が画面を更新するスピードが決まっているから(電子銃をスイープしているから)、少しゲーム自体の処理が遅れたからといって、少しだけ画面の更新を遅らせるということが出来ないからである。つまり、処理が少し遅れたとしても画面の更新速度は整数分の1にするしかない。
実際には映像信号を出力するビデオチップは画面の横方向に電子を走査し終わったことを伝える水平同期割込み(HSYNC)と縦方向に一画面分電子を走査し終わったことを伝える垂直同期割込み(VSYNC)をCPUに対して出しており、VSYNC割込みに合わせて画面を描き変えるようにしている(余談だが、HSYNC割り込みを利用して画面を横方向にグニャグニャとうねらせるラスタースクロールというテクニックもある)。最近のゲーム機では座標変換とレンダリングを行う特別な専用チップがあって、CPUは座標だけその回路に渡して後は自分の仕事に専念できるようになっている。

余談であるが、レンダリングの内容について説明すると、ポリゴンの二次元データを元に画面(正確にはVRAM, ビデオRAM)に描いていく訳だが、画面からはみ出るポリゴンは描かないようにしたり、画面の端をまたぐポリゴンは画面内に残る部分だけを描画する。この作業をクリッピング(Clipping)と言う。奥にあるポリゴンが手前のポリゴンに隠れるような処理をするのによくZバッファ法が用いられる。これらの作業も現在では専用回路が自動的に行うようになっている。
次に色付けについて説明する。ポリゴンの面の法線ベクトルを使ってポリゴン内を同一色で塗ると、キャラクターがカクカクに見えてしまう(セガサターンのゲームでよく見られた)。そこで、ポリゴンに色を塗るときになるべく滑らかに見えるように工夫されている。まず、グローシェーディングと呼ばれる方法について説明する。最初にあるポリゴンについて隣接するポリゴンの平均の法線ベクトルを使って頂点の位置での法線ベクトルを求め、その法線ベクトルを使って色を決める。次に、それらの頂点の色をポリゴンの面内に内挿すると見違えるほど滑らかに見えるのである。プレイステーションではグローシェーディングがハードウェアで用意されていた。なお、セガサターンではグローシェーディングがハードウェアで用意されていなかったため、プレイステーションにくらべてキャラクターがガタガタだったのである。より高度なものでは頂点の法線ベクトルの平均値を面内に内挿してスムーズに色づけするフォーンシェーディングがある。
なお、法線ベクトルからその点の色を決める方法にも、単純に光線がそこに到来する角度との内積を取る方法と、物体毎に光の吸収率を定義して、光の物体による多重反射も考慮する方法などがある。後者の色付け方法はレイトレーシング(Ray Tracing)と言われ、「ジュラシックパーク」、「アポロ13」などの映画でも使われている方法で、驚く程リアルな映像を作り出す。残念ながら、リアルタイム処理が要求されるゲーム機ではまだレイトレーシングが使われていないが、将来実用化されていくことは間違いない。また、レイトレーシングよりもよりリアルな映像を作り出す方法もいくつかあるが、より多くの計算時間がかかるため、現在では映画製作などにレイトレーシングが多く使われている。

座標変換

さて、前置きが長くなったがゲームで画面を描く作業をまとめると
(1) 座標変換
(2) レンダリング
が高速に繰り返されている。本稿では、(1) の座標変換で使われているアフィン変換について説明する。

まず、高校の数学(代数・幾何)では行列で座標変換を行う次のような一次変換を習った。点P = (x)       y       zを点P ' = (x ')         y '         z 'に移す場合、変換行列A = (a     a     a  )       11    12    13       a     a     a       21    22    23       a     a     a       31    32    33を用いて
(x ') = (a     a     a  ) (x)           11    12    13  y '                       y          a     a     a  z '      21    22    23   z           a     a     a           31    32    33 <=> P ' = A P         (1)
と表される。
この行列Aは「拡大・縮小 (scaling)」、「回転(rotation)」の合成となっている。
なぜならば、
(a  ) = (a     a     a  ) (1)   11      11    12    13                            0  a       a     a     a   21      21    22    23   0   a       a     a     a   31      31    32    33
(a  ) = (a     a     a  ) (0)   12      11    12    13                            1  a       a     a     a   22      21    22    23   0   a       a     a     a   32      31    32    33
(a  ) = (a     a     a  ) (0)   13      11    12    13                            0  a       a     a     a   23      21    22    23   1   a       a     a     a   33      31    32    33
となり、各基底(1)   0   0,(0)   1   0,(0)   0   1(a  )   11   a   21   a   31,(a  )   12   a   22   a   32,(a  )   13   a   23   a   33にそれぞれ変換される。別の言い方をすると、
(x ') = (a     a     a  ) (x) = x(a  ) + y(a  ) + z(a  )           11    12    13           11 ...     a     a            a        a        a           31    32    33           31       32       33
となり、基底(1)   0   0,(0)   1   0,(0)   0   1で張られる空間は基底(a  )   11   a   21   a   31,(a  )   12   a   22   a   32,(a  )   13   a   23   a   33で張られる空間に移り、下の図のイメージのようになる。

[Graphics:HTMLFiles/index_22.gif]


上のイメージを見てもわかるが、この変換では
x ' = 2 x + 3, y ' = y + 1, z ' = 3 z + 2
のようなT = (3)       1       2の平行移動は行列で表すことができず、
P ' = A P + T         (2)
というようにベクトルの足し算を行うしかない。これでもいいが、ゲームでは1つのフレームを作るために多くの頂点を同じように変換する必要がある。そのとき、同じ行列をベクトルに掛けるだけで処理できた方がより高速になるし、計算も簡単になる。
そこで、アフィン変換では平行移動も行列の掛け算として扱えるように(Aに含めることができるように)工夫されている。

アフィン変換

平行移動も行列で扱い、行列の積の結合規則a * (b * c) = (a * b) * c, 演算の順番を変更できる性質)が適用できるようにするために次元を1つ増やす。行列の結合規則が使えるということは計算量を減らし、演算を高速化するために非常に重要である。

行列の結合規則の重要性を説明するために、ポリゴンの頂点をP(ベクトル)とし、それを座標変換(ベクトルに対する行列の掛け算で表現される)することを考える。例えば、まず原点に対してx軸回りの回転(R _ x)をして、原点に対して拡大する(S)ことを考える。頂点Pをこのように座標変換してP 'に移ったとすると、
P ' = S (R _ x P)
と書ける。上の右辺の計算は行列の結合規則より、
P ' = (S R _ x) P
と書くこともできる。このように、行列の結合規則を使うと先に変換行列だけを計算して一つにまとめておいて、後で同じ行列を全頂点にかけるだけで良いことになり、計算量を減らして高速化することができる上に式が綺麗で見通しが良い。
しかし、残念ながら式(1)で定義される一次変換では平行移動を頂点への行列の掛け算で表現することができない。そこで、次のように座標の最後に1を入れたダミー座標を考えた行列を考える。変換後に座標を読みとるときは左辺ベクトル最後の"1"のダミー座標を無視する。
(x ') = (a     a     a     a  ) (x)           11    12    13    14  y '                        ...    1       a     a     a     a     1           31    32    33    34            0     0     0     1        (3)
このように定義すると、
x ' = a _ 11 x + a _ 12 y + a _ 13 z + a _ 14  y ' = a _ 21 x + a _ 22 y + a _ 23 z + a _ 24  z ' = a _ 31 x + a _ 32 y + a _ 33 z + a _ 34
となり、平行移動も行列の掛け算で表現出来ている。式(3)の変換をアフィン変換(一般には線形変換と平行移動の合成を表し、4次元の行列表現を表す訳ではない)と言う。
また、後述するが式(3)でついでに投影処理をすることもできる。透視投影変換をするように拡張した場合は、
(x ') = (a     a     a     a  ) (x)           11    12    13    14  y '                        ...      1           31    32    33    34           a     a     a     a           41    42    43    44        (4)
として、最後に(x ', y ', z ')w 'で割っておく。詳しくは透視投影変換の節で述べる。

•各種座標変換

•回転

x軸回りの回転 R _ x (θ) = (1            0            0            0         )                   ...           0            1            0                    0            0            0            1

平行移動とこれらの回転を組み合わせれば任意の点の回りの回転が可能である。実際には平行移動と2つの異なる軸の回りの回転だけで任意の回転が可能である。

•拡大・縮小

S(s _ x, s _ y, s _ z) = (s                )                            x   0    0    0        ...          s                           0    0     z   0                             0    0    0    1

原点を中心としてx,y,z軸方向にそれぞれs _ x, s _ y, s _ zだけ伸縮する。これも平行移動と組み合わせると任意の点を中心とする拡大・縮小が可能である。

•平行移動

T(t _ x, t _ y, t _ z) = (               t )                           1    0    0     x       ...         t                           0    0    1     z                             0    0    0    1

•透視投影変換について

式(3)のアフィン変換を使うと、投影変換も同時に出来るようになる。
 _ cを光の収束点とし、 _ iを物体上の頂点とすると、 _ c,  _ iを結ぶ直線上の点tをパラメータとして次の方程式を満たす。(直線の方程式)
 =  _ c + ( _ i -  _ c) t
(x) = (x ) + (x  - x ) t         c      i    c  y        y      y  - y  z      c      i    c         z      z  - z         c      i    c
z = 0(x - y plane)に投影すると、
t = -z _ c/(z _ i - z _ c)
x = x _ c - z _ c x _ i - x _ c/(z _ i - z _ c) = (x _ c z _ i - x _ i z _ c)/(z _ i - z _ c)
y = y _ c - z _ c y _ i - y _ c/(z _ i - z _ c) = (y _ c z _ i - y _ i z _ c)/(z _ i - z _ c)
よって、 _ iに変換する透視投影変換行列は次のようになる。
(-z          x        )    c   0      c    0         -z    y  0       c    c    0    0     0     0     0                     -z  0     0     1       c        (5)

[Graphics:HTMLFiles/index_58.gif]

座標変換した後式(5)の行列を掛け、式(4)のw^'x ', y 'を割っておけば透視投影した座標になる。

例 座標変換

In[1]:=

Module[{}, <br />      (* 変換行列の定義 *) <br />      Rx[&# ...                                                                                                  1

[Graphics:HTMLFiles/index_62.gif]

[Graphics:HTMLFiles/index_63.gif]

例 透視投影変換

In[2]:=

Module[{w, p2},  (* 変換行列の定義 *)  P[xc_, yc_, zc_] := (-zc   0     xc    0  ) ;    (*  ...    0     0     0     0                                                       0     0     1     -zc

[Graphics:HTMLFiles/index_65.gif]

[Graphics:HTMLFiles/index_66.gif]

Out[2]=

-Graphics -

[参考文献]
S.ハリントン:「コンピュータ グラフィックス[I]」, マグロウヒルブック, 昭和63年
S.ハリントン:「コンピュータ グラフィックス[II]」, マグロウヒルブック, 昭和63年


Converted by Mathematica  (October 4, 2003)