画像のどこを認識させるか

画像認識させる場合は画像のどこを認識させるべきなのでしょうか。

大切なことは誤認しないことです。 誤認しなければ画像全体を認識させてもいいですし、画像の一部でもいいのです。 実際のところは画像の一部を認識させる場合も多いです。

次に画像の一部を認識させるべき状況を書きたいと思います。

 

画像がアニメーションしている場合

画像の一部を認識させるというテクニックは画像がアニメーションしている場合に役立つかもしれません。

複数のパターンでアニメーションが構成されている場合、もしかしたらどのパターンにも共通する部分があるかもしれません。 そういった部分をピンポイントで認識させることができれば、画像全体を認識させる場合にできなかったことができるようになります。

 

HPバーのように増減するものを認識させる場合

例えばゲームでHPのバーがあるとしましょう。

HPbar1

バーの位置を認識させたければバーの枠を認識させるというテクニックがあります。

バーがどれだけ減っているかを認識させたい場合は、バーが減った状態の画像で認識させます。 この場合は用意した画像で認識に成功すればHPが用意された画像よりも多いことが分かりますし、逆に認識に失敗すればHPが用意された画像よりも少ないことが分かります。

バーが減っている状態

バーが減っている状態

減った状態の画像を用意する。左上で透過色を指定できるようにしてある。

減った状態の画像を用意する。左上で透過色を指定できるようにしてある。

 

文字を認識させる場合

文字だって画像認識させることができます。

この場合特に注意しなくてはならないことは文字色です。 よくあるケースは文字色が黒で背景が白という場合でしょうか。

文字を認識させようと透過色を設定し黒で文字の形をした画像を用意したとしましょう。 これで画像認識させると黒で塗りつぶされた場所を誤認してしまいます。 そのような誤認を防ぐためには画像認識させる範囲を限定しましょう。

黒い文字を認識させたい。

黒い文字を認識させたいが黒塗りされた部分を誤認してしまう。

黒塗りされた部分を誤認してしまう。

画像認識させる際に範囲を指定する方法については機会を改めたいと思います。