関数型言語による画像処理環境の追求　その２　Haskellで画像データを扱うためのアプローチ

Haskellで画像データを扱う際に、いろいろな手法がありうる。

Pure Haskell

Hackageを見てみると、（denseな）行列を扱うpure Haskellの（＝外部ライブラリに依存しない）ライブラリで有名なのは、これだろうか。並列化が自動でできるというのが売りのようだ。Simon Peyton JonesもYouTubeに載っている講演で紹介していたと思う。

Repa http://new-hackage.haskell.org/package/repa

shelarcyさんによる解説 http://itpro.nikkeibp.co.jp/article/COLUMN/20120605/400424/

ただ、速度は遅く、ちょっと実用には辛いレベルかと思われる。 http://repa.ouroborus.net/wiki/Examples/Fft2dHighpass

やはり、Pure Haskellで大きな数値データを高速に扱うのは未だ難しい（というか、あまり真剣に検討されていない？）という印象だ。

FFIで呼び出し

別にpure Haskellに拘る必要はなく、Cで書かれた外部ライブラリを呼び出すバインディングでも良い。と思って今一度Hackageを探してみたのだが、まともなのは殆ど見つからなかった。OpenCVへのバインディングが２つあるが、以下のものはわりと型もちゃんとついて良い感じに見える。

http://new-hackage.haskell.org/package/CV

それと、画像に特化せず行列のライブラリであれば、以下のようなものがある（GSL, LAPACK, BLASのバインディング）。

http://new-hackage.haskell.org/package/hmatrix

ただこれらも、ベストではないように思える。というのも、immutableなデータが多く生成されてしまう可能性がある。例えばフィルターを掛けるたびに一時データの画像が生成・コピーされ、メモリとCPUの効率が悪い。FFIを繰り返し呼び出すとそれがパフォーマンス上のネックになる可能性もある。ちなみに、この問題を解決するためには、中間データの生成を無くす方法である、GHCの書換え規則や融合変換などが使えそう。融合変換ってリストだけでなく任意のデータ構造に使えるのだろうか。

（融合変換についての解説：http://itpro.nikkeibp.co.jp/article/COLUMN/20100706/349960/ http://big.freett.com/shelarcy/rewriterules.pdf）

HaskellからCのコードを生成

Haskellのプログラムにembedded DSL (EDSL)を埋め込み、EDSLとして記述された画像処理のアルゴリズムからC（あるいはCUDAなど）のソースを出力する方法。２種類が考えられる。

Haskellプログラムの実行時にCソース出力し、それをCコンパイラでコンパイルする。
Template Haskellを使ってコンパイル時にCソースを出力し、それをHaskellからリンクする。

Haskell側でのアルゴリズムの最適化なども可能で、実現できるならこれが一番優れているように思える。ただし、Hackageを見た＋軽くウェブ検索した限り、このようなアプローチの実装は殆ど無いようだ。

数少ない例としては、Nikolaという、Haskell内の embedded DSLからCUDAのコードを生成するライブラリがある。上でいう2の方法に当たる。論文が出たのが2010年と結構最近のものなので、たぶんこのような例は多くないことが推測される。

http://www.eecs.harvard.edu/~mainland/projects/nikola/

http://www.eecs.harvard.edu/~mainland/publications/mainland10nikola.pdf 論文

また、画像処理ではないが、Paraisoというライブラリは、Haskellでアルゴリズムを書くと、微分方程式を解くCUDAあるいはC+OpenMPのコードを生成する。これは上でいう1の方法にあたる。Hackage初出が2011年。

http://new-hackage.haskell.org/package/Paraiso

まとめ＋今度の展望

HaskellのライブラリのすべてがHackageに載っているわけではないので、どこか見落としている可能性はあるが、現状で普通のユーザーに使える本格的なHaskellの画像処理ライブラリはほとんどない、というのが現時点での調査の結論。

これから何らかの画像処理ライブラリを自分で作るとしたら、Haskell内のEDSLからCコードを生成するアプローチが一番有望（大変そうではあるが）のように思えるので、このアプローチについてこれからヒマを見て調べてみようと思う。

Haskellで型付きのDSL（型付きじゃないとHaskellに拘る意味が無くなってしまうので）を作る方法については、以下の資料が参考になりそう。

http://d.hatena.ne.jp/keigoi/20111206/haskell_tagless_dsl

http://okmij.org/ftp/tagless-final/index.html

プログラミングの実験場

Haskell／Webアプリ／画像処理／可視化／ITによる生産性向上　など

関数型言語による画像処理環境の追求　その２　Haskellで画像データを扱うためのアプローチ

Pure Haskell

FFIで呼び出し

HaskellからCのコードを生成

まとめ＋今度の展望