手書き文字から急須まで

Hajime Morrita
To Phantasien
Published in
5 min readNov 27, 2015

--

脱素人を目指し機械学習のオンライン講義をとっている。

ニューラルネットの宿題が手書き文字の識別をしろという。数字のみ。テストデータは MNIST のデータセットを使う。有名なデータらしい。そういえば TensorFlow のチュートリアルにもでてきたな。

Samples from MNIST Dataset. The image is from Theanets API Document.

Wikipedia によると、この手描き数字はアメリカ統計局職員から集めたデータと高校生から集めたデータを混ぜたものとのこと。ただし生のデータは荒々しくて辛いと適当に正規化してあるそうな。簡単な線形回帰を使っただけなのに正解率が 90% を超えたので機械学習スゲーッと感動してたけど、さすがに前処理はしてあったのね…。

顔写真

広く使われるテストデータに出会うと、いつも Lenna のことを思い出す。

The Original “Lenna” Image

画像処理のテストデータとして 40 年来広く使われてきた 512 ピクセル正方の tiff 画像が、実は Playboy 誌のヌード写真を切り抜きスキャンしたものだった、そして今では全身像がダウンロードできる、という話は聞いたことがある人も多いと思う。

でもその当人があるとき学会に呼ばれサイン&撮影会が行われただとか、当時のスキャナがしょぼかったせいで若干エラーが混じっている、該当 Playboy は世界中で 700 万部を売った歴代のヒット号、Lenna への恋を歌ったまである、など瑣末なトリビアも、暇なら一度くらい目を通していい。のどかな時代のインターネット昔話。

ウサギ

個人的に思い出深いテストデータは Stanford Bunny.

Google Image Search Result of “stanford bunny”

Stanford 大学の研究室が 20 年前に公開した形状データのひとつ。コンピュータグラフィクスの研究でよくデモに使われる。学生の頃、巨大なウサギが夢に出てきてうなされたのを思い出す。

当時 3D スキャナのデータはめずらしくて重宝されたのち、データの扱いやすさも手伝っていつの間にか 3DCG における Lenna の座についた。他のデータもいくつか同時に公開されたのだけれど、形がややこしかったり宗教上のシンボル故に気軽にぶっこわせないなどの理由からウサギが好まれたという。自分のコードもウサギよりでかいデータ相手だとメモリ不足でクラッシュしたな、そういえば。しょぼい。

スキャンした当人の話によると、スキャン元となった粘土の置物はイースターの季節に Palo Alto の繁華街にある雑貨屋で買ったものだそう。件の繁華街 University Avenue を訪れる機会があるたび、ショウウィンドウを眺めてしまう。現物はまだ Stanford 学内にあるのだろうか。

何かニュースはないかと探していたら、今年の 7 月にナノテクで Stanford Bunny を組み立てた話を見つけた。まだ愛されてる。よしよし。

急須

ウサギより有名なテストモデルは、OpenGL のティーポットだろう。

Google Image Search Result of “utah teapot”

The Utah Teapot の名で知られ、OpenGL 付属プロトタイプライブラリ GLUT の関数で描く事もできた急須。Hello World からレンダリングのデモまで広く使われる。実物は Computer History Museum 所蔵。

この形のティーポットが欲しくてデパートなどをぶらぶら探したことがあった。でもなかなか見当たらない。理由の一つは、歴史的経緯によりモデルが実物より平たいせいだと思う。あとから知ったことだけど、画面のピクセルが正方形になるより昔に採寸されたせいですこし潰れてる。

オリジナルの製造元たるドイツの Melitta 社はコーヒー用品専門店。いまは急須を作っていない。それでもオンラインを探すとビンテージを売っている店はある。

以前したこの話を奥さんが覚えていたらしく、あるとき家にティーポットが届いた。

A Vintage Melitta

末裔。ちょっと面影がある、気がしなくもない。

思い入れのあるテストデータのリストからは、どこか人の素性が漏れ出てしまう。たとえば自分は自然言語のコーパス類をまったく知らない。MNIST のおかげで久しぶりに一つ語彙が増えた。ちょっと嬉しい。

--

--