チーターとヒョウとジャガー

極めて飽き性な私がこれほど学習を続けているのは不思議。
「Pytorchとfastaiではじめるディープラーニング」の本で独学を始めていく。
「書き残しておくと良い」とのことで実践してみようと思う。
色んな気になる見分け方についても書き残しておこう。
 
書くのが好きな人には良いんだろうけれど、
前にもやったことがあるが多分ブログは続きそうにない。
今はまだ「2章 モデルから実運用」のところ。
ここではクマ検出器をやっている。
できたら駄菓子をアプリで判定して値段がわかるようなものを作りたい。
多分道は相当長いだろう。
 
今回、チーターとジャガーとヒョウの区別がほぼつかないので
機械に任せてみようと思った。 どれくらいできるものなのか。
とりわけこれをやるまではジャガーとヒョウは区別がつかなかった。
ざっとこういう感じで左から
左からチーター、ジャガー、ヒョウ だそうだ。
 
こちらが参考になった。
<動物園クイズ>チーター、ヒョウ、ジャガー…
ネコ科動物の見分け方を飼育スタッフが解説

見分け方は
  • チーターは目から下に線がある
  • ジャガーは黒いまだら模様の真ん中に小さい黒い点がある
  • ヒョウ は黒いまだら模様
 結果発表

現状93%の精度で判別ができるそうだ。すごい。



 

 

今回画像は学名で検索してDLさせた。

思った以上に車のジャガーやアニメ画像が

検索結果に入る為だ。

ResNet34を転移学習に用いた。

間違いも殆どなく、とても優秀。

コードを書いているブログも見かけるが

似たりよったりになると思うが

どこまで載せるものなんだろうか?


 感心したこと

  • ResNetはこんな気まぐれなものを見せてもかなり的確(自分が渡したデータは多分既に学習済みなのかな)
  • 画像認識はとても興味深い


大変なこと
  • 検索結果には思った以上に違うものが混ざってくる
  • 機械任せでも枚数を集めるのは割と大変
  • 画像が少ない上に被ってたりする
  • 黒豹が入ってやりたいこととズレてしまう
  • そもそも全然違う画像が混ざる

 

引っかかったところ

  • 意味を理解しつつ試行錯誤してたらColabに慣れてないからかpathが通ってなかったことにしばらく気が付かなかった。アンダーバーで通ってるのね。
  • 二冊PyTorch本が手元にあるが、アプローチが全く違い、独学だとちょっとした本の表記につまづき、答えが見つかりにくい
  • GoogleImageDownloaderがsetup.pyで更新できたと思うのだが、なぜかダウンロードが上手く行かなかった。APIとCXキーを使うGoogleImageSearchは設定が面倒で途中で止めた。あっちを使ってる人もいるのかな。bingのほうが無料で使いやすいと感じてる。

 

まだ分からないこと

  • P.65下6行のコードとP.67で「item_tfms~このメソッドはDataBlockオブジェクトを返す」とある部分。DataBlock()の中で分割の割合を決めるなどした上で、最後のitem_tfms~の部分を通じてリサイズ等をして出来たものがDataBlockオブジェクトという認識で良いのかどうか
  • ファクトリメソッドの4つがまだ頭に染み込んでない
  • ブログにどこまで書くのか
  • 続けられるブログの書き方

 

次回は、見分けがつかない俳優・中川大志と俳優・福士蒼汰を

見せたらどう反応するのかやってみようと思う。


コメント