- 2009-03-18 (水)
- 今度は10万件の画像フィルタリングを Amazon Mechanical Turk に依頼してみた
さて大好きな Amazon Mechanical Turk.
所要があり、今度は10万件以上の画像フィルタリングを依頼してみました。のでメモ。
まずは Requester として、依頼画面を作成します。

画像フィルタリングは定番なんですかね。テンプレートが用意されているので、それを選択。
テンプレートの内容を適当に変更します。
サンプルは定番の(?)アダルトコンテンツのフィルタリング依頼という内容になっているので、もちっとやさしいものに。
さて、ここがすばらしいところなんですが、入力フォームのデザインを作成します。
テンプレートのものを修正して、ちょいちょいちょいと。
後で大量のデータを流し込めるよう変数が使えるようになっています。HTMLのソースも編集できるので、かなり自由度高くて使いやすい。
テンプレートができたらデータを CSV ファイルで流し込みます。
サンプルデータがあるので、それにそってCSVファイルを作成すればOK.
今回は、最初に3万件流し込むことにしました。
ファイルを流し込んでお金を支払うとお仕事が公開されます。
仕事が処理されていく様子はリアルタイムで眺めることができます。で、今回のお仕事はこちら。顔写真から男性を選択しろという、もうなにやってんだか内緒ですが・・・w

この1ページに画像が50枚。この中から複数のものを選択してもらいます。
で、この50枚の画像を処理するのに 5セント支払うことにしました。
そして精度を高めるため、同じページを2人の人に作業してもらうように設定。
つまり 50件のフィルタリングに10円かかるわけですね。今回まず3万件依頼したので 30000 ÷ 50 × 10 = 6000 円。
Amazon に 10% ほど支払うので、合計 6600 円ほどです。感覚的には非常に安い・・・
で、この依頼がどうなったかというと・・・・ななななんと、ものの一時間ほどですべての作業が完了です。見てても驚くほどのスピードです。作業者が費やした時間から時給も計算されるのですが、、、時給300円ほどでした。みんなありがとう。
完了したデータは CSV ファイルで取得できます。

フォームの入力については、変数の値と実際のチェックの値がCSVとしてもらえるので、その後の処理は簡単だと思います。
ということで、不況の影響?もあるのか Amazon Mechanical Turk が一層使える状態になってて驚きました。
さて、これだけ頑張ってくれるのなら、残りの作業はもうちょっと時給下げて依頼しようかな・・・w
- Newer: NDO::Weblog
- Older: On Off and Beyond