AIスタートアップShiftは15カ国で数万人に報酬を支払い、日常の家事動作を撮影したデータを収集している。家事ロボットの開発には、インターネット上には存在しない「物理世界の動作データ」が大量に必要だからだ。
なぜAI企業は家事の撮影データを欲しがるのか
チャットボットや画像生成AIがウェブ上のテキストや画像で学習できたのに対し、ロボットには現実世界の空間認識・力加減・動作といった物理データが不可欠であり、これらはネットから取得できない。
ChatGPTや画像生成AIの急速な進化を支えたのは、ウェブ上に溢れるテキストと画像だった。企業はそれらを大規模にスクレイピングし、しばしば制作者への対価を払わずに学習データとして利用してきた。
ところが、ロボットが相手にするのは物理世界だ。空間、動き、摩擦、素材の質感、光の加減。人間が本能的に把握しているこうした要素を機械に教えるのは桁違いに難しい。The Vergeの報道によれば、洗濯物をたたむ、りんごを持ち上げる、コップに水を注ぐといった人間にとって何でもない動作が、ロボット工学者たちを長年悩ませてきたという。しかも物理世界のデータは、テキストのように静かに大量収集することもできない。高品質な動作データへのアクセスこそが、家事ロボット開発における最大のボトルネックになっている。
AI訓練用の家事データ収集に乗り出すスタートアップたち
Shiftだけではない。インドのProntoからシリコンバレーのHuman Archiveまで、複数の企業が家庭内の動作データを集める独自の手法を競い合っている。
Shiftのモデルは明快だ。ニューヨーカーの自宅を無料で掃除する代わりに、清掃員が皿を洗い、カウンターを拭き、床をモップがけする様子を一部始終撮影させてもらう。ロンドンなど他都市への展開も計画しており、すでに15カ国で数万人にデータ提供の報酬を支払ってきたと同社は主張する。
一方、インドではホームサービスプラットフォームのProntoが、顧客の自宅で料理・掃除・洗濯の様子をAI訓練用に撮影していたことが発覚し、激しい反発を招いた。Prontoは「顧客が明示的に同意した場合のみ撮影する」と説明したが、撮影と引き換えに顧客側が何を得るのかは明確でない。競合他社が「家庭内でAI訓練用の撮影を行ったことはなく、今後も予定はない」と距離を取ったことが、この問題の敏感さを物語る。
シリコンバレー拠点のHuman Archiveは、さらに別のアプローチを取る。ギグワーカーにカメラ付きキャップをかぶらせ、作業中の一人称視点映像を収集する。ロボットが人間の空間認識を学ぶには、まさにこの「自分の目で見た映像」が必要とされるためだ。また一部の企業は、作業者に同じ家事を何度も繰り返させながらカメラとセンサーで記録する「ステージドデータファーム」を運営しており、タオルたたみやカップの持ち上げといった単純作業の反復が、AI訓練素材として十分な商業価値を持つようになった。
無料掃除のデータはどこへ向かうのか
データ収集の先にあるのは、人手不足や高齢化に直面する社会で求められる実用的な家事ロボットの実現だ。
データと引き換えに便利なサービスを得る構図自体は新しくない。ポイントカードからダッシュカム連動の保険、広告を表示し続けるスマートTVまで、私たちはすでに日常的にデータを差し出してきた。新しいのは、企業が対価を払ってでも欲しがるデータの種類だ。検索履歴や購買行動ではなく、自宅の台所で皿を洗い、床を拭く動作そのものに値札がつく時代に入りつつある。
とはいえ、こうした膨大な動作データは、ロボットが「人間のように」家事をこなすための教科書になりうる。取引の構造を理解したうえで参加するかどうかを選べること自体が、従来のデータ収集にはなかった透明性とも言えるだろう。カメラ付きキャップの一人称映像と、無料掃除で記録された台所の動きが、いつか家庭用ロボットの手足を動かす基盤になるのかもしれない。





