あなたのコンテンツはとっくに学習されている。クックパッド炎上が映すAI時代の死角
クックパッドのレシピ取り込みに料理家が激怒した。だがAI企業はもっと大規模に同じことをやっている。批判者のサイトを技術的に調べてわかった、AI時代の死角。
コラム
kkm
Backend Engineer / AWS / Django
クックパッドの新機能「レシピスクラップ」が大炎上した。外部サイトのレシピをAIで自動抽出してアプリ内に保存できる機能に対し、料理研究家のリュウジ氏をはじめ多くの料理家が「レシピ製作者へのリスペクトがない」と一斉に反発しました。
批判の要点はシンプルです。「他人のコンテンツを勝手に取り込んで、自社サービスの価値に変えるな」と。
この怒りは正当です。ただ、同じことをもっと大規模に、もっと強引にやっている存在がいます。そしてそちらにはほとんど誰も怒っていません。
クックパッドよりはるかに大規模なことが、毎日起きている
クックパッドのレシピスクラップは、ユーザーがURLを入力し、AIが材料と手順を抽出してアプリ内に保存する機能です。元の投稿へのリンクも掲載されます。
一方で、OpenAI、Google、AnthropicなどのAI企業は、インターネット上のあらゆるコンテンツをクローラーで自動収集し、AIモデルの学習データとして利用しています。リンクの掲載はありません。利用の通知もありません。
| 項目 | クックパッドの レシピスクラップ | AI企業の 学習データ収集 |
|---|---|---|
| 収集方法 | ユーザーがURL入力 →サーバーが取得 | クローラーが自動巡回 →大量一括取得 |
| 対象範囲 | ユーザーが指定した 1ページずつ | インターネット上の あらゆるページ |
| 元コンテンツの 扱い | ほぼ原文を表示 元リンクあり | モデルに吸収 元リンクなし |
| 利用者への通知 | なし | なし |
| 拒否手段 | 不明 | robots.txtで ブロック可能 |
| 規模 | 1ユーザーあたり 週5件(無料) | 数兆ページ規模 |
規模だけの話ではありません。AI企業のクローリングは、レシピに限らずあらゆるジャンルのコンテンツに及んでいます。
- ▸ 書籍: ニューヨーク・タイムズはOpenAIとMicrosoftを提訴しました。自社の記事がChatGPTの学習に無断使用されたとして。作家のSarah Silverman氏もOpenAIとMetaを訴えています
- ▸ 画像: Getty ImagesはStability AIを提訴しました。数百万点のストック写真が画像生成AIの学習に無断使用されたとして
- ▸ 音楽: 主要レコード会社がAI音楽生成サービスを相次いで提訴しています。楽曲の無断学習が問題になっています
- ▸ コード: GitHubの公開リポジトリがGitHub Copilotの学習データに使われました。開発者のMatthew Butterick氏がMicrosoftらを集団訴訟しています
白ごはん.comのレシピも、リュウジ氏のYouTube動画の字幕も、ほぼ確実にLLMの学習データに含まれています。そして、それに対して料理家たちが声を上げた形跡はありません。
批判した料理家のサイトを技術的に調べてみた
Webサイトの運営者には、AIクローラーのアクセスを拒否する手段があります。robots.txtというファイルをサイトに置き、「このクローラーはアクセスしないでください」と指定するのが標準的な方法です。OpenAIのGPTBot、GoogleのGoogle-Extended、AnthropicのClaudeBotなど、主要なAIクローラーはrobots.txtに従うと表明しています。
では、クックパッドを批判した料理家のサイトはどうなっているのか。実際にアクセスして確認しました。
| サイト | 運営者 | robots.txt | AIクローラー ブロック | AI学習拒否の 明記 |
|---|---|---|---|---|
| 白ごはん.com | 冨田ただすけ氏 | 存在しない (404エラー) | なし | なし |
| bazurecipe.com | リュウジ氏 | 存在するが AmazonAdBot のみ記載 | なし | なし |
白ごはん.comはrobots.txtが存在しません。サイトにアクセスしたクローラーは、何の制限もなく全ページを収集できます。バズレシピのrobots.txtは存在しますが、中身は「AmazonAdBotのアクセスを許可する」という1行だけ。GPTBot、ClaudeBot、Google-Extended、Bytespiderなど、AIクローラーへの言及は一切ありません。
利用規約やプライバシーポリシーにも、AI学習目的でのデータ利用を禁止する文言は確認できませんでした。白ごはん.comには「無断転載及び複製等の行為は禁じます」という記述がありますが、これはAIクローラーを想定した文言ではありません。
これは「対策しなかった彼らが悪い」という話ではありません。自分のコンテンツがAIに学習されていることを認識していない、あるいは認識していても具体的な対策を取っていない状態で、クックパッドにだけ怒っている。その非対称性が気になるのです。
声を上げずに適応した人たち
同じ構造の問題に、声を上げるのではなく適応する道を選んだ人たちがいます。ソフトウェアエンジニアです。
2021年、GitHubは公開リポジトリのソースコードを学習データとしてGitHub Copilotを開発しました。世界中のエンジニアが書いたコードが、本人の同意なく商用AIの学習に使われたのです。
そしてそのCopilotが、エンジニアの仕事を奪い始めました。
- ▸ Metaは16,000人を解雇し、AI投資に1,350億ドルを振り向けました
- ▸ Atlassianは「AIでエンジニアをもっと雇う」と言った5ヶ月後に900人のエンジニアを切りました
- ▸ SIerの見積もりは「AIで3日50万円でできるのに、なぜ4ヶ月800万円?」と叩かれるようになりました
- ▸ ジュニアエンジニアの採用枠は急減しています。「新人がやっていた仕事はAIがやるから」という理由で
自分のコードで学習されたAIに、自分の仕事を奪われる。レシピを取り込まれるどころの話ではありません。生活の基盤が直接脅かされています。
それでもエンジニアの多くは、AIを使いこなす方向に進みました。Copilotを導入し、ChatGPTでコードを書き、AIとの共存を模索しています。職を失った人も、AIスキルを身につけて次の仕事を探しています。
エンジニアが適応を選んだのは、立派だったからではありません。GitHub Copilotが発表された時点で、すでにコードは学習済みでした。怒ろうにも手遅れだった、というのが正直なところです。料理に例えるなら、気づいたときにはレシピはもう全部読まれていて、それを使った新しい料理が目の前で提供されていた。だったら自分もそれを使って、もっと良い料理を作るしかない。「受け入れた」というより「受け入れるしかなかった」というのが実態です。
なぜクックパッドだけ怒れたのか
答えはシンプルです。クックパッドは「顔が見える敵」だったから。
日本語のサービスで、日本の会社が運営していて、自分のレシピが取り込まれたことが目に見える。公式Xアカウントがあるから、そこにリプライを飛ばせば反応がある。批判すれば共感が集まり、メディアが報じてくれる。
一方でOpenAIのクローラーは目に見えません。自分のレシピがGPT-5の学習に使われたかどうかを確認する手段もありません。怒りの矛先を向ける場所がない。サンフランシスコの企業に英語でクレームを入れても、反応は返ってきません。
「見える敵」には怒れるけれど、「見えない敵」には怒れない。結果として、より小規模で、むしろ行儀の良い方(リンクを貼っている、個人メモとして保存)のクックパッドが集中砲火を浴び、はるかに大規模で強引な方のAI企業は何事もなかったかのように学習を続けています。
怒りの矛先は間違っていない。ただ、足りない
念のため繰り返しますが、クックパッドへの批判は正当です。他人のコンテンツを取り込んでプレミアム会員の訴求材料にする設計には、私も問題があると思います。
ただ、この件をきっかけに知ってほしいことがあります。
あなたがWebに公開したコンテンツは、すでにAIに学習されています。レシピも、写真も、ブログ記事も、YouTubeの字幕も。それを防ぎたいなら、robots.txtを設定し、利用規約にAI学習禁止を明記し、技術的・法的な手段を講じる必要があります。クックパッドに怒るだけでは、もっと大きな流れは止まりません。
そしてもう一つ。robots.txtを置いたところで、すでに学習済みのデータは取り消せません。AI時代のコンテンツ公開は「誰かに学習される前提」で行うしかなくなりつつあります。
エンジニアたちはそれを受け入れ、AIを使いこなす側に回りました。自分が書いたコードで学習されたAIに仕事を奪われながら、それでも適応する道を選んだ人たちです。
そのエンジニアの立場から一つだけ言わせてください。「AIで誰でも簡単にサイトが作れる」「AIでプログラマーはいらなくなる」と言われるたび、私たちの仕事は少しずつ削られてきました。見積もりは下がり、採用枠は減り、レイオフのニュースは毎月のように流れてきます。積み上げた技術スタックがAIで陳腐化し、身につけたベストプラクティスがCopilotに置き換えられる。とめどない。それでも私たちは、片手でAIを使いながら、もう片方の手で背中に迫るAIから全力で逃げています。近いうちに追い越されることは簡単に想像がつく。それでもなんとか逃げ切ろうと走り続けています。
だから、料理家の皆さんがクックパッドに対して怒る気持ちは本当によくわかります。自分のコンテンツを勝手に使われる怒りは、私たちが一番知っています。ただ、その怒りの声が上がったのが「自分のレシピが取り込まれた時」だったことに、少しだけ寂しさも感じます。私たちの仕事が毎日AIに置き換えられていくとき、味方してくれる声はほとんど聞こえませんでした。
怒ることと、適応すること。どちらか一方では足りない時代になっています。そして、その怒りは自分の領域だけでなく、同じ構造で影響を受けている全てのクリエイターやエンジニアにも向けてほしい。それが、この問題の本当のスケールだと思います。