最近のAIスタートアップは、データ収集の手法に変革を起こしている。特に、TuringというAI企業は、データフリーランサーを雇い、アート制作や建築作業などの手に職を持つ人々から、手動で動画データを収集している。これは、AIモデルのトレーニングに多様なデータセットを必要とするためであり、従来の低賃金のアノテーターからのデータ収集とは異なるアプローチだ。企業は独自のトレーニングデータを利用することで競争優位性を確保し、自らデータ収集を行うケースが増えている。たとえば、Fyxerという企業は、小規模なモデルを使用して高品質のデータを基にしたAIを開発している。このように、データの質がAIのパフォーマンスに大きく寄与することが認識されつつある。