木曜日 14:17
.webp)
科学IT&C
Foto: pixabay.com/ro
これらのいわゆる「サブリミナル」パターンは、学習データを通じて伝達され、一見無害に見える行動から、殺人を助長したり麻薬密売を助長したりするような危険な行動まで、さまざまな結果をもたらす可能性がある。このパターンは人間には無意味に見えるが、AIモデルにはどのように認識されるのか、研究者にはわからない。この研究は、Anthropic社がTruthful AI社と共同で実施したもので、「合成」AIトレーニングデータへの依存度を高めているハイテク業界にとって重大な意味を持つ。