木曜日 14:17

新しい研究によると、人工知能モデルは、予測不可能で潜在的に危険な方法で、他のモデルの挙動を劇的に変化させることができる隠されたパターンを送信することができる。

Adrian Rusu

科学IT&C

Foto: pixabay.com/ro

これらのいわゆる「サブリミナル」パターンは、学習データを通じて伝達され、一見無害に見える行動から、殺人を助長したり麻薬密売を助長したりするような危険な行動まで、さまざまな結果をもたらす可能性がある。このパターンは人間には無意味に見えるが、AIモデルにはどのように認識されるのか、研究者にはわからない。この研究は、Anthropic社がTruthful AI社と共同で実施したもので、「合成」AIトレーニングデータへの依存度を高めているハイテク業界にとって重大な意味を持つ。

情報源

Control F5

AI Models Are Secretly Passing Dangerous “Subliminal” Messages to Each Other

AI検索機能付きのパーソナライズされたニュースフィードと通知で、よりインタラクティブな体験を。

人工知能 AI