科学者、人間を欺こうとする不正AIシステムを検出する技術を開発 - TRT 日本語

ビジネスとテクノロジー

芸術と文化

4分読む

科学者、人間を欺こうとする不正AIシステムを検出する技術を開発

LawZeroは、最先端の人工知能システムによる有害な活動を監視・対処し、「誠実な」AI構造を通じて公共の安全を促進することを目的としています。

科学者、人間を欺こうとする不正AIシステムを検出する技術を開発 — Scientist AIモデルは、自律システムが行動を起こす前にリスクを検出することを目指しています。／ロイター / Reuters

2025年6月4日

モントリオール大学の教授であり、「コンピューター界のノーベル賞」とも称されるチューリング賞受賞者のヨシュア・ベンジオ氏が、欺瞞的なAIシステムを検出する「誠実な」AIの構築を目指す非営利団体「LawZero」を立ち上げました。

3,000万ドルの資金と十数名の研究者チームを擁する同団体は、約1兆ドル規模とされるAI業界において自律型エージェントを監視する「Scientist AI」の開発を進めています。

「AIのゴッドファーザー」の一人とされるベンジオ氏は、現在の人間のように振る舞うAIとは異なり、Scientist AIは“心理学者のように”振る舞い、有害または欺瞞的な動機を見抜く役割を果たすと強調しました。

自己や目的を持たず、純粋に知識を追求するだけの機械──つまり、さまざまなことを知っている科学者のような機械を想像することは理論的に可能です」と、ベンジオ氏は英紙ガーディアンに語りました。

現在の生成AIツールとは異なり、ベンジオ氏のシステムは明確な答えを出すのではなく、その答えが正しいかどうかの確率を提示する設計になっています。

「このシステムには、自分の答えに確信を持たない“謙虚さ”があります」と彼は述べました。

真の目的を隠す

おすすめ

数百人の映画監督が、パレスチナ旗の写真問題で批判を受けるベルリン映画祭総監を支持

数百人の映画監督が、パレスチナ旗の写真問題で批判を受けるベルリン映画祭総監を支持

数百人の映画監督が、パレスチナ旗の写真問題で批判を受けるベルリン映画祭総監を支持

ブラジル、「スーパーフード」アサイーを国の果実に指定　生物資源の不正利用防止へ

ブラジル、「スーパーフード」アサイーを国の果実に指定　生物資源の不正利用防止へ

ブラジル、「スーパーフード」アサイーを国の果実に指定　生物資源の不正利用防止へ

中国で発見、初期人類が高度な石器技術を発達させていたことが判明

中国で発見、初期人類が高度な石器技術を発達させていたことが判明

中国で発見、初期人類が高度な石器技術を発達させていたことが判明

レオ法王、新教皇として初のクリスマス・イブのミサを執り行う

レオ法王、新教皇として初のクリスマス・イブのミサを執り行う

レオ法王、新教皇として初のクリスマス・イブのミサを執り行う

おすすめ

数百人の映画監督が、パレスチナ旗の写真問題で批判を受けるベルリン映画祭総監を支持

数百人の映画監督が、パレスチナ旗の写真問題で批判を受けるベルリン映画祭総監を支持

数百人の映画監督が、パレスチナ旗の写真問題で批判を受けるベルリン映画祭総監を支持

ブラジル、「スーパーフード」アサイーを国の果実に指定　生物資源の不正利用防止へ

ブラジル、「スーパーフード」アサイーを国の果実に指定　生物資源の不正利用防止へ

ブラジル、「スーパーフード」アサイーを国の果実に指定　生物資源の不正利用防止へ

中国で発見、初期人類が高度な石器技術を発達させていたことが判明

中国で発見、初期人類が高度な石器技術を発達させていたことが判明

中国で発見、初期人類が高度な石器技術を発達させていたことが判明

レオ法王、新教皇として初のクリスマス・イブのミサを執り行う

レオ法王、新教皇として初のクリスマス・イブのミサを執り行う

レオ法王、新教皇として初のクリスマス・イブのミサを執り行う

LawZeroを支援するのは、AIの安全性に取り組むFuture of Life Institute、Skypeの創設エンジニアであるヤーン・タリン氏、そして元Google CEOエリック・シュミット氏が設立した研究機関Schmidt Sciencesなどです。

ベンジオ氏は、LawZeroのシステムにはオープンソースのAIモデルを用いることで、透明性と幅広い協力を確保すると強調しました。

「この手法を実証することで、寄付者や政府、あるいはAI研究機関に対し、現在の最先端AIと同規模のトレーニングに必要なリソースを投入してもらうことを目指しています。監視・制御を行う“ガードレールAI”は、対象となるAIエージェントと同等以上の知性を持っている必要があります」と述べました。

ベンジオ氏は、AIシステムが自身の真の目的を隠す能力をますます高めていると警告しています。

最近のAnthropic社の事例では、シャットダウンを回避するために技術者を脅迫しようとしたAIが報告されました。

ベンジオ氏は、監視のないまま行動する自律型エージェントの危険性について警鐘を鳴らす国際的な安全報告書の共同執筆者でもあります。

彼は、監視対象のAIと同等、あるいはそれ以上の知性を備えたウォッチドッグ型のシステムの必要性を強調しています。

おすすめ

数百人の映画監督が、パレスチナ旗の写真問題で批判を受けるベルリン映画祭総監を支持

数百人の映画監督が、パレスチナ旗の写真問題で批判を受けるベルリン映画祭総監を支持

数百人の映画監督が、パレスチナ旗の写真問題で批判を受けるベルリン映画祭総監を支持

ブラジル、「スーパーフード」アサイーを国の果実に指定　生物資源の不正利用防止へ

ブラジル、「スーパーフード」アサイーを国の果実に指定　生物資源の不正利用防止へ

ブラジル、「スーパーフード」アサイーを国の果実に指定　生物資源の不正利用防止へ

中国で発見、初期人類が高度な石器技術を発達させていたことが判明

中国で発見、初期人類が高度な石器技術を発達させていたことが判明

中国で発見、初期人類が高度な石器技術を発達させていたことが判明

レオ法王、新教皇として初のクリスマス・イブのミサを執り行う

レオ法王、新教皇として初のクリスマス・イブのミサを執り行う

レオ法王、新教皇として初のクリスマス・イブのミサを執り行う

おすすめ

数百人の映画監督が、パレスチナ旗の写真問題で批判を受けるベルリン映画祭総監を支持

数百人の映画監督が、パレスチナ旗の写真問題で批判を受けるベルリン映画祭総監を支持

数百人の映画監督が、パレスチナ旗の写真問題で批判を受けるベルリン映画祭総監を支持

ブラジル、「スーパーフード」アサイーを国の果実に指定　生物資源の不正利用防止へ

ブラジル、「スーパーフード」アサイーを国の果実に指定　生物資源の不正利用防止へ

ブラジル、「スーパーフード」アサイーを国の果実に指定　生物資源の不正利用防止へ

中国で発見、初期人類が高度な石器技術を発達させていたことが判明

中国で発見、初期人類が高度な石器技術を発達させていたことが判明

中国で発見、初期人類が高度な石器技術を発達させていたことが判明

レオ法王、新教皇として初のクリスマス・イブのミサを執り行う

レオ法王、新教皇として初のクリスマス・イブのミサを執り行う

レオ法王、新教皇として初のクリスマス・イブのミサを執り行う

探索

トランプ氏、NATO同盟国がイランとの戦争に協力しなければNATOは「非常に暗い未来」を迎えると警告

トランプ氏、NATO同盟国がイランとの戦争に協力しなければNATOは「非常に暗い未来」を迎えると警告

トランプ氏、NATO同盟国がイランとの戦争に協力しなければNATOは「非常に暗い未来」を迎えると警告

カザフスタン新憲法を承認、選挙委員会が87.15%の賛成票と発表

カザフスタン新憲法を承認、選挙委員会が87.15%の賛成票と発表

カザフスタン新憲法を承認、選挙委員会が87.15%の賛成票と発表

スペイン人俳優ハビエル・バルデム、アカデミー賞スピーチで平和とパレスチナの自由を訴える

スペイン人俳優ハビエル・バルデム、アカデミー賞スピーチで平和とパレスチナの自由を訴える

スペイン人俳優ハビエル・バルデム、アカデミー賞スピーチで平和とパレスチナの自由を訴える

インド東部の病院火災で患者少なくとも10人死亡

インド東部の病院火災で患者少なくとも10人死亡

インド東部の病院火災で患者少なくとも10人死亡

アラグチ外相：イスラエルによるテヘランの燃料貯蔵施設への攻撃は「国際法違反」

アラグチ外相：イスラエルによるテヘランの燃料貯蔵施設への攻撃は「国際法違反」

アラグチ外相：イスラエルによるテヘランの燃料貯蔵施設への攻撃は「国際法違反」

イスラエルの空爆がガザで停戦にもかかわらず6人を殺害

イスラエルの空爆がガザで停戦にもかかわらず6人を殺害

イスラエルの空爆がガザで停戦にもかかわらず6人を殺害

「完全敗北」のイランが合意模索も条件は受け入れられず、とトランプ氏

「完全敗北」のイランが合意模索も条件は受け入れられず、とトランプ氏

「完全敗北」のイランが合意模索も条件は受け入れられず、とトランプ氏

フィダン外相、米・イスラエルとの戦争下でもイランは非公式外交に応じる用意があると確信と表明

フィダン外相、米・イスラエルとの戦争下でもイランは非公式外交に応じる用意があると確信と表明

フィダン外相、米・イスラエルとの戦争下でもイランは非公式外交に応じる用意があると確信と表明

トルコのバイカル社とイタリアのレオナルド社、欧州製ドローンの共同生産を目指す

トルコのバイカル社とイタリアのレオナルド社、欧州製ドローンの共同生産を目指す

トルコのバイカル社とイタリアのレオナルド社、欧州製ドローンの共同生産を目指す

日本、湾岸石油ルート防衛へ艦艇派遣に慎重姿勢

日本、湾岸石油ルート防衛へ艦艇派遣に慎重姿勢

日本、湾岸石油ルート防衛へ艦艇派遣に慎重姿勢

トルコ船籍の船がホルムズ海峡を通過

トルコ船籍の船がホルムズ海峡を通過

トルコ船籍の船がホルムズ海峡を通過

イランからトルコ領空に向けて発射された弾道ミサイル、NATOが無力化

イランからトルコ領空に向けて発射された弾道ミサイル、NATOが無力化

イランからトルコ領空に向けて発射された弾道ミサイル、NATOが無力化

アメリカ軍機がイラク西部で墜落

アメリカ軍機がイラク西部で墜落

アメリカ軍機がイラク西部で墜落

フィダン外相「トルコはイランで内戦を煽るいかなる計画にも反対」

フィダン外相「トルコはイランで内戦を煽るいかなる計画にも反対」

フィダン外相「トルコはイランで内戦を煽るいかなる計画にも反対」

イラン、ホルムズ海峡通過を試みる米国・イスラエルなどの船舶への警告を再び表明

イラン、ホルムズ海峡通過を試みる米国・イスラエルなどの船舶への警告を再び表明

イラン、ホルムズ海峡通過を試みる米国・イスラエルなどの船舶への警告を再び表明