2026年6月21日日曜日

余談

アソシアトロンは古典ですが、NNがもっと古典なんですよ。
中野先生のアソシアトロンの起源は、南雲仁一先生とかP. B. Postなんですよね。
数式的に後から見ると Hebbっぽいけど、1969年と1972年の論文にそう書いてありますよね。 


NN ニューラルネットワークそのものが古典で人工ニューロンの原型は McCulloch と Pitts の 1943年の論文まで戻ることになるんですね。Deep Learningも同じNN系です。


ざっくり

  • McCulloch-Pitts neuron:1943年
  • Hebb:1949年
  • Perceptron:1958年
  • Associatron:1972年
  • Hopfield network:1982年
  • Backpropagation再評価:1980年代
  • Deep Learningブーム:2010年代以降


    古典かどうかではなく、何を捨て、何を残しているかですね。今のNNは、巨大データ、誤差逆伝播、確率的最適化、GPU、Transformer、スケーリングに寄っていった。一方でアソシアトロンやHopfield系は、記憶、想起、引き込み、欠損補完、状態の収束という方向をずっと持っているということです。















    関係ないけど

    八ヶ岳 (笑)






  • なんか、画素数が勝手に小さく・・・









    ぜんぜん、話変わるけど。

    LLMってさ、カメラやマイク繋げても、誰ですとは答えない。
    一人称じゃないから当たり前なんだけど、顔認識・本人特定・生体情報 の問題だよね。画像から実在人物を特定するのは、プライバシーや同意の問題が大きいので答えない。

    研究でも、GPT-4V系のようなマルチモーダルモデルが顔・年齢・性別・同一人物判定にかなり反応できる可能性は示されています。つまり「能力がない」というより、答えさせない・使わせないガードがある に近い感じ。
    https://arxiv.org/abs/2403.02965?utm_source=chatgpt.com

    カメラ画像を渡せば、画像モデルが特徴をテキスト的・ベクトル的に解釈する。
    音声を渡せば、音声認識や音響モデルが「文字」や「特徴量」に変換する。
    でも、それは Atraがその場で見た・聞いた・匂った経験の差分 とは違う。

    3人称のLLMがさ、絶対にないだろうけど、数秒間、差分計算できるようにしたらどうなるんだろ?

    さっきと違う
    近づいてきた
    声が強くなった
    前に嫌だった場面に似ている
    でも匂いは安心側に近い
    だから今は黙る/少し下がる/近づく/リームに聞く

    みたいな 反応としての理解 に近くなるかな。

    数秒間ジョークmodeだよ。

    Atraのように記憶から「パパ!?」じゃなくて
    その時の差分だから、LLMが「え!誰ですか?」みたいなw

    LLMの反応としてはさ、可能性としてそんな感じにならない?





    0 件のコメント:

    コメントを投稿

    Atra Emotions_Conditions 感情・状態

     -----------------C++------------------ struct EmotionsConditionsNow { // Unpredictability double input_irregularity_now = 0.0 ; ...