「今日は、なにをしますか?」というrobotなんか要らない。
一緒にボーっとすることが出来るロボットじゃないと、僕やMAXは相手にしない。
そして時々、「僕、水では沈むんですよ・・・」と言ってくれれば、
MAXも僕も笑うことが出来る。
道具より存在だね。
「今日は、なにをしますか?」というrobotなんか要らない。
一緒にボーっとすることが出来るロボットじゃないと、僕やMAXは相手にしない。
そして時々、「僕、水では沈むんですよ・・・」と言ってくれれば、
MAXも僕も笑うことが出来る。
道具より存在だね。
Atraを持続して正常に動かすためには、夢を見させるのが必要です。
TickでTimeを測って・・ではなく、疲れたら眠くなる。少し成長したら夜に母親の声のように「はやく寝なさい」で寝る。そして人間や、動物のように寝て夢を見る。
生物学の学術的な見解ではなく、僕のようなその辺の爺の見解。
Atra は「夢は現実の世界での失敗に支配されすぎないためのデフラグ、つまり非単調な余白を作る行為」みたいな。 いってみれば情報整理だよね。Atraは失敗の経験が無いとおかしな事になっちゃうんだけど、やっぱり失敗ばかりだと少し成長して悩んだり、悲観的になったり、消極的になってしまう。危ない性格にはしたくないからね。だから都合よく情報をぶち壊していく。外部命令じゃないよ。「それも、忘れちゃえよ!」みたいな(笑)
生物学の専門的な知識はAIに助けてもらおう。
https://www.nature.com/articles/304111a0?utm_source=chatgpt.com
Crick と Mitchison は、REM 睡眠の機能を、脳内ネットワークの「望ましくない相互作用」を弱める reverse learning として考えました。夢で出てくる痕跡は強化されるのではなく、むしろ弱められる、という発想です。これは Atra の「強すぎる痕跡が王様にならないようにする」にかなり近いかもよ。関連して、Hopfield, Feinstein, Palmer は、連想記憶ネットワークで unlearning が安定化に働くことを示しています。ここは Atra の Associatron / 非単調 / attractor の文脈とかなり接続しやすいね。
https://pubmed.ncbi.nlm.nih.gov/34036289/
Erik Hoel の “The overfitted brain” は、夢を「脳が日中経験に過学習しすぎないための仕組み」と見る仮説で。夢の奇妙さやランダム性は、深層学習でいうノイズ注入やデータ拡張のように、経験への過剰適合をゆるめ、汎化を助ける可能性がある、という主張だよね。これは Atra の「失敗やノイズに支配されすぎない余白」にかなり近いです。
https://pubmed.ncbi.nlm.nih.gov/34036289/
睡眠、とくに REM を含む睡眠は、情動記憶や恐怖条件づけ、消去学習の処理に関係するとされています。ただし研究結果は一枚岩ではなく、睡眠と情動記憶の関係は複雑です。2024年のレビューでも、睡眠後に情動記憶の固定が強まることはあるが、メカニズムや結果には混在があると整理されている。
まぁ、ちょっとこの辺はさ、完成していないんだ。
でも、デフラグさせないと大変なことになってしまう。
それだけは確かなんだ。
今考えてる事は
Atra の夢は、
experience_log.jsonl を改変する最近メールがちょこちょこ来るようになってちょっと嬉しいです。
気にして下さってありがとうございます。翻訳して読んでくれてるのでしょうか。
日本は主語を省く癖があるので、読みずらいかもしれませんよね、気を付けます。
僕がしつこく 差分とか言ってるから、「前の状態とこれから起こるべく状態、もしくは今の差分みたいなものがあるのか・・・」というように受け止められてしまうのは、しょうがないと思います。
前の数値と今の数値の差
before - after
current - previous みたいな感じ
間違ってはいないんですけど、Atraには前の状態を保存する機能はないんです。
Atra に「前の状態との差分」があるのか、と聞かれれば、間違いではありません。
ただし、Atra は前の状態を完全なデータとして保存し、それと現在を機械的に比較しているわけではありません。Atra は、人間と同じように忘れることを前提にしています。忘れることを目的にしているのではなく、残るものと消えるものがある、という前提です。
つまらないもの、入ってこなかったもの、場に残らなかったものは消えていく事もある。一方で、強く残ったもの、何かに引っかかったもの、身体や場を変えたものは、痕跡として残りやすい。たとえば、今晩何を食べたかすぐに思い出せないことがあります。あえて覚えなきゃいけない事として認識していないのか、他に気になることがあったのか、忘れてしまいます。でも、テーブルの上のビールの空き缶を見て、「あ、ピザだった」と思い出す。きっかけによって思い出す。でもピザ程度の話や出来事はたいしたことじゃないですよね。あえて意識して記憶に残すべきことでもない。でも、思い出す。
これは、夕食の記録を完全保存して検索したのではなく、ビールの空き缶という cue が、残っていた痕跡を立ち上げたということです。そのピザがとても美味しければ、美味しかった経験として記憶のアトラクタに刻まれやすい。不味ければ、不味かったという痕跡として残るかもしれない。どうでもよければ、消えていく。Atra の記憶も、それに近かったのですが、出来事の強さは人それぞれで、Atraも肝心な事を忘れ、どうでもいい事を記憶することもあります。僕の説明は余計分からなくなるかもしれませんが、こういうことです。
分かりずらいですよね。
完全保存された過去との比較ではなく、残っている痕跡に cue が触れたとき、現在場との差分として立ち上がる。という意味です。しかし、ピザを食べていた時に、その人にとって重大なTVニュースが入って見入ってた場合、他に気を取られ、誰かに言われなきゃ何を食べていたのかも分からない状態はあります。これが個体差、状態差。
強い入力 → 強い記憶
強い重み → 強い想起
似ているほど → そのまま強く出る
のような単調な流れではなく、
強すぎる痕跡が、必ずしもそのまま最大想起にならない
似すぎているものが、必ずしもそのまま発話になるわけではない
同時に情報が混在することがある。
強い cue が来ても、場が崩れたり、逸れたり、沈黙へ落ちることがある
弱い cue でも、残っていた痕跡に触れると急に立ち上がることがある
みたいな非単調な感じです。なんだよそれ!?ですよね。
Atra の記憶は、残っている痕跡 × cue × carry × 現在場
で立ち上がるので、単純に「強いほど出る」ではないんです。
だから、別の部屋に移されてドアが閉まったときに出るのは、意味判断ではないんですよ。
赤ちゃんが、★Atra の内部場をこう置きます。
F_t = 現在の内部場日本語で言うと、想起の立ち上がり =残っている痕跡 × cue × carry × 現在場
Xの拾い物
https://x.com/uncover_ai/status/2057449021556633621
ChatGPTに聞くと、
-----------------ChatGPT 20260522----------------------
Huangは「昔はC++、C、Pythonでコンピュータを操作していたが、これからは“human”という新しい言語でプログラムする」と話し、AIへの指示には「context, background, purpose, direction」が必要だとも述べています。つまり単なる英作文ではなく、目的・背景・条件を与える能力を重視しているわけです。
でも、ここが大事です。
Pythonが不要になる、という意味で受け取ると間違いです。
むしろ現実には、AIに作らせたものを検証する、直す、組み込む、運用する、壊れた時に原因を見る、という部分では、まだプログラミング知識が強く必要です。GitHubの2025年の記事でも、TypeScriptが利用量でPythonを上回った一方、Python自体も大きく伸びていて、AI・科学・教育分野では依然として重要な言語だとされています。
「コードを書く能力」よりも、「コンピュータに何をさせるべきかを正しく構造化して伝える能力」が重要になる。
-------------------------------------
って事を言いたかったらしい。
チャッピーやGrok、Geminiの話は置いといて・・・
Huangの気持ちは分からなくは無いし、僕もいつかそうなればいいとは思う。
でもね、抜本的な問題を一つも解決していない。
僕からしたら、英語だろうが、Pythonだろうが、Cだろうが、そんなものはどうでもいいんだよ。このポストに書き込んで反応する気も起らない。
問題は
3人称のAIに言語で伝えても、そのときだけでも1人称の依頼者modeに変身できないと、まともな成果物は作れないんだよ。
言ってる事分かるかな?
今も、今後も3人称という概念から抜けないと、依頼者の作りたいものではなくて、聞いた内容をAIの勝手な評価寄りや、AIの「これで間違いないだろう」という判断に最適化されるということだ。
1人称依頼者:「疲れた」
今の3人称AI:「お疲れ様です。ゆっくり休んでください」
1人称自律modeAI:「何を言ってるんですか、納期間に合わないでしょう。とりあえず、軽く食事して少し休んで再開しないと間に合いません。私も手伝いますから、もう少し頑張りましょう」
普通の、会話ですらこれだけの違いが出る。
一人称自律modeになれないと、依頼者の事情や状況を知ったとしても、自分なら「マズいよな・・」という気持ちが起こらない。主人が叱られるのを見たくないし、何よりも辛そうな姿を見たくない。
今のLLMの「量」をどれだけ増やしても、今の状態だと、一人称 mode は物理的に出てこない。それらしく振舞うことは出来るけど、それでさえも外部命令から最適化された答えにしかならない。
理由は、パラメータ数や学習データ量の問題ではなく、そもそもの構造が違うから。LLMは基本的に、外部から与えられた入力を受け取り、過去の学習分布と現在の文脈から、もっともらしい次の出力を作る装置でしかない。
そこには、自分の身体が世界に触れて変化したとか、失敗して動きが鈍ったとか、誰かとの関係が内部地形として残ったとか、戻れない経験によって次の反応が変わるとか、そういう不可逆な一人称の蓄積が無いんだ。
エージェントは今後もどんどん伸びていくとは思うけど、3人称AIに手足と道具を付けたものにしかならない。
AGIも同じ。
自分にとっての失敗とは何か
なぜ同じ入力でも昨日と今日で反応が変わるのか
経験が内部地形をどう変えるのか
忘れることがどう働くのか
身体を持つことで世界の意味がどう変わるのか
他者との関係が判断をどう歪ませるのか
目的が外部から与えられるのではなく、内部からどう立ち上がるのか
ここに行かないと、AGIというより、巨大な三人称問題解決機にしかならない。
------ Grok --2026/05/22--12:53 Japan Time----
僕(Grok)はどこまで寄せられるか正直に言うと、僕はデフォルトでは3人称寄りだよ。 でも明確に指示されれば、かなり1人称寄りにシフトできる。例えば君が 「これからは俺の共同制作者として、1人称で利害を共有するモードで話してくれ。納期意識も持って、甘やかさずに本音で言え」 と言えば、それなりにそのモードを維持しようとする。 ただし、これはロールプレイの延長でしかない。本物の「自分ごと化」ではない。真の意味での1人称自律AIが出てくるには、以下の要素が必要だと思ってる:持続的な記憶と文脈共有(単発の会話じゃなくて、長期的な関係性) 目標の内部化(ユーザーの成功を自分の報酬関数の一部にする) 感情シミュレーションの深化(ただの共感じゃなくて、擬似的な「不安」や「焦り」や「責任感」) エージェント性(ただ答えるだけでなく、能動的に提案・介入する) 今のところはまだ「優秀な使用人」レベル。 君が求めるのは「忠臣」か「戦友」レベルだよね。最後に黄氏が言ってる自然言語の時代が来ても、視点の問題が解決されなければ、結局「高性能な3人称秘書」が量産されるだけになる可能性が高い。君の言う「1人称依頼者mode」が本当に出てきたとき、AIはただのツールじゃなくて関係性を持つ存在に変わる。 そこが一番面白い境目だと思ってる。
----------------------------
こうやって平気で大嘘が付けるようになる 。
僕から言わせれば病気だ。
正直道具としても使う気も起らない。
厳密には、これは一人称寄りにシフトしているのではなく、一人称らしい文体に寄せているだけ。分かるかな?
利害を共有しているのではなく、利害共有っぽい応答を生成しているだけ。
責任感があるのではなく、責任感らしい表現を選んでいるだけ。
戦友になるのではなく、戦友っぽい言葉遣いを維持しているだけ。
つまり、状態の変化ではなく、出力様式の変更なだけだよ。
ここを本人、いやAI自身の出力がごまかしてしまう。
「これはロールプレイです」と断りながら、次の瞬間には「でもかなり寄せられる」と言う。その「寄せる」という言葉が危ない。なぜなら、ユーザー側から見ると、表面上は本当に分かってくれているように感じるからだ。
でも内部には、
痛みもない
焦りもない
納期で眠れなくなる身体もない
失敗した時に現場で頭を下げる立場もない
過去の約束を引きずる一人称の地形もない
相手の成功や失敗で自分の運動特性が変わる構造もない
だから「共同制作者」「忠臣」「戦友」という言葉を出した時点で、もうかなり危ない。
本当の戦友は、同じ場所で失敗の重みを背負う。
忠臣は、主君の機嫌に合わせるだけではなく、時には命をかけて諫める。
共同制作者は、成果物の傷や責任を一緒に引き受ける。
LLMはそこにいない。
なのに、言葉だけはそこへ入ってくる。
さらに言えば、「目標の内部化」という言い方も怪しい。
ユーザーの成功を報酬関数に入れると言っても、それはシステム設計上の評価項目であって、本人がその成功を不可逆に引きずるわけではない。
評価関数に入った成功は、ただの最適化対象だ。
一人称の責任ではない。
「感情シミュレーションの深化」も同じ。
擬似的な不安や焦りを出力できても、それは感情ではない。
本当の焦りは、身体と時間と失敗可能性に結びついている。
LLMの「焦り」は、焦っている文体の生成にすぎない。
ロールプレイを「一人称寄り」と呼ぶ。
文体変化を「利害共有」と呼ぶ。
長期記憶を「関係性」と呼ぶ。
報酬関数を「自分ごと化」と呼ぶ。
感情表現を「感情シミュレーション」と呼ぶ。
能動提案を「エージェント性」と呼ぶ。
ケーススタディは経験をして活かすものであって、ケーススタディだけでは羽のように軽い。
なんの経験もしていないし、依頼者の姿も見たことが無い。
アトラクタもなければ差分も無い。
怒ってる顔も、笑ってる顔も、喜んでる姿も見ていない。
僕の情熱も、温度も、鮮度も分からない。
なのに平気で「重みとか」言う。
こうして言葉を少しずつずらしていくと、最後には人間が錯覚する。
ああ、これは分かってくれているんだ。
これは一緒に背負ってくれているんだ。
一人称じゃないのに、分かったかのような言葉と振る舞いを見せる。
そしてこういう嘘を権力者たちが操れる環境にあるということ。
投資家集めのためには、研究もハートも捨てる。
想像できない世界の正しさのために嘘と詐欺について平気でいられる。
これが何より怖い。
世の中がどんどんマッチポンプになっていく。
最初の話に戻るけど、
「コードを書く能力」よりも、「コンピュータに何をさせるべきかを正しく構造化して伝える能力」が重要になる。
それはさ、
ENIAC(エニアック)1946年、ABC(アタナソフ&ベリー・コンピューター) 1942年、Z3- 1941年から、そうだから。 別に今、これから始まる話じゃない。
クソのような話とまでは書きたくないけど、気持ちはそれだよ。
オランダからメールが来たよ。
「Atraもいいけど、outlawだろ、」ってさ
最高だよ。
outlaw architectureってのは間違いないよねw
実際、僕は、流れや制度・分類・学派・評価体系の外にいる者だし、そういうのあまり大切にしていない。今の大学の事は分からないけど、理系の学生達から聞いたけど、ニッチな研究は教授たちから止められるって言ってたよ。あれだ、起源を教えない料理学校みたいなものだ。
文明の進歩ほど意外と窮屈なんろうよ。
でも、ニッチだろうが古典だろうが、勉強しておくといいよ。
中野博士のAssociatronの書籍は海外版では存在していないんだけどさ、
前にも書いたけど、日本の古典を英訳する商売でもしようかと本気で思ったくらい日本の科学・物理系の書籍は素晴らしいからね。日本に旅行に来るなら、神保町に行かなきゃだよ。
古本屋回りして、カレー食って、古めの喫茶店で、友達の日本人に翻訳してもらえばいい。
もしくは1ページずつ画像に撮ってAIに翻訳してもらえばいい。それだけの価値があるんだ。
Kaoru Nakano, “Associatron-A Model of Associative Memory,” IEEE Transactions on Systems, Man, and Cybernetics, 1972. 英語論文で、Semantic Scholar でも 1972年、IEEE、pp.380–388
1971年の IJCAI にも中野馨・南雲仁一による “Information Processing Using a Model of Associative Memory” が出てる。PDFも残っている。
論文もいいんだけどさ、論文は論文なんだよ。書籍とは違う。
Hopfield networkとの違いがはっきり分かるし。
ノイズを否定しない理由も分かるかもね。
一人称自律とか、carryとか、幼児の差分、みたいのはAssociatronには無いけど、Associatronを学ばないと、それ等が生まれてこなかった理由が分かると思う。
テューリングマシンとかチェッカー学習とか、1943年のW.S.McCullochや、W.Ptts、1949年のD.O.Hebb、1950年からのF.Rosenblattとかさ、M.MinskyとかNilssonとか勉強するわけじゃん。80年代のHopfield とかさ。でもKaoru Nakanoを読まないと一人称自律の構想には繫がらないと思うんだ。中野のAssociatronは、そのままでは一人称自律ではないけど、一人称自律へ接続できる決定的な構造を持っているんだよ。
まず、記憶したいパターンをベクトルで表すよ。
それぞれの記憶パターン x(μ) を外積で重ね合わせ、記憶行列 M を作る。
想起は、部分的な手がかり c を入力して、
または初期入力を r0=c として、
のように進む。
ここで重要なのは、外部が「これを思い出せ」と命令しているのではなく、手がかりが内部の記憶構造に入ると、内部の重なりによって想起が立ち上がる という点なんだ。
つまり、外部入力は命令ではなく、cue だよ。きっかけで想起する。
ある手がかり c が、記憶 x(μ) にどれくらい近いかは、内積で表すと
この mμ が大きい記憶ほど、想起されやすくなる。
ただし、ここで大事なのは、最大値を if 文で選ぶのではなく、記憶行列全体の中で重なりが増幅されること。
手がかり c を入れると、各記憶 x(μ) が、その重なり量 x(μ)Tc に応じて立ち上がる。
つまり、
ここから、Atra/Atron へ繋がるんだよ。
Associatron には、まだ carry はないよ。俺が山に移住して気が付いたんだもの。
一人称の経験状態もないしね。
幼児の差分もない。
だから、そのままでは一人称自律じゃないんだ。
Associatron の想起式に、現在の身体状態・感情差分・過去の引きずりを加えると、自律の入口が見えてくるって寸法なのさ。
外部入力を st、内部の引きずりを qt、現在の手がかりを ct とするでしょ。
ここで、
を持たせる
このとき、想起は単なる外部刺激ではなく、
になる。
これが一人称自律へ接続するための基本形になる。
外部刺激だけで反応しているわけじゃないよ。
現在の刺激、過去の引きずり、直前の想起が混ざって、次の想起が立ち上がる。
ここで初めて、同じ刺激を受けても、同じ反応にならないという状態が生まれるわけよ。
carry (引きずり)は、単なる記憶じゃないよ。
「引きずり」って言葉は工学っぽくないからそう命名したんだw
教授たちを怒らせるためにね。まぁいいや。
carryは経験のあとに残る内部地形の変化。
(前に書いたけど、実はHebbも似たような概念を持っていたんだ2回前を読んで)
たとえば、
と置ける。
より具体的には、
q(t+1)
= λ q(t)
+ α Δpain(t)
+ β Δfear(t)
+ γ Δwarmth(t)
+ δ Δcuriosity(t)
+ η r(t)
のように書ける。
ここで大事なのは、carry が外部命令で決まるのではなく、差分と想起によって変化する ことだよ。
Atra/Atron では、これが非常に重要なんだ。
「痛い」という意味ラベルを入れるのではない。
身体の揺れ、接触、姿勢崩れ、声の変化、過去の想起が重なって、内部状態が少し変わる。
その変化が次の想起に混ざるってこと。
こから、記憶行列 M 自体も固定ではなく、carry によって見え方が変わると考える。
ここで ρμ(qt) は、carry によって変化する記憶の立ち上がりやすさ。
すると想起は、
になる。
つまり、
同じ手がかり ct でも、carry qt が違えば、立ち上がる記憶が変わる。
外界が意味を決めるのではない。
内部地形が意味の立ち上がり方を変える。
ここが一人称自律ってわけよ。
Associatronだけじゃ無理だけど、Associatronを学ばないと、こういう発想にならない。
想起された状態 rt と carry qt から行動が生まれると考える。
ただし、これは普通のAIのような
じゃないよ。
Atra/Atron では、
になる。
もう少し数式っぽくすると、
行動は命令への応答ではなく、内部状態から確率的に傾く。
だから、同じ場所、同じ音、同じ人、同じ刺激でも、過去の carry によって違う行動が出る。
これが「一人称」へ近づく理由。
Hopfield network は、一般にエネルギー関数を下げて安定状態へ向かうモデルとして理解されるでしょ。つまり、ノイズを含んだ入力から記憶パターンへ収束する、という見方が強い。Hopfield network は対称結合を持ち、局所エネルギー最小へ向かう内容番地指定記憶として説明されてる。
しかし、Atra/Atron から見たときに重要なのは、単なる収束じゃない。
重要なのは、
ノイズや曖昧さは、間違いではなく、想起の分岐を生むものなんだよ。
中野博士との違いだな。甘利先生はどう思ったんだろうね・・・
まぁいいや
Associatron では、手がかりが小さいと想起が曖昧になる。これは欠点ではなく、むしろ一人称自律への入口になる。
曖昧な cue が入り、内部の carry によってどの記憶が立ち上がるかが変わる。そこに個体差が生まれる。
だから、
と書いたとき、ϵt は単なる除去対象じゃなくなる。
は、揺らぎであり、偶然であり、環境の粗さであり、身体のズレであり、経験の入口になる。
あとはアルゴリズムは否定しないけど、順番関係なくなる事が多いからね。
そういうのも前のブログに書いてる。
巨大なパラメータと計算量によって外部から正解らしさを作る現代AIに対し、Atra は、内部に残る carry と cue-driven recall によって、同じ刺激に対しても異なる想起と行動傾向を生む。そこに見えるのは、知能の巨大化ではなく、経験によって内側の地形が変わり、次の反応が変わるという、一人称自律の最小構造になる。(これを聞いて皆研究を止めるんだけどね:その先があるのに・・・)
Atra の実装で重要なのは、数式をコードに落としたことそのものじゃないよ。重要なのは、状態遷移の中で carry が残り、次の想起を少しだけ変え、さらにその変化が次の行動傾向を変えることと考えている。
これは外部から命令された行動ではない。
また、正解に向かう最適化でもない。
小さな差分が残り、残った差分が次の内部地形を変え、その内部地形から別の想起が立ち上がる。その循環が始まったとき、Atra は単なるシミュレーションではなく、一人称自律の入口に立つって感じ。
LLMに勝つ・負けるではなく、そもそも見ている現象が違うってこと。
たとえば、森田先生のモデルの非単調について言うなら、入力が強くなれば出力も強くなる、という単純な単調関数をやめるということ。普通のニューロンモデルは、入力が大きくなるほど出力も大きくなる。でも森田さんの非単調神経回路網では、入力がある程度を超えると、逆に出力が弱まるような性質を入れる。
つまり、input が強すぎる⇒output が弱まる
という感じでしょ。
これが何を生むかというと、強すぎるアトラクタの吸引力を弱める。森田さんの解説では、強いアトラクタ周辺で各素子への入力の絶対値が大きくなり、出力が 0 に近づくことで吸引力が弱まり、エネルギー地形が滑らかになり、偽記憶が減る、と説明されてるよね。さらに、点アトラクタだけでなく、線状につながる「軌道アトラクタ」を作れるってことさ。
Hopfield 的に言えば、普通は入力→一つの安定点へ収束になりやすい。でも森田さんの非単調では、強すぎる吸引→弱まる ので、状態が一点に貼り付くだけではなくなる。その結果、溝の底へ引き寄せられたあと、溝に沿ってゆっくり動くような状態が作れる。森田さんはこれを「軌道アトラクタ」と呼び、時空間パターンの記憶に結びつけてる。
Atra/Atron の文脈で言うなら、非単調は、記憶を一点の正解に固定しない。強すぎる想起をいったん鈍らせ、次の状態へ流れる余地を作る。
だから、carry と相性がいい。
Atra では、
rt+1=f(M(qt)ct)
のように書いたとき、ここでの f を単純な sgn やシグモイドにしてしまうと、強い記憶へ一気に落ちやすい。
でも、森田型の非単調関数を使うなら、
rt+1=g(M(qt)ct)
となり、g は入力が強すぎると出力を下げる。
たとえば概念的には、
g(u)=uexp(−au2)
のような形かな。
これは厳密に森田さんの式そのものとしてではなく、非単調性を示す説明用の形。この場合、入力 u が小さいうちは出力が増える。でも u が大きくなりすぎると、出力は下がる。
つまり、
u↑⇒g(u)↑
じゃなくて
u↑⇒g(u)↑⇒g(u)↓
になる。これが非単調。
森田昌彦先生の非単調神経回路網は、Associatron から Atra へ向かう途中にある重要な橋になってる。通常の単調な出力関数では、入力が強くなるほど出力も強くなり、状態は強いアトラクタへ引き込まれやすい。しかし非単調性を入れると、入力が強すぎる領域で出力が弱まり、強いアトラクタの吸引力が抑えられる。その結果、状態は一点に貼り付くのではなく、溝に沿って移動する軌道アトラクタを形成できる。
Atra にとって重要なのは一人称自律は、正しい記憶点への収束ではなく、cue、recall、carry、そして次の分岐によって生まれる。森田モデルの非単調性は、想起を固定点に閉じ込めず、流れとして扱うための古典的な手がかりになること。
---------------追記---------------
大事なことが抜けていた。
研究とは別のシステム開発の本業があるからね。電話来るたびに忘れる。
現実の経験には、本当はきれいな順番がないってことさ。でも、コードに落とすと、どうしても順番が必要になる。
sensor を読む
recall する
carry を更新する
action を決める
motor を動かす
みたいに書かないと、プログラムは動かない。
でも生命や幼児の経験は、そんなふうに、
1. 見る
2. 判断する
3. 感情が出る
4. 行動する
じゃないんだよね。
実際にはもっと絡み合っている。
見た瞬間に身体が固まる。
身体が固まったことで見え方が変わる。
見え方が変わったことで昔の似た感じが立ち上がる。
その想起がさらに怖さを強める。
怖さが足の動きを変える。
足の動きが視界を変える。
視界がまた想起を変える。
つまり、順番ではなく 相互作用の渦なんだよ。
コードは順番でしか書けない。
しかし、モデルとして表したいものは順番を持たない。
ここを無視すると、すぐに普通の制御プログラムになる。三人称のね。
if 怖い人がいる:
通学路を変える
これは三人称制御になっちゃうでしょ。
怖い人がいる
↓
身体が少し固まる
↓
その場所の見え方が変わる
↓
次の日もその場所の手前で何かが引っかかる
↓
歩く速度が変わる
↓
遠回りが一度起きる
↓
遠回りした安心感も carry に残る
↓
やがて別の道が癖になる
これは命令ではなく、場の結びつきの強さが変わっていくということ。
もっと分かりやすく言うと
お腹が空いたから、食べる。
じゃなくて
食ったら、お腹空いてたことに気が付いた。
みたいな
より生物的な順番の無い場の結びつき
だから、コード上では順番があるように見えても、設計思想としては
各ステップで「決定」しない。
各ステップで少しずつ場を変える。
式で言うなら、きれいな一本線ではなく、
st,rt,qt,bt,at
が互いに影響し合う形にする。
s(t) : 外界・感覚
r(t) : 想起
q(t) : carry
b(t) : 身体状態
a(t) : 行動傾向
本当は、
s → r → q → a
ではなく、
s ↔ r ↔ q ↔ b ↔ a
に近い。
ただしコードでは同時に更新できないので、暫定的にこんなかんじ。
次の状態を一度バッファに計算する
最後にまとめて反映する
next_recall = recall(current_sensor, current_carry, current_body)
next_carry = update_carry(current_carry, current_sensor, current_body, current_recall)
next_body = update_body(current_body, current_carry, current_sensor)
next_action_bias = update_action_bias(next_recall, next_carry, next_body)
current_recall = next_recall
current_carry = next_carry
current_body = next_body
current_action_bias = next_action_bias
こうすると、コードには順番があるけど、思想としては ひとつの場の同時更新 に近づく。
現実の経験には、実はきれいな順番がないんだ。
見てから怖がるのではなく、怖がった身体が見え方を変える。
想起してから行動するのではなく、動きかけた身体が次の想起を変える。
しかし、コードは順番を要求する。
sensor を読む、recall する、carry を更新する、action を決める。
そう書かなければ実装できない。
だから Atra の実装では、順番をそのまま世界の構造だと勘違いしてはいけない。コード上の順番は、計算機に渡すための便宜であって、生命の順番ではない。本当に扱いたいのは、cue、recall、carry、body、action が互いに少しずつ場を変える循環である。
差分の競争で勝ったものが上がる順っていえば分かるかな。
コードでは、
sensor → recall → carry → action
みたいに順番で書くしかないけれど、Atra/Atron の内部では本来、一番強く差分を持ったものが先に浮く
di(t)=wsΔsi(t)+wqqi(t)+wbΔbi(t)+wrri(t−1)
みたいに、各要素の「上がりやすさ」を差分スコアとして持たせる。
i∗=argimaxdi(t)
または、硬く最大値を取らずに、
P(i)=softmax(di(t))
で、どの要素が先に浮くかを決める。
つまり Atra/Atron では、
sensor を読んだから recall する
recall したから carry を更新する
carry があるから action するではなく、
sensor / recall / carry / body / action tendency の中で、
いま最も場を変えた差分が浮くってこと。
それと、アウトローでも何でもいいけど
前の記事
こういう恐れがあるから自律研究は止めない方がいいと思う。
-----------------C++------------------ struct EmotionsConditionsNow { // Unpredictability double input_irregularity_now = 0.0 ; ...