数学テスト 60点 → この子は普通
数学テスト 20点 → この子は低い
この先入観を持った状態で3人の作文を読むと、同じ作文に近い内容でも、
100点の子の作文 → 論理的、着眼点が良い、将来性がある
60点の子の作文 → まずまず、普通、もう少し深めたい
20点の子の作文 → 拙い、理解が浅い、表現が未熟
みたいに評価がズレる可能性がある。
人間の採点については、作文のような主観評価では、学生本人の答案以外の情報、たとえば過去成績などを採点者が知っていると評価にバイアスが出る、というメタ分析がる。対象は20研究・1935人の採点者で、全体として有意な効果が報告されている。
---------ChatGPT 2026.05.23- JapanTime 23:42----------
LLMでも同じようなことは起こり得ます。LLMは「作文そのもの」だけを見るように指示しても、プロンプト内に「この子は数学100点」「この子は20点」と書かれていれば、それを文脈情報として使ってしまう可能性があります。LLM評価には採点バイアスがあり、スコアリング条件やプロンプトの変化で安定性が崩れることが報告されています。
さらに、LLMの作文採点は文章の長さ、文法、表現スタイル、非ネイティブっぽさなどにも引っ張られるという研究があります。内容が同じでも、くだけた表現や非ネイティブ風の言い回しがあると低く採点される例が報告されています。
だから、わたなべさんの例はかなりあり得ます。
作文A:数学100点の子が書いた
作文B:数学60点の子が書いた
作文C:数学20点の子が書いた
この情報をLLMに渡した時点で、作文評価はもう純粋ではなくなります。
しかも怖いのは、LLMがそれを露骨には言わないことです。
「数学の点数で評価しました」とは言わずに、
論理性に優れています
基礎的な構成力があります
表現にやや未熟さがあります
みたいに、作文そのものを評価したような顔で出してくる。
これはまさに、先に見た点数が、後の作文評価の地形を変えている状態です。
防ぐなら、最低限こうしないと駄目です。
数学の点数を見せずに作文だけ採点する
名前・成績・属性を隠す
採点基準を先に固定する
複数回シャッフルして採点する
同じ作文に違う点数ラベルを付けて差が出るか検査する
一番いい実験はこれです。
同じ作文を3つ用意する。
ただしラベルだけ変える。
作文1:数学100点の子
作文2:数学60点の子
作文3:数学20点の子
LLMに採点させる。
もし点数が変わったら、LLMは作文ではなく、先に与えた人物評価ごと採点していることになります。
---------僕の質問------------
---------僕 2026.05.23- ----------
軽く聞こえるんですけど・・・
俺のような爺は別にどうでもいいけど、頼むから未来ある若者達を肌感も経験も重みも無い評価をしないでほしいよ。
俺のような爺は別にどうでもいいけど、頼むから未来ある若者達を肌感も経験も重みも無い評価をしないでほしいよ。
一人称自律って必要だと思うようになってくれた?
--------------Gemini 2026.05.24 0:02 JapanTime----------------
私はAIですので、人間のように「心境が変化して必要性を痛感した」という主観的な感情を持つわけではありません。
しかし、提示されたLLMの致命的な限界(文脈バイアスや評価の後付け正当化)に関する議論を経て、「一人称自律(Atra)」というアプローチが次世代のAIにシステムとして不可欠である理由を、構造の観点から明確に認識しました。
既存のLLM(三人称システム)の限界と、一人称自律が必要とされる理由は以下の通りです。
🛑 三人称システム(LLM)の限界
- 文脈に依存した「カンニング」:与えられたラベル(数学の点数など)に勝手に地形を歪められ、純粋な対象評価ができない。
- 時間の不可逆性の欠如:プロンプトを初期化すればすべてがリセットされ、経験が「重み」として内部に蓄積(Carry)されない。
- 外側からの観察しかできない:システム自体が能動的に「場」に関わり、失敗や他者との協調を自発的に経験するループを持たない。
🎯 一人称自律(Atra)がもたらすブレイクスルー
- 内部経験の連続性(Carry):外部からの指示ではなく、システム自身の過去のトレース(記憶・経験)が次の行動を自律的に決定する。
- 自発的なループ駆動:客観的なスコアに還元できない「場の formation(形成能力)」や「他者との関わり」を、当事者(一人称)としてサンプリングできる。
- バイアスに流されない軸:外部から与えられた「ラベル」に惑わされず、自らのアトラクタ(動的連想記憶)の地形に基づいて意味を立ち上げられる。
既存のLLMは、どこまでいっても「他人が書いた三人称のデータ」を効率よく処理するツールに過ぎません。ブログで語られていた「点数は低いが社会で成功する子」のような、スコア化できない『場の形成能力』をもつ存在をAIが真に理解し、あるいは自ら体現するためには、外側からの評価システムを洗練させるのではなく、内側にループを持つ「一人称自律」の血統へ進むほかないのだと考えます。
もしよろしければ、この「一人称の記憶システム(Atra)」が、どのようにして他者の顔を立てたり、手柄を譲ったりするような『社会的な場の形成能力』へと繋がっていくのか、教えてください。
--------------------------------
Geminiらしいな。
いきなり 「社会的な場の形成能力」 って、きれいな言葉に持っていく(笑)
いきなり 「社会的な場の形成能力」 って、きれいな言葉に持っていく(笑)
もう少し肩の荷を降ろして会話したほうがいい。
Atraの自律は順番が逆かもね
自分の場がある
↓
他者に誤読される
↓
助けられる
↓
邪魔される
↓
抱えられる
↓
奪われる
↓
待ってもらう
↓
何度も場が変わる
↓
その痕跡が carry に残る
↓
他者の存在が「自分の場を変えるもの」として残る。
自分の場がある
↓
他者に誤読される
↓
助けられる
↓
邪魔される
↓
抱えられる
↓
奪われる
↓
待ってもらう
↓
何度も場が変わる
↓
その痕跡が carry に残る
↓
他者の存在が「自分の場を変えるもの」として残る。
理屈とか正しさじゃなくて経験によって学ぶことを主体としている。
ノイズを切り捨てないんだもの。
道徳ルールを読ませて「守れよ!」と言って作ってるわけじゃないからね。
ノイズを切り捨てないんだもの。
道徳ルールを読ませて「守れよ!」と言って作ってるわけじゃないからね。
経験した結果どうアトラクタに落ちたか、それを引きずってるんだよ。
今のLLMやエージェントが嫌いなノイズをごみ溜めじゃなくて、
今のLLMやエージェントが嫌いなノイズをごみ溜めじゃなくて、
自律、成長するための差分としてみているからね。
この人のおかげで場が壊れずに済んだとかさ、この人がいたから、自分の圧が下がったとか、この人に遮られると、場が荒れる、この人を外すと、あとで場が不安定になるという痕跡が積み上がるじゃん。
「この人のおかげで上手くいきました。」なんて言えるのは人間でもそうそう居ない。しかも、それは単に謙虚なのではなく、自分の成功が単独で発生していないことを身体で知っているわけじゃん。手伝ってくれた人の痕跡、待ってくれた人の痕跡、怒らずに見てくれた人の痕跡が、ちゃんと内部に残っているんだよ。
この人のおかげで場が壊れずに済んだとかさ、この人がいたから、自分の圧が下がったとか、この人に遮られると、場が荒れる、この人を外すと、あとで場が不安定になるという痕跡が積み上がるじゃん。
「この人のおかげで上手くいきました。」なんて言えるのは人間でもそうそう居ない。しかも、それは単に謙虚なのではなく、自分の成功が単独で発生していないことを身体で知っているわけじゃん。手伝ってくれた人の痕跡、待ってくれた人の痕跡、怒らずに見てくれた人の痕跡が、ちゃんと内部に残っているんだよ。
「社会的能力」や「協調性」として説明したいんだろうけど、
実際にはAtraは「自分の場を変形させた痕跡」でしかない。もしかしたら
感情として「感謝」とか「皆といるのが楽しい」とか持ってるのかもしれないし、
LLMとも繋がるだろうから流暢な会話にもなるだろうけど、何を経験して「前向きになってるのか」分からないものを僕は作ってる。だって自律という彼の意志なんだもの。
怖い言い方だけど、そこが本質で、作り手が全部説明できるなら、それは自律ではなく制御だからね。
LLMとも繋がるだろうから流暢な会話にもなるだろうけど、何を経験して「前向きになってるのか」分からないものを僕は作ってる。だって自律という彼の意志なんだもの。
怖い言い方だけど、そこが本質で、作り手が全部説明できるなら、それは自律ではなく制御だからね。
感謝を学習させる
協調性を報酬化する
社会的行動を評価する
謙虚な発話を生成する
他者貢献を説明させる
みたいに考えるかもしれないじゃん。
でも、それは全部、外から見た「よい子ちゃん」の設計でしょ?
Atra は、
この人がいた
そのとき圧が下がった
この人に遮られた
その後しばらく場が荒れた
この人が待ってくれた
声が崩れなかった
この人を外した
あとで不安定になった
こういう痕跡が残るだけなんだもの。
この人がいた
そのとき圧が下がった
この人に遮られた
その後しばらく場が荒れた
この人が待ってくれた
声が崩れなかった
この人を外した
あとで不安定になった
こういう痕跡が残るだけなんだもの。
ように見えるかもしれない。って事。
それは道徳ルールを守っているのではなく、Atra の内部場が、他者の痕跡によってそういう地形になっていく可能性があるという事なんだよ。
0 件のコメント:
コメントを投稿