MENU ボスの展望台ボスのTwitter物理学人工知能/ LLM・基盤モデルとは?
   AI/人工知能・・・の考察 (3) 

  
   LLM/大規模言語モデルの考察

           wpe4F.jpg (12230 バイト)
トップページNew Page WaveHot SpotMenu最新のアップロード   担当: ボス= 岡田 健吉

               

 2025年7月           上から ・・・下へ   
 7月  16日

《LLM/大規模言語モデルの考察》 (1~5)

【プロローグ】 (1~5)

“参考文献”

    日経サイエンス・・・2023/10     日経サイエンス・・・2025/02

     

日経サイエンス・・・2023/10

<特集>

  = 大規模言語モデル/ 科学を変える AI =

  ■ オウム以上フクロウ未満?/生成AI の“思考力”

    <生成AI は事前に教えていないことを、どういうわけか、理解している様だ。

      いったい何故なのか?研究者は理解に苦しんでいる。>

                                 G.マッサー(SCIENTIFIC AMERICAN 編集部)


  ■ 大規模言語モデルとは何か

    <ChatGPT で一躍有名になったこの AI は、一体、どこからやって来て、どこ

      へ向かうのだろう。>

                                                 出村政彬(編集部)



  ■ 脳とAI 溶ける境界/大規模言語モデルが開く、脳の理解

     <脳の中で、異なる種類の情報はどの様に統合されるのか。この長年の未解

      決問題に、大規模言語モデルが新たな光を当てている。>

                                     平理一郎(東京医科歯科大学)

                                     丸山隆一(科学技術振興機構研究開)


  ■ タンパク質を語る言語

    <AI は、便利な実験ツールにとどまらず、生命現象を俯瞰する新たな視点を

     提供しつつある。>

                                                 出村政彬(編集部)

 

《大規模言語モデルの考察》 (6)         

【プロローグ】 (6)
                          

「はい、ええ…」秋月茜が、一礼して、椅子に掛けた。「さっそく、始めましょう…

同じメンバーで、考察して行きます。皆さん、よろしくお願いします。

今回は…

猛暑季節でもあり…

 

《大規模言語モデルの考察》 (7)     wpe4F.jpg (12230 バイト)

【プロローグ】 (7)

羽衣弥生さんクラブ・須弥山 から、飲物フルーツも、取り寄せたいと思っていま

す。

さあ…

2025・・・参議院選挙> も…

現在最終盤になっていますね。《危機管理センター》 で、里中響子さんが、見守って

ます。それから…

 

《大規模言語モデルの考察》 (8)      

【プロローグ】 (8)


《My Weekly Journal》/編集長/津田真さんも、一緒に、注視しています。

今回は…

当/《HomePage/人間ん理空間》 では…

<東京都/・・・山尾しおり(さん)を、推奨しています。実力派であり、必ず

活躍する人材です。よろしくお願いします 

 

        

                          (/ネットより画像借用)


 7月  17日

《LLM/大規模言語モデルの考察》 (9)         

【プロローグ】 (9)


ええと…

あ、折原マチコさんと、ポンちゃんが、さっそく、飲物フルーツを運んで来てくれています

ね、」

マチコポン助が、それらをワゴンから軽食テーブルの方に移していた。フルーツジュース

に、スライスしたスイカは、小皿に…

 

《LLM/大規模言語モデルの考察》 (10)       

【プロローグ】 (10)


…盛り分けてあった。

マチコさん…」茜が言った。「お久しぶりです!

うん!」マチコが言った。「このスイカ美味しいわよ! 熊本産だと言っていたわねえ、」

「そうですか…」茜が、満面で微笑んだ。

他のみんなも、軽食テーブルの方に集まって来た。

 

《大規模言語モデルの考察》 (11)

【● LLM/大規模言語モデルとは?】 (1)


     


「さあ…」茜が、準備したスクリーンボードを眺めた。「さっそく、本題に入ります…

参考文献 にある…

4本論文記事掲載しましたが、難しい内容

 

《大規模言語モデルの考察》 (12)       
                                             (/ネットより画像借用)

● LLM/大規模言語モデル・・・とは?】 (2)


…なので、最も分かりやすい所から、入って行きましょう。つまり、論文の順序が違います

が、まず2番目論文記事/大規模言語モデルとは・・・何か?」 から、入る事にしま

す。そして、まさにこれが、このページ本題でもあるわけですね。

 

《大規模言語モデル考察》 (13)    
                                         (/ネットより画像借用)

LLM/大規模言語モデル・・・とは?】 (3)


ええと…

<LLM = Large Language Models/大規模言語モデル> とは…

簡単に言えば…

<ChatGPTの・・・内部で動いている・・・AI のコト・・・> ですね、」

「はい…」高杉が、うなづき、参考文献 を落とした。「ええ…

 

《大規模言語モデルの考察》 (14)    
                                                (/ネットより画像借用)

● LLM/大規模言語モデル・・・とは?】 (4)


<米・オープンAI (社)提供する…

<ChatGPT> の中では、2023年8月現在の、時点ですが…

<GPT-3.5/・・・有料版では、GPT-4> という、<大規模言語モデル> が、動い

ています。

データが、少々古いのは…

参考文献が…



 7月  18日

《大規模言語モデル考察》 (15)   
                                                (/ネットより画像借用)

LLM/大規模言語モデル・・・とは?】 (5)


2023年10月モノだからです。私達は、まず、<大規模言語モデル> 開闢(かい

びゃく)時点から、その基盤技術と、“人間の理解を超える・・・奇妙な謎の発火・・・” を、考察

して行こうと、考えています」

そういう意味では…

 

《大規模言語モデル考察》 (16)  wpe4F.jpg (12230 バイト)  
                                            (/ネットより画像借用)

LLM/大規模言語モデル・・・とは?】 (6)


…」支折が言った。「古いデータというコトでは、ないわけですね?」

「まあ…」高杉が、を崩した。「10年後に振り返れば、まさに、“当初から” と言えるでしょ

う。

<LLM/=大規模言語モデル> は…

<オープンAI (社) 以外

 

《大規模言語モデル考察》 (17)        

LLM/大規模言語モデル・・・とは?】 (7)


…にも、<グーグル> や、<マイクロソフト> <メタ> <アマゾン> といった、

名 IT 企業が、ここ数年で、それぞれリリースしています。<オープンAI(社)の・・・

ChatGPT> 登場以後は、さらに動きが加速しています」

「うーん…」支折が…

 

《大規模言語モデル考察》 (18)    wpe4F.jpg (12230 バイト)
                                              (/ネットより画像借用)

LLM/大規模言語モデル・・・とは?】 (8)


…うなづいた。「それは、最近ニュースなどで、チラホラ聞こえて来るわねえ。私達も、ま

さに、そうした時代の、渦中にあるという事ですね?」

「そうです…」高杉が、参考文献 を取り上げた。「さて…

 

 

《大規模言語モデル考察》 (19)  
                                                (/ネットより画像借用)

LLM/大規模言語モデル・・・とは?】 (9)


<● この、AI の仕組み・・・LLM/大規模言語モデル・・・>
は、

ある意味で、シンプルだと言います。


 

<LLM/大規模言語モデル> は・・・

まず、あらかじめ、膨大なテキストを取り込むのです。そして、そこから、知識を学習

して・・・

 

《大規模言語モデル考察》 (20)  
                                       (/ネットより画像借用)

LLM/大規模言語モデル・・・とは?】 (10)


・・・ニューラルネットワークの中に、蓄えるわけです。この知識を利用して、言語に関

する様々なタスクを解きます。

特に・・・

<GPT> の場合は、利用者が入力文の形式を変えるだけで、幅広いタスクをこなせ

る様です。


  
                                      (/ネットより画像借用)



 7月  19日

《大規模言語モデル考察》 (21)   wpe7.jpg (10890 バイト)
                                             (/ネットより画像借用)

LLM/大規模言語モデル・・・とは?】 (11)


<ChatGPT> に、どんな文章を入力するのが、効果的かを指南する書籍も、数多く

出版されている・・・

 


…と、いう事ですねえ、」

「はい…」茜が、うなづいた。「ええ…

<GPTを・・・ベースにした、システム・・・> も …

 

《大規模言語モデル考察》 (22)   
                                        (/ネットより画像借用)

LLM/大規模言語モデル・・・とは?】 (12)


リリースされています。

<大量の医学論文を学習した・・・大規模言語モデルの・・・  BioGPT  > や、

<日常会話で使う・・・普通の言葉を・・・プログラムの、ソースコードに変換する・・・

Codex  >

…など、ですね。

さらに…

 

《大規模言語モデル考察》 (23)   
                                       (/ネットより画像借用)

LLM/大規模言語モデル・・・とは?】 (13)


今年/2023年7月には…

<ChatGPT の・・・有料版> に、 Code Interpreter > という、新機能追加

されたと、言っています。

この機能は、 表形式の・・・数値データの入ったファイルを・・・入力 して、調べた

い項目を…

 

《大規模言語モデル考察》 (24)    
                                         (/ネットより画像借用)

LLM/大規模言語モデル・・・とは?】 (14)


普通の言葉で、入力するものです。

これだけで…

“データ解析のための・・・プログラムを生成し・・・自動で、統計解析をしてくれる” と、いう

ものですね」

「うーん…」支折が言った。「<表形式の・・・数値データファイル> を、入れて

 

《大規模言語モデル考察》 (25)   wpe4F.jpg (12230 バイト)
                            ヒューマノイド・ロボット    (/ネットより画像借用)

LLM/大規模言語モデル・・・とは?】 (15)


置くわけですね。後は、普通の言葉質問すれば、いいわけですか。

これが、ええと…

日常会話で使う、普通の言葉を・・・プログラムの、ソースコードに変換する・・・

Codex >

…なのですね?」

「はい…」茜が…

 

《大規模言語モデル考察》 (26)   
                                                     (/ネットより画像借用)

LLM/大規模言語モデル・・・とは?】 (16)


…うなづいた。「こうした、現状というのは…

<★ この AI/・・・大規模言語モデルが・・・単なる、便利な、お喋り(おしゃべり)アシス

タント・・・> 領域を、超えている、という事です。”言葉そのものを・・・本質的に理解し

ている様な・・・印象・・・” と、いう事ですわ」

「そうよねえ…」支折が…



 7月  20日

《大規模言語モデル考察》 (27)  wpe4F.jpg (12230 バイト)
                                                (/ネットより画像借用)

LLM/大規模言語モデル・・・とは?】 (17)


を傾げた。「でも…

“いきなり・・・テキストから・・・知識を学習する” と、言われても、<LLM/大規模言語モ

デル> 内部で、何をしているのかは、いまいち、ピンと来ないわねえ…」

「そうですね…」茜が、小さく

 

《大規模言語モデル考察》 (28)  
                                            (/ネットより画像借用)

LLM/大規模言語モデル・・・とは?】 (18)


…うなづいた。「<この AI/・・・大規模言語モデル> のことを、知ろうとすればするほ

ど、まるで雲をつかもうとしている様な、感覚になります。

一体、<大規模言語モデル> では、言語を、どの様把握しているのでしょうか。

 

《大規模言語モデル考察》 (29)  
                                          (/ネットより画像借用)

LLM/大規模言語モデル・・・とは?】 (19)


ええと…

この、参考文献 の中の、論文記事/『■ 大規模言語モデルとは何か では、この

を、真正面から取り上げています。

<大規模言語モデル> を、理解する上で、キーワードとなるのが…


1/★ 分散表現・・・単語の意味を・・・ベクトルで表す
と…

 

《大規模言語モデル考察》 (30)  
                                                     (/ネットより画像借用)

LLM/大規模言語モデル・・・とは?】 (20)


2/★ Transfomer (トランスフォーマー) という・・・ニューラルネット

…の、2つですわ」

「うーん…」支折が言った。「<Transfomer> という、言葉は…

これまで、何度も聞いているわねえ。意味を調べると、”何かを・・・

 

《大規模言語モデル考察》 (31)     wpe7.jpg (10890 バイト)
                                   
玩具/トランスフォーマー    (/ネットより画像借用)

LLM/大規模言語モデル・・・とは?】 (21)


・・・別のものに変えるもの・・・” という、ことですよね。

例えば…

変圧器(/電気回路の電圧を変える装置)や、ロボット変形する玩具/トランスフォーマー』  な

どが、該当するとか。これは、<AI/・・・ニューラルネット> なのですね。

 

《大規模言語モデル考察》 (32)   wpe4F.jpg (12230 バイト)

LLM/大規模言語モデル・・・とは?】 (22)


うーん…

<★ 単語の意味を・・・ベクトルで表す・・・分散表現> とは、どういうもの、かしら?」

「はい…」茜が、うなづき、スクリーンボードに、を投げた。「そもそも…

コンピューターで、単語意味をとらえるには、<★ 複数の・・・


  

 7月  21日
              海の日

《大規模言語モデル考察》 (33)     

LLM/大規模言語モデル・・・とは?】 (23)


・・・数値からなる・・・ベクトルで意味を表す・・・分散表現> が、適しているのです。つ

まり、ボードに書いてある様に…


  <LLM/大規模言語モデル>

    =

  <ベクトルで、単語の意味を表す・・・分散表現>

    

  <広く、深く・・・データの特徴を学ぶ・・・Transfomer

 

《大規模言語モデル考察》 (34) 
                                                     (/ネットより画像借用)

LLM/大規模言語モデル・・・とは?】 (24)


…が、中核になる、という事ですね。

そして…

<この AI/・・・大規模言語モデル> は、言語自然現象複雑システムを、<丸

ごと受け止められる点で・・・ヒトの脳と、よく似た情報処理・・・> を…

 

《大規模言語モデル考察》 (35)  wpe4F.jpg (12230 バイト)
                                                (/ネットより画像借用)

LLM/大規模言語モデル・・・とは?】 (25)


…行っている、という事です。

さあ…

そこで、まず…

<単語の意味を、ベクトルで表す・・・★ 分散表現について、説明して行きましょう

か。<広く、深く、データの特徴を学ぶ・・・★ Transfomerについては、その後で、

考察します。

とりあえず…

<分散表現> という言葉を、ネットで調べてみました。以下のような、説明になっていま

す…

 

<分散表現>

単語の意味を・・・低次元の実数値ベクトルで・・・表現する手法

分散表現とは、単語意味低次元実数値ベクトル表現する手法です。 これにより、

単語同士距離位置関係から意味を捉えることが可能になります。

具体的には、単語を  ”少ない数の・・・要素で構成された・・・ベクトルに変換” し、これを用

いて、単語の様々な側面表現します。

分散表現は、単語埋め込み(Word Embedding)とも呼ばれ、自然言語処理分野広く利

されています。

 

   

                                                         (/ネットより画像借用)

 

 
…というものですが、どうも、素人にはチンプンカンプンですね。

ともかく…

ここは、”参考文献” に沿って、説明して行きましょうか」

「はい…」支折が…

 

《大規模言語モデル考察》 (36)   wpe4F.jpg (12230 バイト)
                                         (/ネットより画像借用)

LLM/大規模言語モデル・・・とは?】 (26)


…うなづいた。「ベクトルは、“力と方向の・・・矢印” よねえ。それだけで、単語が表される

のかしら?」

「はい…」茜が言った。「ええと…

そもそも…

”単語が並んだ、文字列データである・・・文章” を、なぜ、”ベクトルの・・・数値データ” に…

 

《大規模言語モデル考察》 (37)     wpe7.jpg (10890 バイト)
                            タンパク質の構造    (/ネットより画像借用)

LLM/大規模言語モデル・・・とは?】 (27)


変換する必要があるかですね、」

「そうですね…」アンが、を開いた。「もちろん、それは、<分散表現> のためですが…

参考文献 の…

4番目論文記事/『■ タンパク質を語る言語 は、タンパク質アミノ酸配列を、言語

に見立てて、<大規模言語モデル> に…

 

《大規模言語モデル考察》 (38)    
                                    (/ネットより画像借用)

LLM/大規模言語モデル・・・とは?】 (28)


学習させ、立体構造機能予測に役立てる研究が、進んでいると言うものです。

<DNA/・・・DNA言語> は…

ご存知の様に、二重らせん構造を持ち、(アデニン)(チミン)(グアニン)(シトシ

ン)の、4種類塩基が並んだ…



 7月  22日

《大規模言語モデル考察》 (39)     
                             タンパク質の構造   (/ネットより画像借用)

LLM/大規模言語モデル・・・とは?】 (29)


塩基配列によって、遺伝情報記録されています。

複製される時に…

2重鎖は、1本鎖になるわけですが、この1本鎖文章構造と似ている、と言う事ですね。

でも、DNA言語解明はこれからですわ。これが読めるなら…

 

《大規模言語モデル考察》 (40)     
                                       (/ネットより画像借用)

LLM/大規模言語モデル・・・とは?】 (30)


機械学習ニューラルネットの、苦労も無いわけです。そして、私達/生命体内部

は、まさにそれが、実行されているのです。

ええ…

ノーベル化学賞受賞したハサビスの…

AlphaFold2(アルファフォールド2) では、そのタンパク質/・・・DNA(言語)解明

の、端緒に着いたという事…

 

《大規模言語モデル考察》 (41)      
               (/ネットより画像借用)    ◆ グーグル・デーブマインド           デミス・ハサビス

LLM/大規模言語モデル・・・とは?】 (31)


…でしょうか。この、 AlphaFold2> 背後には、膨大タンパク質研究蓄積/基

があるわけです。

ええと、つまり…

<1本鎖・DNAという、1本の文章/・・・DNA・2重螺旋(らせん)言語> を、アッサリと、

理解できるなら、何も <ベクトル表示の・・・分散表現> に…

 

《大規模言語モデル考察》 (42)   
                                (/ネットより画像借用)

LLM/大規模言語モデル・・・とは?】 (32)


変換するコトもないのです。

身の回りに溢れる、生命体/細胞/DNA言語は、それをアッサリクリアしているのです

から」

「はい、アン…」茜が、うなづいた。「有難うございます…

<分散表現> や、<Transfomer>

 

《大規模言語モデル考察》 (43)       
                                                    (/ネットより画像借用)

LLM/大規模言語モデル・・・とは?】 (33)


…を超えるシステムが、私達身体も含め、眼前に、溢れていると言うことですね。そして、

<Transfomer> は、ヒトの頭脳に近い情報処理能力を、展開していると言うことですね」

「うーん…」支折が、を揺らした。「まさに…

 

《大規模言語モデル考察》 (44)  wpe4F.jpg (12230 バイト)
     マンハッタン計画で製造された、原子爆弾。  『リトルボーイ』 上  、 『ファットマン』 下   (/ネットより画像借用)

LLM/大規模言語モデル・・・とは?】 (34)


<AI/・・・人工知能が・・・育てられている> 、言うことですね。

そして…

それが、かつての…

<★ 原爆製造の・・・マンハッタン計画/・・・核戦略時代の開闢(かいびゃく) の様に、

<★ 人類文明にとって・・・非常に有害であり・・・必要性のない・・・危険なモノ

に、なるかも知れない…



 7月  23日

《大規模言語モデル考察》 (45)    

LLM/大規模言語モデル・・・とは?】 (35)


ワケですかあ、」

「そうですねえ…」高杉が、の後ろに、を当てた。「人間が、幸福に生きるには…

<人間サイズ/・・・人間原理のサイズが・・・最適だ と、言う

コトです。

いわゆる…

<= 神 => は、人類文明社会に…

 

《大規模言語モデル考察》 (46) 
                                                       (/ネットより画像借用)

LLM/大規模言語モデル・・・とは?】 (36)


…そして人々に、そういう <敬虔(けいけん/・・・親や、神々に対する深い愛や尊敬、忠誠心を表す言葉。西

洋では、古代ギリシャ以降、徳目の一つとされ、キリスト教においては信心を表す用語として認識されています。また、「敬虔

な気持ち」 とは、人や物事を大切にし、心から尊敬している状態を指します。)な生き方/生活を・・・推奨>

して来た、わけです。

むろん…

現在も、宗教は、一定勢力を持っているわけですが、科学技術優勢ですね。ちなみに、

人間好奇心が…

 

《大規模言語モデル考察》 (47)  
                                                    (/ネットより画像借用)

LLM/大規模言語モデル・・・とは?】 (37)


この世界/この世を…

<物の領域と、心の領域の・・・2つに分割> し…また、<天動説> から <地動説>

に、大転換して

<文明の第1ステージ/・・・農耕 ・ 文明の曙の時代・・・> から、<文明の第2ステ

ージ/・・・エネルギー ・ 産業革命の時代> を、創出して来たわけです。

ところが、今/現在

<人類文明は・・・複数の面で・・・壮大な壁・・・> に…

 

《大規模言語モデル考察》 (48)    
                                       (/ネットより画像借用)

LLM/大規模言語モデル・・・とは?】 (38)


ブチ当たりはじめ、にわかに立ち往生している様相ですねえ。

物理科学に、限って言えば…

<物理学の・・・2本柱/・・・交わることのない、2本のレール・・・>

すなわち、一般相対性理論と、量子力学/・・・標準モデル が、一頓挫(いちとんざ/

・・・物事の進行 ・ 進展が、中途で一時、くじけること。)、している様相ですね。

これは…

具体的な、分かりやすい例を言えば、 暗黒物質が・・・

 

《大規模言語モデル考察》 (49)    
                                                    (/ネットより画像借用)

LLM/大規模言語モデル・・・とは?】 (39)


・・・依然として、特定できない・・・> という事です。

代表的な、<WIMP(Weakly interacting massive particle(WIMP・・・ 弱く相互作用する大質量粒子)とは、暗黒

物質の候補の1つ。仮説上の粒子。)、 <アクシオン(/暗黒物質の、有力な候補の1つ。理論上の素粒子。

 アクシオンは、太陽内部で生成される可能性があり、暗黒物質問題を解決するだけでなく、強い相互作用に関する深刻な

問題も解決することが期待されている。) も、“空振り” が、続いていますねえ。”三振” も、視野

入って来ています。

ここら辺りで…

綻び(ほころび)が、始まっている様相ですね。物理学は、現代社会大きな基盤ですが、この

2本柱が、揺れだしています。

現代物理学で…

暗黒物質が・・・補足できない・・・大問題・・・> は、20世紀初頭において…

 

《大規模言語モデル考察》 (50) 
                     宙を形成する、謎の超物質 「暗黒物質 (ダークマター) 」 とは?  (/ネットより画像借用)

LLM/大規模言語モデル・・・とは?】 (40)


ケルビン卿(/絶対温度の概念を確立した人物で、絶対温度の単位 「ケルビン(K) 、はケルビン卿の名前から取ら

れています。)指摘した、“黒体輻射の問題” と、“マイケルソン=モーレーの実験の問題” に、

相当して来るのかも知れません。

つまり、当時

それは、現実には、壮大ピント外れ、であり…

一般相対性理論量子力学 の、パラダイム…



 7月  24日

《大規模言語モデル考察》 (51)    
                                                    (/ネットより画像借用)

LLM/大規模言語モデル・・・とは?】 (41)


…シフト大津波が、科学技術文明リードして来た様に…です」

<AI 開発> も…」支折が言った。「その、<壮大な壁の・・・1つ> と、いう事でしょう

か?」

「うーむ…」高杉が、を傾げた。「まあ、望洋(ぼうよう/あまりに、広々としているために、見当のつかない

さま)としていますが、…

 

《大規模言語モデル考察》 (52)    wpe4F.jpg (12230 バイト)  

LLM/大規模言語モデル・・・とは?】 (42)


<別のトラブルを・・・惹起(じゃっき/事件や問題を、ひきおこすこと。) しているということで、

その壁を、感じます。

<基盤モデル> を、開発している…

<泰地真弘人たいじ・まことさん> が、言っていましたが、科学的・好奇心という意味では、

必然の流れなのでしょう。だから…

 

《大規模言語モデル考察》 (53)     
                                泰地真弘人(たいじ・まこと)    (/ネットより画像借用)

LLM/大規模言語モデル・・・とは?】 (43)


<基盤モデル> も、仮に、泰地さん開発ストップしたとしても、誰かがそれをやり、

結局流れそっちの方へ行くだけです。

しかし…

原爆開発の・・・マンハッタン計画> も、そうでしたが、その開発が、 人類文

明社会にとって・・・

 

《大規模言語モデル考察》 (54)  
                                                              (/ネットより画像借用)

LLM/大規模言語モデル・・・とは?】 (44)


・・・過ぎたる物/・・・扱いきれない不用物/・・・文明社会を破滅させるモノ・・・> に、

なりはしないか、という事ですねえ。

まあ…

<AI 開発> そのものは、既存パラダイムの中にあるモノです。しかし、現在

東の火薬庫・・・

 

《大規模言語モデル考察》 (55)    
 『バベルの塔・・・旧約聖書/創世記中に登場する巨大な塔』 神の逆鱗に触れた。 <AI> もか? (/ネットより画像借用)

LLM/大規模言語モデル・・・とは?】 (45)


・・・イスラエルが大暴走・・・> している様に、これも、 新たな・・・火種/巨大な

人類文明の壁/・・・大難題・・・> 1つに、カウントできるもの…でしょう」

厨川アンが、無言でうなづいた。

 

「ええ…」茜が、に…

 

《大規模言語モデル考察》 (56)  
                                                (/ネットより画像借用)

LLM/大規模言語モデル・・・とは?】 (46)


を当てた。「<分散表現> に、を戻しましょう…

何故

<単語を、ベクトルで表す・・・分散表現> に、するのかという事ですね。肝心問題

す。

ええ…

<★ AI による・・・チャット> を…

創出するに当たって、コンピューター・プログラムで、色々と、試してみたわけです。



 7月  25日

《大規模言語モデル考察》 (57)   
                                                (/ネットより画像借用)

LLM/大規模言語モデル・・・とは?】 (47)


<チャット・プログラムを作る・・・> には、どうしたら良いか?

これまで…

どんな事が試されて来てたのか。そして、どの様に、<★ AI エージェントが・・・視界に

入って来た> のか、です」

「はい…」支折が、神妙に、うなづいた。

「ええ…」茜が…

 

《大規模言語モデル考察》 (58) 
                                                         (/ネットより画像借用)

LLM/大規模言語モデル・・・とは?】 (48)


スクリーンボード画像を、拡大した。「ます…


① 人の会話パターンを、全てプログラムに書き込む方法


これは…

1番素朴な方法で、人が言いそうな言葉を、全て、コンピューター登録して置く方法です

ね。…

 

《大規模言語モデル考察》 (59)     wpe4F.jpg (12230 バイト)

LLM/大規模言語モデル・・・とは?】 (49)


…でも、これは、あまり賢くない方法で、ともかく膨大作業になります。


② 文法などのルールを、プログラムに書き込む方法


これは…

よりも、はるかに、多くの会話生成できそうですが、入力された内容に応じて、何を言

う…

 

《大規模言語モデル考察》 (60)     wpe4F.jpg (12230 バイト)

LLM/大規模言語モデル・・・とは?】 (50)


…かを、プログラムに、書き込んで置く必要があります。

ここでは…

<対話や、翻訳・・・質問の応答> など、言語を使った問題を、コンピューターに解かせ

る、<自然言語処理 という・・・研究分野が勃興(ぼっこう/にわかに勢力を得て盛んになること。)

していますわ。

でも、これらを、全て記述しようとすると、プログラムの量膨大になり、やはり、人力で頑

張る事に…

 

《大規模言語モデル考察》 (61)   wpe4F.jpg (12230 バイト) 

LLM/大規模言語モデル・・・とは?】 (51)


…なります


③ 質問と、答えの・・・相関関係を学ばせる方法


これは…

世の中にある、大量質問回答を集め、質問に対する答え方を、自力コンピュー

ターに、学ばせる方法です。

これは、<★ 機械学習の用語で・・・

 

《大規模言語モデル考察》 (62)     wpe4F.jpg (12230 バイト) 

LLM/大規模言語モデル・・・とは?】 (52)


・・・教師あり学習> と、呼ばれる方法ですね。

最も、分かりやすい例は、“翻訳” ですわ。日本語文章と、それに対応する英語文章

の組を、たくさん、覚えさせます。そして、日本語単語が、英語どの単語に、翻訳され

やすい


 7月  26日

《大規模言語モデル考察》 (63) 
                                                     (/ネットより画像借用)

LLM/大規模言語モデル・・・とは?】 (53)


…かを、学ばせます。<日本語と英語の・・・文字列の相関関係を・・・統計的に学ぶ>

ことに、なるわけですね。

<質問応答> についても…

<質問文と・・・回答文の・・・セット> があれ、同じ手法が使えるわけです」

「うーん…」支折が、テッペンに…

 

《大規模言語モデル考察》 (64)    
                                自作で、機械学習モデル・AIの使い方を学ぶ   (/ネットより画像借用)

LLM/大規模言語モデル・・・とは?】 (54)


を当てた。「それが、<機械学習 = machine learning> ですかあ…」

「そうです…」茜が言った。「<★ 機械学習の用語で・・・教師ありの学習・・・> に、

されますわ。

こうした、統計的手法は…

コンピューター性能が上がり、電子化された…

 

《大規模言語モデル考察》 (65) 
                            自然言語処理 = natural language processing   (/ネットより画像借用)

LLM/大規模言語モデル・・・とは?】 (55)


テキス・トデータ大量集まる様になった、1990年代から、盛ん <自然言語処理

 = natural language processing> で、使われる様になりました。

特に

翻訳にこれを用いた、<統計的 ・ 機械翻訳> は、グーグル翻訳サービス2016年

まで、使われていた…

 

《大規模言語モデル考察》 (66)     wpe4F.jpg (12230 バイト)

LLM/大規模言語モデル・・・とは?】 (56)


…様ですね」

「うーん…」支折が、を傾げた。「私も、お世話になった翻訳よねえ…」

「そうですね…」茜が、微笑を浮かべた。「様々シチュエーションsituation/状況。場面。

/境遇、局面。)で、お世話になった人は、多いはずです」

支折が…

 

《大規模言語モデル考察》 (67) 
                                 機械学習                      (/ネットより画像借用)

LLM/大規模言語モデル・・・とは?】 (57)


笑ってをやった。

「ただし…」茜が言った。「<★ 機械学習 = machine learning> は…

<★ 学習前に・・・具体的なタスクを1つ決めて・・・その正答率を最大にできる様に

・・・コンピューターを学習させるのが・・・基本・・・> です。

そのため…

 

《大規模言語モデル考察》 (68)    
                                                    (/ネットより画像借用)

LLM/大規模言語モデル・・・とは?】 (58)


この方法で、様々なタスクをこなす、<チャット・プログラムを・・・作るのは、難しかった

・・・> 様ですね、」

「うーん…」支折が言った。「翻訳どまりですか…」

「あ…」茜が言った。「それから…

“文字列の・・・相関関係を・・・統計的に・・・ 



 7月  27日

《大規模言語モデル考察》 (69)    
                                                    (/ネットより画像借用)

LLM/大規模言語モデル・・・とは?】 (59)


・・・学ぶ・・・この方法” では、<単語が持つ・・・同義性> が、問題になります」

<同義性> ですか…」支折が言った。

「そうです…」茜が言った。単語同義性とは…

例えば、“和服”“着物” のように、文字列上全く異なる…

 

《大規模言語モデル考察》 (70)    
                                和服/・・・男性          (/ネットより画像借用)

LLM/大規模言語モデル・・・とは?】 (60)


…語なのに、意味が、非常に似ている事を指します。コンピューターが、こうした同義性

ある表現を、全て別の言葉だとみなして、処理しようとすると、学習効率よく進まなくなり

ます。

これを回避するには、“同義語の・・・

 

《大規模言語モデル考察》 (71) 
                                AI ・エージェント      (/ネットより画像借用)

LLM/大規模言語モデル・・・とは?】 (61)


・・・リスト” を、あらかじめ用意する方法がありますが、結局それは、人力に頼った作業

なるわけです」

「うーん…」支折が、を傾げた。「それでは、<AI エージェント> 方向とは、ほど遠い

感じよねえ、」

 

《大規模言語モデル考察》 (72)         

【● 数字の組で・・・言葉の意味を表す 】 (1)


「ええ…」茜が、スクリーンボードコントローラーを取り上げた。「あ、ここですね…

ええと…

コンピューターに、独力言語処理させるなら、こうした “単語の・・・同義性” を、どう

にか、うまく記述して、教え込みたい所ですね」

 

《大規模言語モデル考察》 (73)   
                                                 (/ネットより画像借用)

【● 数字の組で・・・言葉の意味を表す 】 (2)


「はい…」支折が、うなづいた。「そうですね…」

「実は…」茜が言った。「その…

土台となるアイデアが、1954年発表されていました。言語学者ハリスZellig S.Harris

らが提唱した、分布仮説 です。

 

《大規模言語モデル考察》 (74)  wpe4F.jpg (12230 バイト)

【● 数字の組で・・・言葉の意味を表す 】 (3)


この 分布仮説 とは…

簡単に言うと、<意味の・・・似ている単語は・・・文中で、似た使われ方をする> とい

う、いわゆる、”作業仮説” なのです。

あ…

<作業仮説(さぎょう・かせつ)とは…

さらなる研究を行う、基盤とするために、暫定的(ざんていてき/急ごしらえ。間に合わせ。)に…



 7月  29日

《大規模言語モデル考察》 (75)     

● 数字の組で・・・言葉の意味を表す 】 (4)


…受け入れられる仮説のことです。最終的には仮説自身放棄されるとしても、仮説

たき台として、批判に耐えうる強固理論が生み出せることを期待して、こうした作業仮説

が、受け入れられていると言います。

 

《大規模言語モデル考察》 (76)  
     分散表現では、単語をベクトル化し・・・ベクトル同士の足し算は、意味の足し算になります  (/ネットより画像借用)

● 数字の組で・・・言葉の意味を表す 】 (5)


ええと…

ボード表示してあるのは…

英文の使用例を集めた・・・コーパス から、英語短文大量に集めて、幾つかの単

着目して、その周囲を調べたものす。

例えば…

ここにある、sodabeer といった語の…

 

《大規模言語モデル考察》 (77) 
                                                             (/ネットより画像借用)

● 数字の組で・・・言葉の意味を表す 】 (6)


周辺には、drinkbottle がよく登場します。car truck周辺には、godrive

が、よく登場します。

ええ…

ある単語単語が…

文中同時出現する事を、<・・・共起・・・> と言います。

この…

<単語の・・・

 

《大規模言語モデル考察》 (78)    
                                                    (/ネットより画像借用)

● 数字の組で・・・言葉の意味を表す 】 (7)


・・・共起関係・・・> をまとめた、この数表を、2次元平面グラフ上に、落とし込むと、

た意味の単語が、グラフ上近い場所に集まります…」


     

「”参考文献” と、同一の画像がネット上で見つからないので、それに近い画像を表示します。意味は

同じです。とりあえず、眺めておいてください。後で説明します…」

 

 

   

 
                                     (/ネットより画像借用)


「うーん…」支折が、ボンヤリグラフを眺めた。「そうですか…」

 

《大規模言語モデル考察》 (79)       

● 数字の組で・・・言葉の意味を表す 】 (8)


「つまり…」茜が言った。「<★ 分散表現> では…

文中のある、単語意味は、<周囲に・・・どんな単語が、並んでいるかを見れば・・・

分かる> と、いう事ですわ」

「ふーん…」支折が、アゴを傾げた。「言語学者というのは、こんな事も、研究しているわけ

ですかあ…」

 

《大規模言語モデル考察》 (80)             

● 数字の組で・・・言葉の意味を表す 】 (9)


「そうですね…」茜が言った。「言葉というモノの…

不思議さに気づき、本格的解明しようとした人達がいたわけです。こうした、歴史埋も

れていたような努力が、<チャット・プログラムの・・・創出・・・> に際し…


  

 7月  30日

《大規模言語モデル考察》 (81)    
                                          (/ネットより画像借用)

● 数字の組で・・・言葉の意味を表す 】 (10)


<言葉の本質/・・・言葉の構造> という事で、脚光をびた様ですね」

「うーむ…」高杉が、ボードグラフを眺めた。「初めて見るグラフですねえ…」

「ええと…」茜が、うなづいた。「この方法なら…

<単語の意味を・・・

 

《大規模言語モデル考察》 (82) 
                                     共起語とは?                      (/ネットより画像借用)

● 数字の組で・・・言葉の意味を表す 】 (11)


・・・周囲の単語との・・・共起関係のみで表現・・・> できますわ。

参考文献では…

縦軸に、<beer soda car truck> をとり

横軸に、<eat bottle cold drink go drive run> の、7つ単語をとっています。

 

《大規模言語モデル考察》 (83)         
                                                   (/ネットより画像借用)

● 数字の組で・・・言葉の意味を表す 】 (12)


つまり…

ここでは…

<★ car は、7次元の(7つの単語の)ベクトル・・・(横軸の順に、) 44、2、1、2、99、

46、14> で、記せばいいわけです。

同じく…

<★ Truckは、7次元のベクトル・・・32、0、2、0、102、67、15>

 

《大規模言語モデル考察》 (84)     

● 数字の組で・・・言葉の意味を表す 】 (13)


…で、表せます。

carTruck は…

字面(じづら)が違っても、似た意味を持っていることが、ベクトルの値で読み取れるわけです。

このベクトルは…

eat bottle cold drink go drive run  の、7つの単語との関係性に…

 

《大規模言語モデル考察》 (85)        

● 数字の組で・・・言葉の意味を表す 】 (14)


…よって、car truck という、単語意味表現しているわけですね。

つまり…

<単語の持つ意味が・・・7次元の成分に、分散して表現・・・> されている、わけです。

この事から、単語意味ベクトルで表すことを…

 

《大規模言語モデル考察》 (86)       

● 数字の組で・・・言葉の意味を表す 】 (15)


<★ 分散表現> と呼びます」

「うーん…」支折が言った。「単語は、この7つでなくても、いいわけかしら?」

「そうですね…」茜が言った。「複数の、ベクトルが取れればいいわけですから、そうだと思

います。

「”参考文献” と…

同一の画像がネット上で見つからないので、それに近いコーパスの画像を表示します。意

味は同じです。

<★ beer は・・・7次元のベクトル>

       =  have new drink bottle ride speed read の、単語からのベクトル・・・

     横軸の、<36、14、72、57、3、0、1> で、表せます。  

<★ wine は、7次元のベクトル>  =  <108、14、92、86、0、1、2> で表せま

     す。


主成分分析などの手法で、次元を圧縮すると、似た意味の語が近くに集まる・・・と

  いう事です。

 

 

   



「これはさあ…」支折が言った。「<ベクトル/・・・力と方向の矢印> では、ないけど…

私達には、矢印アナロジーAnalogy/・・・ある事柄をもとにして、他の事柄について推し量ること)の方が、

分かりやすいわよね?」

「そうですね…」茜が、うなづいた。「でも、最初に戻しますが、コンピューターには、

クトルは、この <7次元の数値の方が・・・扱いやすい> 様ですね。

私自身も、専門家ではないですので、参考文献 以上のことは、分かりません」

「はい…」支折が、コクリとうなづいた。



 7月  31日

《大規模言語モデル考察》 (87) 
                                 兄という単語の意味・・・      (/ネットより画像借用)

● 数字の組で・・・言葉の意味を表す 】 (16)


参考文献 には、これ以上の、詳しい説明はありません。

要するに…

<分散表現> を使えば、“和服”“着物” といった、単語文字列の並びとは独立

て、<単語の意味を・・・数値で表現> できるわけですわ。

 

《大規模言語モデル考察》 (88) 
                                     共起語とは?                      (/ネットより画像借用)

● 数字の組で・・・言葉の意味を表す 】 (17)


コンピューターに…

単語や、文章の持つ意味を扱わせるなら、文字列に縛(しば)られずに、意味をそのまま扱

える、”ベクトル形式” の方が、適していると言います」

「ふーむ…」高杉が、うなづいた。「そういう事ですか…

 

《大規模言語モデル考察》 (89)    
                                 <LLM/大規模言語モデル>   (/ネットより画像借用)

● 数字の組で・・・言葉の意味を表す 】 (18)


<LLM/大規模言語モデル> では、この <分散表現> が、取り入れられている、と

いうわけですね?」

「はい…」茜が、うなづいた。「そうです

【● 単語の意味を・・・足し算・引き算する】 (1)  wpe7.jpg (10890 バイト)

 

茜が、ノートパソコンからを上げた。…

 《大規模言語モデル考察》 (90)  
                                   Word2Vec 』                      (/ネットより画像借用)

【● 単語の意味を・・・足し算・引き算する】 (2)


…そして、スクリーンボードコントローラーを取り、モザイク画像1つ拡大した。

「ええ…」茜が言った。「を、進めましょう…

2013年に…

グーグルミコロフTomas Mikolovらが、発表した…

Word2Vec 』 は…

 

《大規模言語モデル考察》 (91)   
                                                      (/ネットより画像借用)

【● 単語の意味を・・・足し算・引き算する】 (3)


ニューラルネット(/機械学習の一種) を用いて、 単語の意味の・・・分散表現を、

生成するシステム> です。

先ほどの…

7次元ベクトルの例では、 個々の単語の、共起関係を・・・1個づつ調べて・・・数表

の形に整理・・・> したものですね。

一方…



  

  「イチロー」 - 「野球」 + 「サッカー」 = 「ロナウド」      (/ネットより画像借用)

 

《大規模言語モデル考察》 (92)  
                                                        (/ネットより画像借用)

【● 単語の意味を・・・足し算・引き算する】 (4)


Word2Vec の場合は…

<1度に、様々な単語のベクトルを・・・まとめて生成> できるシステムです。こちらの方

は、別の方法で、”単語の・・・共起関係” を、学び取ります。


 

訓練用のテキストから・・・

数単語のフレーズを・・・ランダムに抜き出し・・・前後の単語から・・・