MENU ボスの展望台ボスのTwitter物理学人工知能/ LLM・基盤モデルとは?
   AI/人工知能・・・の考察 (3) 

  
   LLM/大規模言語モデルの考察

           wpe4F.jpg (12230 バイト)
トップページNew Page WaveHot SpotMenu最新のアップロード   担当: ボス= 岡田 健吉

               

 2025年7月           上から ・・・下へ   
 7月  16日

《LLM/大規模言語モデルの考察》 (1~5)

【プロローグ】 (1~5)

“参考文献”

    日経サイエンス・・・2023/10     日経サイエンス・・・2025/02

     

日経サイエンス・・・2023/10

<特集>

  = 大規模言語モデル/ 科学を変える AI =

  ■ オウム以上フクロウ未満?/生成AI の“思考力”

    <生成AI は事前に教えていないことを、どういうわけか、理解している様だ。

      いったい何故なのか?研究者は理解に苦しんでいる。>

                                 G.マッサー(SCIENTIFIC AMERICAN 編集部)


  ■ 大規模言語モデルとは何か

    <ChatGPT で一躍有名になったこの AI は、一体、どこからやって来て、どこ

      へ向かうのだろう。>

                                                 出村政彬(編集部)



  ■ 脳とAI 溶ける境界/大規模言語モデルが開く、脳の理解

     <脳の中で、異なる種類の情報はどの様に統合されるのか。この長年の未解

      決問題に、大規模言語モデルが新たな光を当てている。>

                                     平理一郎(東京医科歯科大学)

                                     丸山隆一(科学技術振興機構研究開)


  ■ タンパク質を語る言語

    <AI は、便利な実験ツールにとどまらず、生命現象を俯瞰する新たな視点を

     提供しつつある。>

                                                 出村政彬(編集部)

 

《大規模言語モデルの考察》 (6)         

【プロローグ】 (6)
                          

「はい、ええ…」秋月茜が、一礼して、椅子に掛けた。「さっそく、始めましょう…

同じメンバーで、考察して行きます。皆さん、よろしくお願いします。

今回は…

猛暑季節でもあり…

 

《大規模言語モデルの考察》 (7)     wpe4F.jpg (12230 バイト)

【プロローグ】 (7)

羽衣弥生さんクラブ・須弥山 から、飲物フルーツも、取り寄せたいと思っていま

す。

さあ…

2025・・・参議院選挙> も…

現在最終盤になっていますね。《危機管理センター》 で、里中響子さんが、見守って

ます。それから…

 

《大規模言語モデルの考察》 (8)      

【プロローグ】 (8)


《My Weekly Journal》/編集長/津田真さんも、一緒に、注視しています。

今回は…

当/《HomePage/人間ん理空間》 では…

<東京都/・・・山尾しおり(さん)を、推奨しています。実力派であり、必ず

活躍する人材です。よろしくお願いします 

 

        

                          (/ネットより画像借用)


 7月  17日

《LLM/大規模言語モデルの考察》 (9)         

【プロローグ】 (9)


ええと…

あ、折原マチコさんと、ポンちゃんが、さっそく、飲物フルーツを運んで来てくれています

ね、」

マチコポン助が、それらをワゴンから軽食テーブルの方に移していた。フルーツジュース

に、スライスしたスイカは、小皿に…

 

《LLM/大規模言語モデルの考察》 (10)       

【プロローグ】 (10)


…盛り分けてあった。

マチコさん…」茜が言った。「お久しぶりです!

うん!」マチコが言った。「このスイカ美味しいわよ! 熊本産だと言っていたわねえ、」

「そうですか…」茜が、満面で微笑んだ。

他のみんなも、軽食テーブルの方に集まって来た。

 

《大規模言語モデルの考察》 (11)

【● LLM/大規模言語モデルとは?】 (1)


     


「さあ…」茜が、準備したスクリーンボードを眺めた。「さっそく、本題に入ります…

参考文献 にある…

4本論文記事掲載しましたが、難しい内容

 

《大規模言語モデルの考察》 (12)       
                                             (/ネットより画像借用)

● LLM/大規模言語モデル・・・とは?】 (2)


…なので、最も分かりやすい所から、入って行きましょう。つまり、論文の順序が違います

が、まず2番目論文記事/大規模言語モデルとは・・・何か?」 から、入る事にしま

す。そして、まさにこれが、このページ本題でもあるわけですね。

 

《大規模言語モデル考察》 (13)    
                                         (/ネットより画像借用)

LLM/大規模言語モデル・・・とは?】 (3)


ええと…

<LLM = Large Language Models/大規模言語モデル> とは…

簡単に言えば…

<ChatGPTの・・・内部で動いている・・・AI のコト・・・> ですね、」

「はい…」高杉が、うなづき、参考文献 を落とした。「ええ…

 

《大規模言語モデルの考察》 (14)    
                                                (/ネットより画像借用)

● LLM/大規模言語モデル・・・とは?】 (4)


<米・オープンAI (社)提供する…

<ChatGPT> の中では、2023年8月現在の、時点ですが…

<GPT-3.5/・・・有料版では、GPT-4> という、<大規模言語モデル> が、動い

ています。

データが、少々古いのは…

参考文献が…



 7月  18日

《大規模言語モデル考察》 (15)   
                                                (/ネットより画像借用)

LLM/大規模言語モデル・・・とは?】 (5)


2023年10月モノだからです。私達は、まず、<大規模言語モデル> 開闢(かい

びゃく)時点から、その基盤技術と、“人間の理解を超える・・・奇妙な謎の発火・・・” を、考察

して行こうと、考えています」

そういう意味では…

 

《大規模言語モデル考察》 (16)  wpe4F.jpg (12230 バイト)  
                                            (/ネットより画像借用)

LLM/大規模言語モデル・・・とは?】 (6)


…」支折が言った。「古いデータというコトでは、ないわけですね?」

「まあ…」高杉が、を崩した。「10年後に振り返れば、まさに、“当初から” と言えるでしょ

う。

<LLM/=大規模言語モデル> は…

<オープンAI (社) 以外

 

《大規模言語モデル考察》 (17)        

LLM/大規模言語モデル・・・とは?】 (7)


…にも、<グーグル> や、<マイクロソフト> <メタ> <アマゾン> といった、

名 IT 企業が、ここ数年で、それぞれリリースしています。<オープンAI(社)の・・・

ChatGPT> 登場以後は、さらに動きが加速しています」

「うーん…」支折が…

 

《大規模言語モデル考察》 (18)    wpe4F.jpg (12230 バイト)
                                              (/ネットより画像借用)

LLM/大規模言語モデル・・・とは?】 (8)


…うなづいた。「それは、最近ニュースなどで、チラホラ聞こえて来るわねえ。私達も、ま

さに、そうした時代の、渦中にあるという事ですね?」

「そうです…」高杉が、参考文献 を取り上げた。「さて…

 

 

《大規模言語モデル考察》 (19)  
                                                (/ネットより画像借用)

LLM/大規模言語モデル・・・とは?】 (9)


<● この、AI の仕組み・・・LLM/大規模言語モデル・・・>
は、

ある意味で、シンプルだと言います。


 

<LLM/大規模言語モデル> は・・・

まず、あらかじめ、膨大なテキストを取り込むのです。そして、そこから、知識を学習

して・・・

 

《大規模言語モデル考察》 (20)  
                                       (/ネットより画像借用)

LLM/大規模言語モデル・・・とは?】 (10)


・・・ニューラルネットワークの中に、蓄えるわけです。この知識を利用して、言語に関

する様々なタスクを解きます。

特に・・・

<GPT> の場合は、利用者が入力文の形式を変えるだけで、幅広いタスクをこなせ

る様です。


  
                                      (/ネットより画像借用)



 7月  19日

《大規模言語モデル考察》 (21)   wpe7.jpg (10890 バイト)
                                             (/ネットより画像借用)

LLM/大規模言語モデル・・・とは?】 (11)


<ChatGPT> に、どんな文章を入力するのが、効果的かを指南する書籍も、数多く

出版されている・・・

 


…と、いう事ですねえ、」

「はい…」茜が、うなづいた。「ええ…

<GPTを・・・ベースにした、システム・・・> も …

 

《大規模言語モデル考察》 (22)   
                                        (/ネットより画像借用)

LLM/大規模言語モデル・・・とは?】 (12)


リリースされています。

<大量の医学論文を学習した・・・大規模言語モデルの・・・  BioGPT  > や、

<日常会話で使う・・・普通の言葉を・・・プログラムの、ソースコードに変換する・・・

Codex  >

…など、ですね。

さらに…

 

《大規模言語モデル考察》 (23)   
                                       (/ネットより画像借用)

LLM/大規模言語モデル・・・とは?】 (13)


今年/2023年7月には…

<ChatGPT の・・・有料版> に、 Code Interpreter > という、新機能追加

されたと、言っています。

この機能は、 表形式の・・・数値データの入ったファイルを・・・入力 して、調べた

い項目を…

 

《大規模言語モデル考察》 (24)    
                                         (/ネットより画像借用)

LLM/大規模言語モデル・・・とは?】 (14)


普通の言葉で、入力するものです。

これだけで…

“データ解析のための・・・プログラムを生成し・・・自動で、統計解析をしてくれる” と、いう

ものですね」

「うーん…」支折が言った。「<表形式の・・・数値データファイル> を、入れて

 

《大規模言語モデル考察》 (25)   wpe4F.jpg (12230 バイト)
                            ヒューマノイド・ロボット    (/ネットより画像借用)

LLM/大規模言語モデル・・・とは?】 (15)


置くわけですね。後は、普通の言葉質問すれば、いいわけですか。

これが、ええと…

日常会話で使う、普通の言葉を・・・プログラムの、ソースコードに変換する・・・

Codex >

…なのですね?」

「はい…」茜が…

 

《大規模言語モデル考察》 (26)   
                                                     (/ネットより画像借用)

LLM/大規模言語モデル・・・とは?】 (16)


…うなづいた。「こうした、現状というのは…

<★ この AI/・・・大規模言語モデルが・・・単なる、便利な、お喋り(おしゃべり)アシス

タント・・・> 領域を、超えている、という事です。”言葉そのものを・・・本質的に理解し

ている様な・・・印象・・・” と、いう事ですわ」

「そうよねえ…」支折が…



 7月  20日

《大規模言語モデル考察》 (27)  wpe4F.jpg (12230 バイト)
                                                (/ネットより画像借用)

LLM/大規模言語モデル・・・とは?】 (17)


を傾げた。「でも…

“いきなり・・・テキストから・・・知識を学習する” と、言われても、<LLM/大規模言語モ

デル> 内部で、何をしているのかは、いまいち、ピンと来ないわねえ…」

「そうですね…」茜が、小さく

 

《大規模言語モデル考察》 (28)  
                                            (/ネットより画像借用)

LLM/大規模言語モデル・・・とは?】 (18)


…うなづいた。「<この AI/・・・大規模言語モデル> のことを、知ろうとすればするほ

ど、まるで雲をつかもうとしている様な、感覚になります。

一体、<大規模言語モデル> では、言語を、どの様把握しているのでしょうか。

 

《大規模言語モデル考察》 (29)  
                                          (/ネットより画像借用)

LLM/大規模言語モデル・・・とは?】 (19)


ええと…

この、参考文献 の中の、論文記事/『■ 大規模言語モデルとは何か では、この

を、真正面から取り上げています。

<大規模言語モデル> を、理解する上で、キーワードとなるのが…


1/★ 分散表現・・・単語の意味を・・・ベクトルで表す
と…

 

《大規模言語モデル考察》 (30)  
                                                     (/ネットより画像借用)

LLM/大規模言語モデル・・・とは?】 (20)


2/★ Transfomer (トランスフォーマー) という・・・ニューラルネット

…の、2つですわ」

「うーん…」支折が言った。「<Transfomer> という、言葉は…

これまで、何度も聞いているわねえ。意味を調べると、”何かを・・・

 

《大規模言語モデル考察》 (31)     wpe7.jpg (10890 バイト)
                                   
玩具/トランスフォーマー    (/ネットより画像借用)

LLM/大規模言語モデル・・・とは?】 (21)


・・・別のものに変えるもの・・・” という、ことですよね。

例えば…

変圧器(/電気回路の電圧を変える装置)や、ロボット変形する玩具/トランスフォーマー』  な

どが、該当するとか。これは、<AI/・・・ニューラルネット> なのですね。

 

《大規模言語モデル考察》 (32)   wpe4F.jpg (12230 バイト)

LLM/大規模言語モデル・・・とは?】 (22)


うーん…

<★ 単語の意味を・・・ベクトルで表す・・・分散表現> とは、どういうもの、かしら?」

「はい…」茜が、うなづき、スクリーンボードに、を投げた。「そもそも…

コンピューターで、単語意味をとらえるには、<★ 複数の・・・


  

 7月  21日
              海の日

《大規模言語モデル考察》 (33)     

LLM/大規模言語モデル・・・とは?】 (23)


・・・数値からなる・・・ベクトルで意味を表す・・・分散表現> が、適しているのです。つ

まり、ボードに書いてある様に…


  <LLM/大規模言語モデル>

    =

  <ベクトルで、単語の意味を表す・・・分散表現>

    

  <広く、深く・・・データの特徴を学ぶ・・・Transfomer

 

《大規模言語モデル考察》 (34) 
                                                     (/ネットより画像借用)

LLM/大規模言語モデル・・・とは?】 (24)


…が、中核になる、という事ですね。

そして…

<この AI/・・・大規模言語モデル> は、言語自然現象複雑システムを、<丸

ごと受け止められる点で・・・ヒトの脳と、よく似た情報処理・・・> を…

 

《大規模言語モデル考察》 (35)  wpe4F.jpg (12230 バイト)
                                                (/ネットより画像借用)

LLM/大規模言語モデル・・・とは?】 (25)


…行っている、という事です。

さあ…

そこで、まず…

<単語の意味を、ベクトルで表す・・・★ 分散表現について、説明して行きましょう

か。<広く、深く、データの特徴を学ぶ・・・★ Transfomerについては、その後で、

考察します。

とりあえず…

<分散表現> という言葉を、ネットで調べてみました。以下のような、説明になっていま

す…

 

<分散表現>

単語の意味を・・・低次元の実数値ベクトルで・・・表現する手法

分散表現とは、単語意味低次元実数値ベクトル表現する手法です。 これにより、

単語同士距離位置関係から意味を捉えることが可能になります。

具体的には、単語を  ”少ない数の・・・要素で構成された・・・ベクトルに変換” し、これを用

いて、単語の様々な側面表現します。

分散表現は、単語埋め込み(Word Embedding)とも呼ばれ、自然言語処理分野広く利

されています。

 

   

                                                         (/ネットより画像借用)

 

 
…というものですが、どうも、素人にはチンプンカンプンですね。

ともかく…

ここは、”参考文献” に沿って、説明して行きましょうか」

「はい…」支折が…

 

《大規模言語モデル考察》 (36)   wpe4F.jpg (12230 バイト)
                                         (/ネットより画像借用)

LLM/大規模言語モデル・・・とは?】 (26)


…うなづいた。「ベクトルは、“力と方向の・・・矢印” よねえ。それだけで、単語が表される

のかしら?」

「はい…」茜が言った。「ええと…

そもそも…

”単語が並んだ、文字列データである・・・文章” を、なぜ、”ベクトルの・・・数値データ” に…

 

《大規模言語モデル考察》 (37)     wpe7.jpg (10890 バイト)
                            タンパク質の構造    (/ネットより画像借用)

LLM/大規模言語モデル・・・とは?】 (27)


変換する必要があるかですね、」

「そうですね…」アンが、を開いた。「もちろん、それは、<分散表現> のためですが…

参考文献 の…

4番目論文記事/『■ タンパク質を語る言語 は、タンパク質アミノ酸配列を、言語

に見立てて、<大規模言語モデル> に…

 

《大規模言語モデル考察》 (38)    
                                    (/ネットより画像借用)

LLM/大規模言語モデル・・・とは?】 (28)


学習させ、立体構造機能予測に役立てる研究が、進んでいると言うものです。

<DNA/・・・DNA言語> は…

ご存知の様に、二重らせん構造を持ち、(アデニン)(チミン)(グアニン)(シトシ

ン)の、4種類塩基が並んだ…



 7月  22日

《大規模言語モデル考察》 (39)     
                             タンパク質の構造   (/ネットより画像借用)

LLM/大規模言語モデル・・・とは?】 (29)


塩基配列によって、遺伝情報記録されています。

複製される時に…

2重鎖は、1本鎖になるわけですが、この1本鎖文章構造と似ている、と言う事ですね。

でも、DNA言語解明はこれからですわ。これが読めるなら…

 

《大規模言語モデル考察》 (40)     
                                       (/ネットより画像借用)

LLM/大規模言語モデル・・・とは?】 (30)


機械学習ニューラルネットの、苦労も無いわけです。そして、私達/生命体内部

は、まさにそれが、実行されているのです。

ええ…

ノーベル化学賞受賞したハサビスの…

AlphaFold2(アルファフォールド2) では、そのタンパク質/・・・DNA(言語)解明

の、端緒に着いたという事…

 

《大規模言語モデル考察》 (41)      
               (/ネットより画像借用)    ◆ グーグル・デーブマインド           デミス・ハサビス

LLM/大規模言語モデル・・・とは?】 (31)


…でしょうか。この、 AlphaFold2> 背後には、膨大タンパク質研究蓄積/基

があるわけです。

ええと、つまり…

<1本鎖・DNAという、1本の文章/・・・DNA・2重螺旋(らせん)言語> を、アッサリと、

理解できるなら、何も <ベクトル表示の・・・分散表現> に…

 

《大規模言語モデル考察》 (42)   
                                (/ネットより画像借用)

LLM/大規模言語モデル・・・とは?】 (32)


変換するコトもないのです。

身の回りに溢れる、生命体/細胞/DNA言語は、それをアッサリクリアしているのです

から」

「はい、アン…」茜が、うなづいた。「有難うございます…

<分散表現> や、<Transfomer>

 

《大規模言語モデル考察》 (43)       
                                                    (/ネットより画像借用)

LLM/大規模言語モデル・・・とは?】 (33)


…を超えるシステムが、私達身体も含め、眼前に、溢れていると言うことですね。そして、

<Transfomer> は、ヒトの頭脳に近い情報処理能力を、展開していると言うことですね」

「うーん…」支折が、を揺らした。「まさに…

 

《大規模言語モデル考察》 (44)  wpe4F.jpg (12230 バイト)
     マンハッタン計画で製造された、原子爆弾。  『リトルボーイ』 上  、 『ファットマン』 下   (/ネットより画像借用)

LLM/大規模言語モデル・・・とは?】 (34)


<AI/・・・人工知能が・・・育てられている> 、言うことですね。

そして…

それが、かつての…

<★ 原爆製造の・・・マンハッタン計画/・・・核戦略時代の開闢(かいびゃく) の様に、

<★ 人類文明にとって・・・非常に有害であり・・・必要性のない・・・危険なモノ

に、なるかも知れない…



 7月  23日

《大規模言語モデル考察》 (45)    

LLM/大規模言語モデル・・・とは?】 (35)


ワケですかあ、」

「そうですねえ…」高杉が、の後ろに、を当てた。「人間が、幸福に生きるには…

<人間サイズ/・・・人間原理のサイズが・・・最適だ と、言う

コトです。

いわゆる…

<= 神 => は、人類文明社会に…

 

《大規模言語モデル考察》 (46) 
                                                       (/ネットより画像借用)

LLM/大規模言語モデル・・・とは?】 (36)


…そして人々に、そういう <敬虔(けいけん/・・・親や、神々に対する深い愛や尊敬、忠誠心を表す言葉。西

洋では、古代ギリシャ以降、徳目の一つとされ、キリスト教においては信心を表す用語として認識されています。また、「敬虔

な気持ち」 とは、人や物事を大切にし、心から尊敬している状態を指します。)な生き方/生活を・・・推奨>

して来た、わけです。

むろん…

現在も、宗教は、一定勢力を持っているわけですが、科学技術優勢ですね。ちなみに、

人間好奇心が…

 

《大規模言語モデル考察》 (47)  
                                                    (/ネットより画像借用)

LLM/大規模言語モデル・・・とは?】 (37)


この世界/この世を…

<物の領域と、心の領域の・・・2つに分割> し…また、<天動説> から <地動説>

に、大転換して

<文明の第1ステージ/・・・農耕 ・ 文明の曙の時代・・・> から、<文明の第2ステ

ージ/・・・エネルギー ・ 産業革命の時代> を、創出して来たわけです。

ところが、今/現在

<人類文明は・・・複数の面で・・・壮大な壁・・・> に…

 

《大規模言語モデル考察》 (48)    
                                       (/ネットより画像借用)

LLM/大規模言語モデル・・・とは?】 (38)


ブチ当たりはじめ、にわかに立ち往生している様相ですねえ。

物理科学に、限って言えば…

<物理学の・・・2本柱/・・・交わることのない、2本のレール・・・>

すなわち、一般相対性理論と、量子力学/・・・標準モデル が、一頓挫(いちとんざ/

・・・物事の進行 ・ 進展が、中途で一時、くじけること。)、している様相ですね。

これは…

具体的な、分かりやすい例を言えば、 暗黒物質が・・・

 

《大規模言語モデル考察》 (49)    
                                                    (/ネットより画像借用)

LLM/大規模言語モデル・・・とは?】 (39)


・・・依然として、特定できない・・・> という事です。

代表的な、<WIMP(Weakly interacting massive particle(WIMP・・・ 弱く相互作用する大質量粒子)とは、暗黒

物質の候補の1つ。仮説上の粒子。)、 <アクシオン(/暗黒物質の、有力な候補の1つ。理論上の素粒子。

 アクシオンは、太陽内部で生成される可能性があり、暗黒物質問題を解決するだけでなく、強い相互作用に関する深刻な

問題も解決することが期待されている。) も、“空振り” が、続いていますねえ。”三振” も、視野

入って来ています。

ここら辺りで…

綻び(ほころび)が、始まっている様相ですね。物理学は、現代社会大きな基盤ですが、この

2本柱が、揺れだしています。

現代物理学で…

暗黒物質が・・・補足できない・・・大問題・・・> は、20世紀初頭において…

 

《大規模言語モデル考察》 (50) 
                     宙を形成する、謎の超物質 「暗黒物質 (ダークマター) 」 とは?  (/ネットより画像借用)

LLM/大規模言語モデル・・・とは?】 (40)


ケルビン卿(/絶対温度の概念を確立した人物で、絶対温度の単位 「ケルビン(K) 、はケルビン卿の名前から取ら

れています。)指摘した、“黒体輻射の問題” と、“マイケルソン=モーレーの実験の問題” に、

相当して来るのかも知れません。

つまり、当時

それは、現実には、壮大ピント外れ、であり…

一般相対性理論量子力学 の、パラダイム…



 7月  24日

《大規模言語モデル考察》 (51)    
                                                    (/ネットより画像借用)

LLM/大規模言語モデル・・・とは?】 (41)


…シフト大津波が、科学技術文明リードして来た様に…です」

<AI 開発> も…」支折が言った。「その、<壮大な壁の・・・1つ> と、いう事でしょう

か?」

「うーむ…」高杉が、を傾げた。「まあ、望洋(ぼうよう/あまりに、広々としているために、見当のつかない

さま)としていますが、…

 

《大規模言語モデル考察》 (52)    wpe4F.jpg (12230 バイト)  

LLM/大規模言語モデル・・・とは?】 (42)


<別のトラブルを・・・惹起(じゃっき/事件や問題を、ひきおこすこと。) しているということで、

その壁を、感じます。

<基盤モデル> を、開発している…

<泰地真弘人たいじ・まことさん> が、言っていましたが、科学的・好奇心という意味では、

必然の流れなのでしょう。だから…

 

《大規模言語モデル考察》 (53)     
                                泰地真弘人(たいじ・まこと)    (/ネットより画像借用)

LLM/大規模言語モデル・・・とは?】 (43)


<基盤モデル> も、仮に、泰地さん開発ストップしたとしても、誰かがそれをやり、

結局流れそっちの方へ行くだけです。

しかし…

原爆開発の・・・マンハッタン計画> も、そうでしたが、その開発が、 人類文

明社会にとって・・・

 

《大規模言語モデル考察》 (54)  
                                                              (/ネットより画像借用)

LLM/大規模言語モデル・・・とは?】 (44)


・・・過ぎたる物/・・・扱いきれない不用物/・・・文明社会を破滅させるモノ・・・> に、

なりはしないか、という事ですねえ。

まあ…

<AI 開発> そのものは、既存パラダイムの中にあるモノです。しかし、現在

東の火薬庫・・・

 

《大規模言語モデル考察》 (55)    
 『バベルの塔・・・旧約聖書/創世記中に登場する巨大な塔』 神の逆鱗に触れた。 <AI> もか? (/ネットより画像借用)

LLM/大規模言語モデル・・・とは?】 (45)


・・・イスラエルが大暴走・・・> している様に、これも、 新たな・・・火種/巨大な

人類文明の壁/・・・大難題・・・> 1つに、カウントできるもの…でしょう」

厨川アンが、無言でうなづいた。

 

「ええ…」茜が、に…

 

《大規模言語モデル考察》 (56)  
                                                (/ネットより画像借用)

LLM/大規模言語モデル・・・とは?】 (46)


を当てた。「<分散表現> に、を戻しましょう…

何故

<単語を、ベクトルで表す・・・分散表現> に、するのかという事ですね。肝心問題

す。

ええ…

<★ AI による・・・チャット> を…

創出するに当たって、コンピューター・プログラムで、色々と、試してみたわけです。



 7月  25日

《大規模言語モデル考察》 (57)   
                                                (/ネットより画像借用)

LLM/大規模言語モデル・・・とは?】 (47)


<チャット・プログラムを作る・・・> には、どうしたら良いか?

これまで…

どんな事が試されて来てたのか。そして、どの様に、<★ AI エージェントが・・・視界に

入って来た> のか、です」

「はい…」支折が、神妙に、うなづいた。

「ええ…」茜が…

 

《大規模言語モデル考察》 (58) 
                                                         (/ネットより画像借用)

LLM/大規模言語モデル・・・とは?】 (48)


スクリーンボード画像を、拡大した。「ます…


① 人の会話パターンを、全てプログラムに書き込む方法


これは…

1番素朴な方法で、人が言いそうな言葉を、全て、コンピューター登録して置く方法です

ね。…

 

《大規模言語モデル考察》 (59)     wpe4F.jpg (12230 バイト)

LLM/大規模言語モデル・・・とは?】 (49)


…でも、これは、あまり賢くない方法で、ともかく膨大作業になります。


② 文法などのルールを、プログラムに書き込む方法


これは…

よりも、はるかに、多くの会話生成できそうですが、入力された内容に応じて、何を言

う…

 

《大規模言語モデル考察》 (60)     wpe4F.jpg (12230 バイト)

LLM/大規模言語モデル・・・とは?】 (50)


…かを、プログラムに、書き込んで置く必要があります。

ここでは…

<対話や、翻訳・・・質問の応答> など、言語を使った問題を、コンピューターに解かせ

る、<自然言語処理 という・・・研究分野が勃興(ぼっこう/にわかに勢力を得て盛んになること。)

していますわ。

でも、これらを、全て記述しようとすると、プログラムの量膨大になり、やはり、人力で頑

張る事に…

 

《大規模言語モデル考察》 (61)   wpe4F.jpg (12230 バイト) 

LLM/大規模言語モデル・・・とは?】 (51)


…なります


③ 質問と、答えの・・・相関関係を学ばせる方法


これは…

世の中にある、大量質問回答を集め、質問に対する答え方を、自力コンピュー

ターに、学ばせる方法です。

これは、<★ 機械学習の用語で・・・

 

《大規模言語モデル考察》 (62)     wpe4F.jpg (12230 バイト) 

LLM/大規模言語モデル・・・とは?】 (52)


・・・教師あり学習> と、呼ばれる方法ですね。

最も、分かりやすい例は、“翻訳” ですわ。日本語文章と、それに対応する英語文章

の組を、たくさん、覚えさせます。そして、日本語単語が、英語どの単語に、翻訳され

やすい


 7月  26日

《大規模言語モデル考察》 (63) 
                                                     (/ネットより画像借用)

LLM/大規模言語モデル・・・とは?】 (53)


…かを、学ばせます。<日本語と英語の・・・文字列の相関関係を・・・統計的に学ぶ>

ことに、なるわけですね。

<質問応答> についても…

<質問文と・・・回答文の・・・セット> があれ、同じ手法が使えるわけです」

「うーん…」支折が、テッペンに…

 

《大規模言語モデル考察》 (64)    
                                自作で、機械学習モデル・AIの使い方を学ぶ   (/ネットより画像借用)

LLM/大規模言語モデル・・・とは?】 (54)


を当てた。「それが、<機械学習 = machine learning> ですかあ…」

「そうです…」茜が言った。「<★ 機械学習の用語で・・・教師ありの学習・・・> に、

されますわ。

こうした、統計的手法は…

コンピューター性能が上がり、電子化された…

 

《大規模言語モデル考察》 (65) 
                            自然言語処理 = natural language processing   (/ネットより画像借用)

LLM/大規模言語モデル・・・とは?】 (55)


テキス・トデータ大量集まる様になった、1990年代から、盛ん <自然言語処理

 = natural language processing> で、使われる様になりました。

特に

翻訳にこれを用いた、<統計的 ・ 機械翻訳> は、グーグル翻訳サービス2016年

まで、使われていた…

 

《大規模言語モデル考察》 (66)     wpe4F.jpg (12230 バイト)

LLM/大規模言語モデル・・・とは?】 (56)


…様ですね」

「うーん…」支折が、を傾げた。「私も、お世話になった翻訳よねえ…」

「そうですね…」茜が、微笑を浮かべた。「様々シチュエーションsituation/状況。場面。

/境遇、局面。)で、お世話になった人は、多いはずです」

支折が…

 

《大規模言語モデル考察》 (67) 
                                 機械学習                      (/ネットより画像借用)

LLM/大規模言語モデル・・・とは?】 (57)


笑ってをやった。

「ただし…」茜が言った。「<★ 機械学習 = machine learning> は…

<★ 学習前に・・・具体的なタスクを1つ決めて・・・その正答率を最大にできる様に

・・・コンピューターを学習させるのが・・・基本・・・> です。

そのため…

 

《大規模言語モデル考察》 (68)    
                                                    (/ネットより画像借用)

LLM/大規模言語モデル・・・とは?】 (58)


この方法で、様々なタスクをこなす、<チャット・プログラムを・・・作るのは、難しかった

・・・> 様ですね、」

「うーん…」支折が言った。「翻訳どまりですか…」

「あ…」茜が言った。「それから…

“文字列の・・・相関関係を・・・統計的に・・・ 



 7月  27日

《大規模言語モデル考察》 (69)    
                                                    (/ネットより画像借用)

LLM/大規模言語モデル・・・とは?】 (59)


・・・学ぶ・・・この方法” では、<単語が持つ・・・同義性> が、問題になります」

<同義性> ですか…」支折が言った。

「そうです…」茜が言った。単語同義性とは…

例えば、“和服”“着物” のように、文字列上全く異なる…

 

《大規模言語モデル考察》 (70)    
                                和服/・・・男性          (/ネットより画像借用)

LLM/大規模言語モデル・・・とは?】 (60)


…語なのに、意味が、非常に似ている事を指します。コンピューターが、こうした同義性

ある表現を、全て別の言葉だとみなして、処理しようとすると、学習効率よく進まなくなり

ます。

これを回避するには、“同義語の・・・

 

《大規模言語モデル考察》 (71) 
                                AI ・エージェント      (/ネットより画像借用)

LLM/大規模言語モデル・・・とは?】 (61)


・・・リスト” を、あらかじめ用意する方法がありますが、結局それは、人力に頼った作業

なるわけです」

「うーん…」支折が、を傾げた。「それでは、<AI エージェント> 方向とは、ほど遠い

感じよねえ、」

 

《大規模言語モデル考察》 (72)         

【● 数字の組で・・・言葉の意味を表す 】 (1)


「ええ…」茜が、スクリーンボードコントローラーを取り上げた。「あ、ここですね…

ええと…

コンピューターに、独力言語処理させるなら、こうした “単語の・・・同義性” を、どう

にか、うまく記述して、教え込みたい所ですね」

 

《大規模言語モデル考察》 (73)   
                                                 (/ネットより画像借用)

【● 数字の組で・・・言葉の意味を表す 】 (2)


「はい…」支折が、うなづいた。「そうですね…」

「実は…」茜が言った。「その…

土台となるアイデアが、1954年発表されていました。言語学者ハリスZellig S.Harris

らが提唱した、分布仮説 です。

 

《大規模言語モデル考察》 (74)  wpe4F.jpg (12230 バイト)

【● 数字の組で・・・言葉の意味を表す 】 (3)


この 分布仮説 とは…

簡単に言うと、<意味の・・・似ている単語は・・・文中で、似た使われ方をする> とい

う、いわゆる、”作業仮説” なのです。

あ…

<作業仮説(さぎょう・かせつ)とは…

さらなる研究を行う、基盤とするために、暫定的(ざんていてき/急ごしらえ。間に合わせ。)に…



 7月  29日

《大規模言語モデル考察》 (75)     

● 数字の組で・・・言葉の意味を表す 】 (4)


…受け入れられる仮説のことです。最終的には仮説自身放棄されるとしても、仮説

たき台として、批判に耐えうる強固理論が生み出せることを期待して、こうした作業仮説

が、受け入れられていると言います。

 

《大規模言語モデル考察》 (76)  
     分散表現では、単語をベクトル化し・・・ベクトル同士の足し算は、意味の足し算になります  (/ネットより画像借用)

● 数字の組で・・・言葉の意味を表す 】 (5)


ええと…

ボード表示してあるのは…

英文の使用例を集めた・・・コーパス から、英語短文大量に集めて、幾つかの単

着目して、その周囲を調べたものす。

例えば…

ここにある、sodabeer といった語の…

 

《大規模言語モデル考察》 (77) 
                                                             (/ネットより画像借用)

● 数字の組で・・・言葉の意味を表す 】 (6)


周辺には、drinkbottle がよく登場します。car truck周辺には、godrive

が、よく登場します。

ええ…

ある単語単語が…

文中同時出現する事を、<・・・共起・・・> と言います。

この…

<単語の・・・

 

《大規模言語モデル考察》 (78)    
                                                    (/ネットより画像借用)

● 数字の組で・・・言葉の意味を表す 】 (7)


・・・共起関係・・・> をまとめた、この数表を、2次元平面グラフ上に、落とし込むと、

た意味の単語が、グラフ上近い場所に集まります…」


     

「”参考文献” と、同一の画像がネット上で見つからないので、それに近い画像を表示します。意味は

同じです。とりあえず、眺めておいてください。後で説明します…」

 

 

   

 
                                     (/ネットより画像借用)


「うーん…」支折が、ボンヤリグラフを眺めた。「そうですか…」

 

《大規模言語モデル考察》 (79)       

● 数字の組で・・・言葉の意味を表す 】 (8)


「つまり…」茜が言った。「<★ 分散表現> では…

文中のある、単語意味は、<周囲に・・・どんな単語が、並んでいるかを見れば・・・

分かる> と、いう事ですわ」

「ふーん…」支折が、アゴを傾げた。「言語学者というのは、こんな事も、研究しているわけ

ですかあ…」

 

《大規模言語モデル考察》 (80)             

● 数字の組で・・・言葉の意味を表す 】 (9)


「そうですね…」茜が言った。「言葉というモノの…

不思議さに気づき、本格的解明しようとした人達がいたわけです。こうした、歴史埋も

れていたような努力が、<チャット・プログラムの・・・創出・・・> に際し…


  

 7月  30日

《大規模言語モデル考察》 (81)    
                                          (/ネットより画像借用)

● 数字の組で・・・言葉の意味を表す 】 (10)


<言葉の本質/・・・言葉の構造> という事で、脚光をびた様ですね」

「うーむ…」高杉が、ボードグラフを眺めた。「初めて見るグラフですねえ…」

「ええと…」茜が、うなづいた。「この方法なら…

<単語の意味を・・・

 

《大規模言語モデル考察》 (82) 
                                     共起語とは?                      (/ネットより画像借用)

● 数字の組で・・・言葉の意味を表す 】 (11)


・・・周囲の単語との・・・共起関係のみで表現・・・> できますわ。

参考文献では…

縦軸に、<beer soda car truck> をとり

横軸に、<eat bottle cold drink go drive run> の、7つ単語をとっています。

 

《大規模言語モデル考察》 (83)         
                                                   (/ネットより画像借用)

● 数字の組で・・・言葉の意味を表す 】 (12)


つまり…

ここでは…

<★ car は、7次元の(7つの単語の)ベクトル・・・(横軸の順に、) 44、2、1、2、99、

46、14> で、記せばいいわけです。

同じく…

<★ Truckは、7次元のベクトル・・・32、0、2、0、102、67、15>

 

《大規模言語モデル考察》 (84)     

● 数字の組で・・・言葉の意味を表す 】 (13)


…で、表せます。

carTruck は…

字面(じづら)が違っても、似た意味を持っていることが、ベクトルの値で読み取れるわけです。

このベクトルは…

eat bottle cold drink go drive run  の、7つの単語との関係性に…

 

《大規模言語モデル考察》 (85)        

● 数字の組で・・・言葉の意味を表す 】 (14)


…よって、car truck という、単語意味表現しているわけですね。

つまり…

<単語の持つ意味が・・・7次元の成分に、分散して表現・・・> されている、わけです。

この事から、単語意味ベクトルで表すことを…

 

《大規模言語モデル考察》 (86)       

● 数字の組で・・・言葉の意味を表す 】 (15)


<★ 分散表現> と呼びます」

「うーん…」支折が言った。「単語は、この7つでなくても、いいわけかしら?」

「そうですね…」茜が言った。「複数の、ベクトルが取れればいいわけですから、そうだと思

います。

「”参考文献” と…

同一の画像がネット上で見つからないので、それに近いコーパスの画像を表示します。意

味は同じです。

<★ beer は・・・7次元のベクトル>

       =  have new drink bottle ride speed read の、単語からのベクトル・・・

     横軸の、<36、14、72、57、3、0、1> で、表せます。  

<★ wine は、7次元のベクトル>  =  <108、14、92、86、0、1、2> で表せま

     す。


主成分分析などの手法で、次元を圧縮すると、似た意味の語が近くに集まる・・・と

  いう事です。

 

 

   



「これはさあ…」支折が言った。「<ベクトル/・・・力と方向の矢印> では、ないけど…

私達には、矢印アナロジーAnalogy/・・・ある事柄をもとにして、他の事柄について推し量ること)の方が、

分かりやすいわよね?」

「そうですね…」茜が、うなづいた。「でも、最初に戻しますが、コンピューターには、

クトルは、この <7次元の数値の方が・・・扱いやすい> 様ですね。

私自身も、専門家ではないですので、参考文献 以上のことは、分かりません」

「はい…」支折が、コクリとうなづいた。



 7月  31日

《大規模言語モデル考察》 (87) 
                                 兄という単語の意味・・・      (/ネットより画像借用)

● 数字の組で・・・言葉の意味を表す 】 (16)


参考文献 には、これ以上の、詳しい説明はありません。

要するに…

<分散表現> を使えば、“和服”“着物” といった、単語文字列の並びとは独立

て、<単語の意味を・・・数値で表現> できるわけですわ。

 

《大規模言語モデル考察》 (88) 
                                     共起語とは?                      (/ネットより画像借用)

● 数字の組で・・・言葉の意味を表す 】 (17)


コンピューターに…

単語や、文章の持つ意味を扱わせるなら、文字列に縛(しば)られずに、意味をそのまま扱

える、”ベクトル形式” の方が、適していると言います」

「ふーむ…」高杉が、うなづいた。「そういう事ですか…

 

《大規模言語モデル考察》 (89)    
                                 <LLM/大規模言語モデル>   (/ネットより画像借用)

● 数字の組で・・・言葉の意味を表す 】 (18)


<LLM/大規模言語モデル> では、この <分散表現> が、取り入れられている、と

いうわけですね?」

「はい…」茜が、うなづいた。「そうです

【● 単語の意味を・・・足し算・引き算する】 (1)  wpe7.jpg (10890 バイト)

 

茜が、ノートパソコンからを上げた。…

 《大規模言語モデル考察》 (90)  
                                   Word2Vec 』                      (/ネットより画像借用)

【● 単語の意味を・・・足し算・引き算する】 (2)


…そして、スクリーンボードコントローラーを取り、モザイク画像1つ拡大した。

「ええ…」茜が言った。「を、進めましょう…

2013年に…

グーグルミコロフTomas Mikolovらが、発表した…

Word2Vec 』 は…

 

《大規模言語モデル考察》 (91)   
                                                      (/ネットより画像借用)

【● 単語の意味を・・・足し算・引き算する】 (3)


ニューラルネット(/機械学習の一種) を用いて、 単語の意味の・・・分散表現を、

生成するシステム> です。

先ほどの…

7次元ベクトルの例では、 個々の単語の、共起関係を・・・1個づつ調べて・・・数表

の形に整理・・・> したものですね。

一方…



  

  「イチロー」 - 「野球」 + 「サッカー」 = 「ロナウド」      (/ネットより画像借用)

 

《大規模言語モデル考察》 (92)  
                                                        (/ネットより画像借用)

【● 単語の意味を・・・足し算・引き算する】 (4)


Word2Vec の場合は…

<1度に、様々な単語のベクトルを・・・まとめて生成> できるシステムです。こちらの方

は、別の方法で、”単語の・・・共起関係” を、学び取ります。


 

訓練用のテキストから・・・

数単語のフレーズを・・・ランダムに抜き出し・・・前後の単語から・・・



 8月  1日

《大規模言語モデル考察》 (93)  
                                                        (/ネットより画像借用)

【● 単語の意味を・・・足し算・引き算する】 (5)


・・・真ん中の単語が何かを当てる・・・ 単語当てクイズ・・・> を、くり返すものです」

「ふーむ…」高杉が言った。「 単語当てクイズ  という言葉は…

<AI 関係> 文章で、何度も見かけています。 単語の意味を・・・

 

《大規模言語モデル考察》 (94)  
                                   [AI・機械学習の数学]             (/ネットより画像借用)

【● 単語の意味を・・・足し算・引き算する】 (6)


・・・分散表現の・・・ベクトルで生成するため・・・> に、やるのですか」

「でも…」支折が、を揺らした。「まだ、なんとなく、シックリとしなわねえ…」

「はい…」茜が、うなづいた。「それは、私達がまだ、こうした世界に、馴染んで

 

《大規模言語モデル考察》 (95)  
                                                        (/ネットより画像借用)

【● 単語の意味を・・・足し算・引き算する】 (7)


…いないからだと思います。

ええと…

単語当てクイズ> の、正答率が、上がるように…

Word2Vec は、<前後の単語に、割り当てたベクトルを・・・初期値から、少しづ

つ変化・・・> させて、行きます。そして、 単語当てクイズ> が…

 

《大規模言語モデル考察》 (96) 
                                                             (/ネットより画像借用)

【● 単語の意味を・・・足し算・引き算する】 (8)


得意になった頃には、それらの <ベクトルが・・・各単語の意味を・・・うまく表したも

に、なっている、という事ですわ」

「ふーむ…」高杉が、うなった。「その、<ベクトルが・・・エキス/意味・・・> と、なるわ

け…

 

《大規模言語モデル考察》 (97)  
                一面のラベンダー畑! 「富良野・美瑛ノロッコ号」で北海道の夏の絶景  (/ネットより画像借用)

【● 単語の意味を・・・足し算・引き算する】 (9)


…ですか、」

「うーん…」支折が、を傾げた。「ラベンダーエキスを、抽出したのを思い出すわねえ…

北海道/美瑛町(びえいちょう)で作った、ラベンダーエッセンシャル・オイルは、机の

に置いてあるけど、」

 

《大規模言語モデル考察》 (98)   wpe7.jpg (10890 バイト)
                                                     (/ネットより画像借用)

【● 単語の意味を・・・足し算・引き算する】 (10)


「ほほ…」アンが、を当てた。「あの時の…

去年一緒北海道へ行った時の…エッセンシャル・オイルですか?」

「ええ…」支折が、生真面目(きまじめ)に、うなづいた。「その、アナロジーanalogy/類推。類似。)

です…」

「うーん…」アンが…



 8月  2日

《大規模言語モデル考察》 (99)  
                       ラベンダー/水蒸気蒸留・・・エッセンシャル・オイルの精製   (/ネットより画像借用)

【● 単語の意味を・・・足し算・引き算する】 (11)


を傾げた。「エッセンシャル・オイルですか…」

「さあ…」茜が、を崩しながら言った。「ええと…

この…

<クイズ当ての・・・問題 ・ 回答は・・・全て訓練用テキストの中に入っている> ので、

Word2Vec の…

 

《大規模言語モデル考察》 (100)     
                                                              (/ネットより画像借用)

【● 単語の意味を・・・足し算・引き算する】 (12)


<機械学習の方法は・・・ 教師なし学習と、呼ばれます。

これは…

<★ 質問 ・ 回答がセットの・・・統計的 ・ 機械翻訳の方法・・・ 教師あり学習と、

対比したものですね」

「うーん…」支折が、をつまんだ。…

 

《大規模言語モデル考察》 (101)   wpe7.jpg (10890 バイト)
                                                 (/ネットより画像借用)

【● 単語の意味を・・・足し算・引き算する】 (13)


…「★ 問題 ・ 回答は・・・訓練用テキストの中に存在し・・・教師がいないから・・・

教師なし学習> ですか…?

そして…

<★ 質問 ・ 回答がセットになった・・・機械翻訳は・・・ 教師あり学習> と、いう事

ですか」

 

《大規模言語モデル考察》 (102)   
                                                         (/ネットより画像借用)

【● 単語の意味を・・・足し算・引き算する】 (14)


「そうですね…」茜が、ノートパソコンを流した。「を進めます…

ええと…

Word2Vec システムでは、<単語の意味を・・・足し算 ・ 引き算できるコト・・・

で、大きな話題になった様ですね」

 

《大規模言語モデル考察》 (103)         

【● 単語の意味を・・・足し算・引き算する】 (15)


「うむ…」高杉が言った。「そんな事を、言っていましたねえ…

は、何となく、聞き流していましたが…」

「そうですね…」茜が、小さくうなづいた。「<AI 開発> のことは、大概そうでしたね…

、それを、復習しているわけです。放置できない、という事で。

あ、ええと…

Word2Vec で…

出力した、<・・・単語のベクトル・・・> を、使うと…

 

《大規模言語モデル考察》 (104)    

【● 単語の意味を・・・足し算・引き算する】 (16)


”興味深い・・・計算” が、成り立つ様ですね。


 


① 「Paris」 - 「France」 + 「Japan」 = 「Tokyo」


② 「Sushi」 - 「Japan」 + 「USA」 = 「Pizza」

 

…と、なる様です。

これは、おかしな数式です。

 

《大規模言語モデル考察》 (105)     wpe4F.jpg (12230 バイト)

【● 単語の意味を・・・足し算・引き算する】 (17)


でも、2つとも、直感的には・・・納得いく式/計算結果結果” なのでは、ないでしょうか?

これらの…

<単語の・・・分散表現・・・> には…

「Paris」 が、「フランス ・ 首都 ・ 大都市」 といった単語と、<共起> しやすい…

 

《大規模言語モデル考察》 (106)   
                                   フランス/パリ/凱旋門                (/ネットより画像借用)

【● 単語の意味を・・・足し算・引き算する】 (18)


…わけですね。「Tokyo」 は、「日本 ・ 首都 ・ 大都市」 といった単語と、<共起> しや

すいわけです。

「Paris」「Tokyo」 には、そもそも、<こうした情報が・・・含まれている と、いう

事です。それが、“字面(じづら)

 

《大規模言語モデル考察》 (107)  
                                    日本/東京/スカイツリー           (/ネットより画像借用)

【● 単語の意味を・・・足し算・引き算する】 (19)


…ではない “ベクトル表示” で、<顕在化> して来る、様ですわ。

そのため…

<それ等の情報/ベクトルが・・・足し算 ・ 引き算される・・・> ことで、<意味の・・・

足し算 ・ 引き算が・・・可能・・・> に、なる様です」


 

                                                         (/ネットより画像借用)


 8月  3日

《大規模言語モデル考察》 (108)   
                                 <ベクトル/・・・力と方向の矢印>   (/ネットより画像借用)

【● 単語の意味を・・・足し算・引き算する】 (20)


「うーん…」支折が、を揺らした。「<ベクトル/= 力 ・ 方向の矢印> だから、それが

可能になるのかしら? 新しい概念よねえ、」

「そうですね…」茜が言った。「ともかく、しばらく、眺めてみましょう…

 

《大規模言語モデル考察》 (109)  
                                                     (/ネットより画像借用)

【● 単語の意味を・・・足し算・引き算する】 (21)


ええと…

Word2Vec は…

単体では、<分散表現の・・・ベクトルを生成> する、だけですが…

Word2Vec の後に、他のニューラルネット接続して、<教師ありの・・・機械学習

を行うと、様々な言語処理

 

《大規模言語モデル考察》 (110)       

【● 単語の意味を・・・足し算・引き算する】 (22)


…に、用いる事ができる様ですね。

Word2Vec /ニューラルネットは…

<学習の過程で・・・内部にある無数のニューロンの重み付け(パラメーター)を・・・少

しづつ変化・・・> させて行きますが、この際に、 Word2Vec が…


   
                                                      (/ネットより画像借用)

 

《大規模言語モデル考察》 (111)     

【● 単語の意味を・・・足し算・引き算する】 (23)


生成した、<単語の・・・ベクトルの数値も・・・更新> されます。

ええ…

質問応答文章分類など、タスクに応じて、<単語の・・・分散表現> が、微調整される

様ですね。

ええと…

<分散表現> を、ニューラルネットと…

 

《大規模言語モデル考察》 (112)  
                                                 (/ネットより画像借用)

【● 単語の意味を・・・足し算・引き算する】 (24)


組み合わせることで、タスク正答率を、高められる様になった、という事ですわ」

「ふーむ…」高杉が、の後ろにを当てた。「まあ…

ようやく、<分散表現の・・・大草原の片隅・・・> に、足を踏み入れた感じですねえ。 

 

《大規模言語モデル考察》 (113)    wpe7.jpg (10890 バイト)
                                  <● LLM/大規模言語モデル>  (/ネットより画像借用)

【● 単語の意味を・・・足し算・引き算する】 (25)


<● AI/大規模言語モデル> は…

この <★ 分散表現> と、<★ Transfomer という・・・ニューラルネット> が、中核

のですね?」

「そうですね…」茜が、うなづいた。「では…

次に、その <Transfomerの・・・考察> に、移りましょうか…」



 8月  4日

《大規模言語モデル考察》 (114)     
                                        玩具/ トランスフォーマー    (/ネットより画像借用)

【● 広く、深く学ぶ・・・Transfomer】 (1) 


「さあ…」茜が、スクリーンボード画像を切り替えた。「いよいよ、<Transfomer> です

ね…

改めて、言いますが…

<★Transfomer というのは・・・

ニューラルネット/= 人間の脳の神経回路を模した・・・数理モデルであり・・・

 

《大規模言語モデル考察》 (115) 
                                  ニューラルネットワークとは・・・         (/ネットより画像借用)

【● 広く、深く学ぶ・・・Transfomer 】 (2)


・・・機械学習や、深層学習の、基盤となる技術・・・> ですね。

ええ、その前に…

少し、まとめをして、置きましょうか。

  

◆ コンピューターで、単語の意味を捉えるには・・・

  複数の数値からなる、ベクトルで意味を表す・・・

 

《大規模言語モデル考察》 (116)   
                                             (/ネットより画像借用)

【● 広く、深く学ぶ・・・Transfomer 】 (3)


  ・・・<★ 分散表現> が、適している、という事です。

<★ 分散表現> と、<★ Transfomer/= 広く深く、データの特徴を学ぶ・・・

  ニューラルネット> の、組み合わせで、<● 大規模言語モデル> が、生まれた、

  という事ですね。

 

《大規模言語モデル考察》 (117)      
                                            (/ネットより画像借用)

【● 広く、深く学ぶ・・・Transfomer 】 (4)


そして・・・

<● AI/・・・大規模言語モデル> は・・・

  言語や自然現象の、複雑なシステムを、まるごと受け止められる点で、<★ ヒト

の脳と・・・よく似た情報処理> を、行っている。

  


…と、いう事です」

 

《大規模言語モデル考察》 (118)    

【● 広く、深く学ぶ・・・Transfomer 】 (5)


「その…」高杉が言った。「<● AI/大規模言語モデル> が、急速に、研究開発が、

している、という事ですねえ、」

「はい…」茜が、うなづいた。「そうです…

ええと…

また少し、まとめをして、置きましょう。

これは、<・・・警鐘!!・・・ です。

 

《大規模言語モデル考察》 (119)    
      マンハッタン計画で製造された、原子爆弾。  『リトルボーイ上  、ファットマン』 下   (/ネットより画像借用)

【● 広く、深く学ぶ・・・Transfomer 】 (6)


  

<★ AI の・・・研究開発> は・・・

<★ 人類文明にとって・・・無用な長物の・・・危険性・・・> が、警鐘されつつ・・・

    <私達の知らない所で・・・急速に・・・研究開発が加速・・・> しています。

 当/《HomePage/人間原理空間》 では・・・

   <★原子爆弾の開発/・・・



 8月  5日

《大規模言語モデル考察》 (120)    
                                   マンハッタン ・ プロジェクト        /ネットより画像借用)

【● 広く、深く学ぶ・・・Transfomer 】 (7)


・・・核戦略時代の開闢(かいびゃく)となった・・・マンハッタン計画> と、<AI 開発の・・・

暴走! を、”類似の現象/・・・状況” 、と捉えています。

<★ 原子爆弾/・・・核戦略時代・・・> は、結局、人類文明には、何の幸福も、もた

  らさなかった、と言う事です。

《大規模言語モデル考察》 (121)
                                                        (/ネットより画像借用)

【● 広く、深く学ぶ・・・Transfomer 】 (8)


ひたすら、<・・・無の長物だった ・・・> と、いう事ですわ。

ええ・・・

<★ AI/人工知能・・・ “人工の神の創出 ・・・> も・・・

人類文明にとっては・・・

<★ マンハッタン計画を・・・ ”遥かに上回る危険性 ”> が・・・

予想されます。でも、人間が持つ・・・

 

《大規模言語モデル考察》 (122)
                                                        (/ネットより画像借用)

【● 広く、深く学ぶ・・・Transfomer 】 (9)


・・・本能的な、好奇心は、それを封殺することは、困難でしょう。

ならば・・・

<★ AI 開発は・・・

  慎重を期して・・・戦争 ・ 覇道に、利用するのではなく・・・

  地球温暖化対策や・・・学術の探索等に・・・特化!  > すべきだ。

  

 

《大規模言語モデル考察》 (123) 
                                                                     (/ネットより画像借用)

【● 広く、深く学ぶ・・・Transfomer 】 (10)


…と、いう事ですわ」

「そうですね…」北原が、大きくうなづいた。「ともかく…

人類文明にとって・・・非常に、重大な・・・局面が到来  

しています。

まさに…

文明の・・・ターニングポイント が、迫られている、のかも知れま

せん。

 

《大規模言語モデル考察》 (124)       

【● 広く、深く学ぶ・・・Transfomer 】 (11)


それゆえ…

<AI 分野は・・・1部の人々の独占領域・・・> と、すべきではなく、<★ 全人類的な

・・・大課題と、するべきです。

は…

この意味でも、現在の、国連管理下で…



《大規模言語モデル考察》 (125)
                          トランプ大統領・・・ 「掘って、掘って、掘りまくれ  (/ネットより画像借用)

【● 広く、深く学ぶ・・・Transfomer 】 (12)


  

生活者/世界市民の・・・初・世界会議 を・・・

  開催する事を、提唱します。

<★ 生活者/世界市民が・・・誰も望んでいない・・・戦争 ・ 覇権争い ・ 巨大飢餓

が・・・世界中で拡大 しています。この状況を、許していていいのでしょうか

<★AI 技術> を…

  <戦争ゴッコや・・・


       地球温暖化】の画像素材(40125126) | イラスト素材ならイメージナビ 
                                         (/ネットより画像借用)


 8月  6日

《大規模言語モデル考察》 (126)    
                                   <地球温暖化対策>     /ネットより画像借用)

【● 広く、深く学ぶ・・・Transfomer 】 (13)


・・・覇権ゴッコ>
に、移植するのではなく・・・まさに、<地球温暖化対策や・・・人類

文明の、折返し技術・・・> に、使って欲しいですね。


  


現在
は…

<戦争ゴッコ ・ 覇権ゴッコ> が、勢いを増し、<世界大混乱・・・の兆候・・・> が、

え始めています。

 

《大規模言語モデル考察》 (127)  wpe7.jpg (10890 バイト)
                          トランプ大統領・・・ 「掘って、掘って、掘りまくれ   /ネットより画像借用)

【● 広く、深く学ぶ・・・Transfomer 】 (14)


政治家が・・・理想を語らなく・・・> なり、〔生活者/世界市民〕 から、信用されな

くなって、時間が、積み重なっています。

それゆえに…

政治家ではない・・・不動産屋のオヤジ・・・米トランプ大統領の様な人物・・・” を、

招来してしまった様です。アメリカ大統領であり、アメリカの…

 

《大規模言語モデル考察》 (128)     

【● 広く、深く学ぶ・・・Transfomer 】 (15)


問題ですが、アメリカ超大国側面を持ちます。

その…

超大国アメリカが…

<世界のパラダイムparadigm/あるひとつの時代の人々の考え方を、根本的

に支える概念。の・・・国際法/ 国際秩序/ 国際的慣習・・・を破壊

し・・・世界を大混乱・・・> に、陥れています。

 

《大規模言語モデル考察》 (129) 地球温暖化】の画像素材(40125126) | イラスト素材ならイメージナビ     
                                      /ネットより画像借用)

【● 広く、深く学ぶ・・・Transfomer 】 (16)


ウクライナに・・・

不埒(ふらち/・・・道理にはずれていて、けしからぬこと。)な、侵略戦争を仕掛けた・・・ロシア/プー

チン大統領

ガザで・・・

世界が注目する中で ・・・ジェノサイドを継続する・・・イスラエル/ネタニヤフ首相

そして…

イランの・・・

 

《大規模言語モデル考察》 (130)   
                                                              /ネットより画像借用)

【● 広く、深く学ぶ・・・Transfomer 】 (17)


・・・地下核施設に、大型貫通爆弾/バンカーバスター GBU-57
(/・・・アメリカ空軍によって

開発された、30,000ポンド(約13・6トン。全長6m。 の精密誘導爆弾。)を、B-2 ステルス爆撃機を使用

して投下し・・・

ウクライナ戦争 ・ ガザ戦争には、匙(さじ)を投げ・・・

パリ協定と、WHOを脱退し・・・アメリカ自身もクラッシュさせている張本人・・・米/ト

ランプ大統領・・・

この、3人が…

まさに、<世界を・・・大混乱の方向・・・ へ、引き寄せている様相ですね。

 

《大規模言語モデル考察》 (131)  
                                  <生活者/・・・80億の、世界市民>  /ネットより画像借用)

【● 広く、深く学ぶ・・・Transfomer 】 (18)


これは…

● 生活者/・・・80億世界市民の、望む方向ではない

 
と、いう事です。この事態に、全力で、強力に、抗議するべきです。


ええ…

こうした、時代状況であり…

<★ AI 開発の・・・問題> ばかりでなく、<地球温暖化対策> や…


 8月  7日

《大規模言語モデル考察》 (132)  
                                     ガザ                         (/ネットより画像借用)

【● 広く、深く学ぶ・・・Transfomer 】 (19)


<世界平和・・・移民 ・ 難民 ・ 飢餓対策・・・> のためにも…

生活者/世界市民の・・・初会議 を、開催する事を、強く

します!」

「はい…」茜が、うなづいた。「そうした、スタンスも踏まえ、を進めましょう…

 

《大規模言語モデル考察》 (133) 
                                  AI の軍事利用                           (/ネットより画像借用)

【● 広く、深く学ぶ・・・Transfomer 】 (20)


でも…

<人間の好奇心・・・学術的なAI の研究開発・・・それ自体> は、<・・・悪・・・>

言うコトではないわけですね。ここが、まさに、<マンハッタン計画と・・・類似・・・> して

いる所ですね。

そして…

<科学者達の・・・反省 ・ 大後悔も・・・ここに集中している

わけですね。

学者は、純粋研究開発をしますが、それが…

 

《大規模言語モデル考察》 (134)   
              マンハッタン計画/最初の原爆実験 「トリニティ実験」 の核爆発の様子    (/ネットより画像借用)

【● 広く、深く学ぶ・・・Transfomer 】 (21)


政治家 ・ 軍人に移ると、収拾が付かなくなりますわ…」

 

「さあ…」茜が、スクリーンボードを投げた。「前置きが、長くなりました…

<★ Transfomer>  の、考察に入りましょうか。


         
      


<ニューラルネット>
は…

しばしば、<ヒトの脳の・・・

 

《大規模言語モデル考察》 (135) 
                                                                                (/ネットより画像借用)

【● 広く、深く学ぶ・・・Transfomer 】 (22)


・・・神経回路を真似た・・・情報処理> と、説明されています。

ええ…

処理内容という、から見れば…

この技術は…

<入力された・・・複数のデータ間に存在する・・・ ”関係性” ・・・を学びとって・・・

表面的な文字列や、数字の背後にある・・・データの特徴を取り出す・・・計算手法>

 

《大規模言語モデル考察》 (136)        
                                                                                (/ネットより画像借用)

【● 広く、深く学ぶ・・・Transfomer 】 (23)


…と、いう事ですね。

<単語が持つ・・・意味情報 を扱う上で、“非常に・・・相性の良い方法 と、い

う事です」

「しかし…」高杉が言った。「<ニューラルネット> が…

<自然言語処理Natural Language Processing、略称/NLP = 人間が日常的に使用する言語(自然言語)

コンピュータに理解させ、処理させる技術。) で…

 

《大規模言語モデル考察》 (137)  
                                                  (/ネットより画像借用)

【● 広く、深く学ぶ・・・Transfomer 】 (24)


使われるようになったのは、ここ、10年ほどの事だと、聞いていますねえ、」

「そうですね…」茜が、うなづいた。「キッカケと、なったのは…

<★ 深層学習/・・・ディープラーニングの・・・登場 だった様ですね。

<深層学習> は…


 

 8月  9日

《大規模言語モデル考察》 (138)    
  ノーベル物理学賞にAI の中核 「機械学習」 の基礎に関わった2人。右が、ジェフリー・ヒントン   (/ネットより画像借用)

【● 広く、深く学ぶ・・・Transfomer 】 (25)


…ノーベル物理学賞受賞した、カナダ/トロント大学ヒントン(Geoffrey Hinton。…ジョン ・

ホップフィールドJohn Hopfieldと共に受賞。)が、2000年代後半から、提唱していたものです。

は、2012年の…

 

《大規模言語モデル考察》 (139)                                                                                                    画像認識競技会        (/ネットより画像借用)

【● 広く、深く学ぶ・・・Transfomer 】 (26)


<画像認識のコンテスト/ ILSVRC> で、その威力を、世界に示した様ですね。

< ILSVRC> というのは…

画像中にある、物体認識や、セグメンテーション(/切り出し)アルゴリズムの、性能を競

コンテストです」

「ふむ…」高杉が…

 

《大規模言語モデル考察》 (140)   
                                                                                (/ネットより画像借用)

【● 広く、深く学ぶ・・・Transfomer 】 (27)


…言った。「色々なものが、あるんですねえ…」

「そうですね…」茜が言った。「ともかく…

<★ 深層学習/・・・ディープラーニング> は、入力データから、抽象的特徴を学び

取るのが得意で、その名前の通り

 

《大規模言語モデル考察》 (141)    
                                   グーグル/バスワニ (Ashish Vaswani   (/ネットより画像借用)

【● 広く、深く学ぶ・・・Transfomer 】 (28)


<深い学習に・・・秀(ひいでた・・・ニューラルネット> だ、という事です」

「ふーむ…」高杉が、うなづいた。「で…?」

「あ…」茜が言った。「ええと…

2017年には…

グーグルの、バスワニAshish Vaswaniらが…

 

《大規模言語モデル考察》 (142)    
                                                                (/ネットより画像借用)

【● 広く、深く学ぶ・・・Transfomer 】 (29)


自然言語処理に向いた・・・

         深層学習のニューラルネット・・・Transfomer >

を、発表しています。

<Transfomer> は…

長い文章の中で、遠く離れた単語どうしの関係性を、上手(うま)く学び取ります。“深い学

習” だけでなく…

 

《大規模言語モデル考察》 (143)      
                                                            (/ネットより画像借用)

【● 広く、深く学ぶ・・・Transfomer 】 (30)


“広い学習” にも秀でた、ニューラルネットなのです。

翌/2018年には…

Transfomerを用いた・・・言語モデル> が、あいついで登場してい

ます。

グーグルの・・・BERT> と、 オープンA(社) の・・・GPT> ですね。

ええと…



 8月  10日

《大規模言語モデル考察》 (144)    
                                                                (/ネットより画像借用)

【● 広く、深く学ぶ・・・Transfomer 】 (31)


今でこそ、 GPT> の方が有名ですが、最初に <大規模言語モデルの・・・ブーム

を引き起こしたのは、 BERT> の方です。

ちなみに…

BERT = Bidirectional Encoder Representations from Transformers/= ・・・  

《大規模言語モデル考察》 (145)     
                                                       (/ネットより画像借用)

【● 広く、深く学ぶ・・・Transfomer 】 (32)


・・・Transfomer を使って学ぶ、エンコード表現・・・の略称>

< GPT = Generative Pre-trained Transformer/ = 事前訓練済みの、生成的

Transfomer ・・・の略称>


…です。

この2つ英語表現略称自体が、 BERT> GPT> 特徴を、表してい

るのかも知れません」

 

《大規模言語モデル考察》 (146)       

【● 広く、深く学ぶ・・・Transfomer 】 (33)


「そうなんですか…」北原が言った。

「あ…」茜が笑った。「専門家ではないので、詳しい事は言えません…

さあ…

いよいよ…

<大規模言語モデルの・・・仕組みの話・・・> に、入って行きましょう。

まずは、最初ブームを引き起こした、 BERT> の方からです。

「はい…」支折が、大きくうなづいた。

 

《大規模言語モデル考察》 (147)    
                                              (/ネットより画像借用)

【● 広く、深く学ぶ・・・Transfomer 】 (34)


BERT> は…」茜が言った。「まず、初めに

ネット上にあるWikipedia などの、大量テキストデータを使った、<★ 事前学習>

を行います。

“テキストの中の単語を・・・伏せて・・・それを当てる・・・単語当てクイズ” を、ひたすら、

解きます」

「それが…」支折が言った。「<★ 事前学習> なのですね?」

「そうです…」茜が言った。「人間では、<クイズ脳> などと、揶揄(やゆ/からかうこと)されるこ

ともありますが、まさにニューラルネットが、鍛えられるわけですね。

BERT> は…

単語が、うまく当てられる様に、“ニューラルネットの・・・重み付け・・・” を、変えて行きま

す。その過程で、“単語の・・・多面的な意味をとらえた・・・分散表現・・・” を、獲得でき

る様に、なって行きます」

 

《大規模言語モデル考察》 (148)     
                                                                (/ネットより画像借用)

【● 広く、深く学ぶ・・・Transfomer 】 (35)


「そうかあ…」支折が、言った。「これは、 Word2Vecの・・・訓練> と、似ているわね

え…」

「そうです…」茜が、大きくうなづいた。「ただし、クイズ難易度が、桁違いですわ…

Word2Vec> は、“数単語の・・・フレーズの中” で、解いていました。これに対し、

BERT> は、“複数の・・・段落を含む様な・・・長い文章の中” で、このクイズ

解くのです」

「ふーん…」支折が、を当てた。「すごい、飛躍よねえ…」

「そうですね…」茜が言った。「私達/人間が…

国語文章問題で、空欄補充問題を、解く場合は…

“前後の段落まで見渡して・・・文脈を考慮しながら・・・適切な語句を考えようとする”

…わけですね。 BERT> が、やっているのも、基本的には、それと同じです」


 8月 11日

   山の日

《大規模言語モデル考察》 (149)    
                                                          (/ネットより画像借用)

【● 広く、深く学ぶ・・・Transfomer 】 (36)


「はい…」支折が言った。

BERT> の…」茜が言った。「内部にある <Transfomer> は…

単語当てクイズを、解くには…

“文章のどこに・・・注目すれば良いかという・・・注意の向け方・・・”

を、学習するのです。

その結果

個々の単語意味を表す、ベクトルの中には…

“周囲の単語との、関係性だけでなく・・・ 

前後の文章や・・・段落との関係性・・・さらに、文章全体の文脈情報を・・・広く取り混

ぜた情報・・・” 

…が、格納できる様になって行く、という事ですわ」

「うーん…」支折が言った。「何で、こんなコトが出来るのかしら?」

 

《大規模言語モデル考察》 (150)     
                                                         (/ネットより画像借用)

【● 広く、深く学ぶ・・・Transfomer 】 (37)


「確かに…」茜が言った。「そうですが…

ヒトの脳も、普通にやっているコトですわ。でも、それが、驚異的であり、私達理解を超え

ている所ですね。

現在逆に

<Transfomer> から、ヒトの脳へのアプローチが進んでいます。ヒトの脳理解できなく

ても、<Transfomer> 人間組み上げたモノです。膨大組立部品も、開発経過も、

訓練まで、全てのテクノロジーが、分かっているわけですから、」

「しかし…」高杉が言った。「最後に…

何故コレが、 <脳の・・・発火(神経細胞/ニューロンが・・・電気信号を発生させる現象

に、結びつき“思考・・・という、超越が、起こるのか・・・理解できない・・・”  と?」

 

《大規模言語モデル考察》 (151)    
                                              (/ネットより画像借用)

【● 広く、深く学ぶ・・・Transfomer 】 (38)


「はい…」茜が、うなづいた。「その様ですね…

脳科学者も、AI 科学者も、そろって、首を傾げる所です。参考文献 の、論文記事

にある…

オウム以上 フクロウ未満? 生成AI の “思考力” と、いうことですね。その、

“思考力の・・・発火・・・” が、”理解不能な・・・謎・・・” と、  いうことです。

ええ…

話を戻しましょう。

事前学習を終えた、 BERT> は…

文章中全ての単語について、”どれを隠されても・・・当てられる状態・・・” になっていま

す。これは、人間に例えれば、”文章を・・・隅から隅まで、舐(な)め尽くすように・・・読み終

えた状態” です。

子供の頃から…

何度も、読み込んだ本であれば…

途中のページにあるキーワードを、目に止めた時に…


  “ 筆者は・・・こういう意味で・・・使っているのだろうな・・・”

  “あの辺りに・・・これと関係しそうなことが・・・書いてあったな・・・”


…といった、漠然としたイメージが、スッと、頭に浮かぶと、思います。

つまり…


 

 8月  12日

《大規模言語モデルの考察》 (152) 
                        Pythonで、単語分散表現のクラスタリング - Ahogrammer  (/ネットより画像借用)

【● 広く、深く学ぶ・・・Transfomer 】 (39)


事前学習を終えた、 BERT> は…

文章中の、全ての語句に対して、こうしたイメージを、“ ☆ ベクトル形式で・・・ スッと、取

り出せる・・・” ように、なっているわけです。

「うーん…」支折が、を揺らした。「<分散表現の・・・ベクトル形式> で、てすかあ、

「そうです…」茜が言った。「<事前学習を終えた・・・BERTの内部> では…

“ 文章の意味を・・・ベクトルへ、上手く変換できるように・・・ ニューラルネットの重み

付け・・・” が、変化しています。

つまり…

ニューラルネットの中には、事前学習テキストに含まれていた、”あらゆる単語間の・・・

関係性・・・” が、獲得されているのです。

 

《大規模言語モデルの考察》 (153)     
                                                            (/ネットより画像借用)

【● 広く、深く学ぶ・・・Transfomer 】 (40)


前に…

① ② ③ の、タスク考察しましたが、覚えていますか?」

「ええと…」支折が、自分モニターを、マウススクロールした。

「うーん…」支折が言った。「この辺りかしら…あ、ありました…

“会話のパターンを・・・全てプログラムに書き込む”

“文法などのルールを・・・プログラムに書き込む”

③ “質問と答えの・・・相関関係を学ばせる/・・・教師あり学習/・・・統計的機械翻

   訳”

…ですね?」

「そうです…」茜が、微笑した。「丁寧に、有難うございます…

の、例では

タスクごとに、別の統計手法で、文意処理する必要がありました。でも、<大規模言語

モデル> なら、少し調整を加えるだけで、済むのです」

 

《大規模言語モデルの考察》 (154)   
                                                            (/ネットより画像借用)

【● 広く、深く学ぶ・・・Transfomer 】 (41)


「ふーん…」支折が、うなづいた。「 は、“質問と答えの・・・相関関係を学ばせる/・・・

教師あり学習/・・・統計的機械翻訳” ですよね、」

「はい…」茜が、うなづいた。「この の…

“教師あり学習の・・・教師データ・・・” となる、“例題と、答えの・・・セット” を、小数与

て…

BERT> の、出口から…

答えを表現する・・・ベクトルが出て来るように・・・ニューラルネットを微調整・・・

する、だけですわ。この、微調整を、 ファインチューニング> と、呼ぶそうです」

「ふーん…」支折が、を当てた。「<ファインチューニング> ですか、」

大量の…」茜が、ノートパソコンをやった。「テキストで学ぶ…

<★ 共通の・・・事前学習> と…

用途に応じた、少量の、 ファインチューニング> で…

BERT> は、“質問応答”“ 文章の分類” といった、”全く種類の異なる・・・言

語タスク” に、対応できる様ですね」

「ふーん…」支折が、上体を後ろにそらせた。「それだけですか…」

「そうです…」茜が言った。「ええと…


 

 8月  13日

《大規模言語モデルの考察》 (155)   
                                                (/ネットより画像借用)

【● 広く、深く学ぶ・・・Transfomer 】 (42)


この便利さが、評判になり…

BERT> 使用する、自然言語処理研究者が、急増した様ですね。一時は、

<BERT があれば・・・何でもできる とさえ、言われた様です」

「ふーん…」支折が言った。「でも、 GTP/Chat GPT> が、出てきたわけですか、」

「そうです…」茜が、うなづいた。「明智光秀の…

3日天下(/明智光秀は、主君を裏切り、本能寺で織田信長を倒しました。しかし、わずか3日で、羽柴秀吉に倒された古

事。)ではありませんが、<グーグルの・・・BERT> を、たった数年追い抜いたのが、

<オープンAI(社)の・・・GPT> です。

ええ…

この <GPT> と、<BERT> は、よく似ています。

 

《大規模言語モデルの考察》 (156)   
                                 大規模言語モデル/ BERTとGPT の学習の様子    (/ネットより画像借用)

【● 広く、深く学ぶ・・・Transfomer 】 (43) 


<最初に・・・

  事前学習で、単語当てクイズを解いて・・・

  単語の意味を表す、ベクトルに・・・

  他の文章や、文脈の情報が・・・織り込まれて行く・・・>


という点では、同じだ、という事ですわ。

ただ…

<GPT> <BERT> では…

<事前学習で解く・・・クイズの出題の方法が・・・異なっている と、いう事です。

<BERT> は、<★ 文章の途中を・・・1単語隠した、穴埋めクイズ> を、解きます。

これに対し…

<GPT> は、<★ 文章の途中から・・・後ろを全て隠して・・・次に来る単語は何かを

・・・それまでの文章から・・・予測・・・> させる、様です。

これは…

いわば、<★★ 単語生成クイズを・・・解いている ことに、成るのだそうです」

 

《大規模言語モデルの考察》 (157)      
                                                          (/ネットより画像借用)

【● 広く、深く学ぶ・・・Transfomer 】 (44)


「うーん…」支折が、を揺らした。「それは、確かに相当に違うわねえ…」

「こうした…」茜が言った。「<★ GPTの・・・事前学習の、やり方> は…

後で、実際クイズを解く時に、大きな意味を持って来る、と言います。

<GPT> にとっては…

<○○という英語を・・・和訳して> という、翻訳タスクも…

<日本初の・・・ノーベル賞受賞者は?> という、質問応答タスクも…

全て<★★ 単語生成クイズの・・・1種> と、みなせるからです。

<BERT> では…

<事前学習後に・・・改めて・・・回答方法を学ぶ必要 が、あります。


 

 8月  14日

《大規模言語モデルの考察》 (158)   
                                                              (/ネットより画像借用)

【● 広く、深く学ぶ・・・Transfomer 】 (45)


<GPT> 場合は…

そのままでも、ある程度タスクをこなす事が、可能な様です。もちろん、調整を行った方

が、精度は上がるという事ですね。

つまり…

<GPT> は、単語意味や、文法だけにとどまらず…

<★ タスクの解き方・・・そのものも・・・事前学習で・・・それなりに獲得している

と、いうことに、なる様です。

「ふーん…」支折が言った。「事前学習のやり方で、そんなに違って来る、わけですか…」

「そうですね…」茜が言った。「ええと…

このコトに関して、“参考文献” による説明は、ここまでです。まだ、開発途上にある、とい

う事ですね。

 

《大規模言語モデルの考察》 (159)   
                                                    (/ネットより画像借用)

【● 広く、深く学ぶ・・・Transfomer 】 (46)


<AI の・・・研究開発> は…

日進月歩で、進行している事が、予想されます!

この “参考文献” は…

日経サイエンス…2023/10 の、ものです。

前に考察した、《AI の・・・考察》 は、日経サイエンス…2024/02 の、ものですね。

いずれも…

だいぶ前のものになりますが、開発の経過/基礎を整理するという事で、古い資料使用

して来ました。

ええ…

そういうわけで、現状相当に、進んでいるものと思われます。2025年度末頃までに

は、理化学研究所/泰地真弘人さんグループの、 基盤モデルの・・・試験版>

も、リリースされる様です。あ、これは、早ければ、という事ですが…

 

《大規模言語モデルの考察》 (160)     
                                                          (/ネットより画像借用)

【● 広く、深く学ぶ・・・Transfomer 】 (47)


さあ…

を、簡単に、まとめて置きましょうか。

<● 大規模言語モデル> は…

<★ 単語の分散表現> と、<★ Transfomer> の、組み合わせで、誕生したという事

ですね。

そして…

 <この・・・AI > は…

<言語や自然現象の・・・複雑なシステム> を、まるごと受け止められる点で、<ヒト

の脳と・・・よく似た情報処理> を、行っている、という事です。

それから…

<大規模言語モデルの・・・コア技術/Transfomer> は、<脳/海馬の・・・数理モデ

ルと・・・対応関係> が、あるようです。理解する、ヒントになる、可能性がある、とい

う事ですね」

「はい…」支折が、コクリとうなづいた。

 
 

 8月  15日

《大規模言語モデルの考察》 (161)     
                              ジェフリー ・ ヒントンGeoffrey Everest Hinton (/ネットより画像借用)

【● 広く、深く学ぶ・・・Transfomer 】 (48)


「他に…」茜が、みんな見回した。「何か、質問はあるでしょうか?」

ヒントンは…」北原が、頭の上を置いた。「ノーベル物理学賞受賞したわけでが…

<深層学習/・・・ディープラーニング> を、研究していたわけですね。

それと、<Transfomer> は、どう結びついて、いるのでしょうか?」

「はい…」茜が、うなづいた。「確かに…

その辺りは、説明不足していたかも知れません,ね。

ええと…

ジェフリー ・ ヒントンGeoffrey Everest Hintonは、イギリス生まれ、コンピューター科学者

であり、認知心理学cognitive psychology /・・・精神過程 (例えば…注意、言語使用、 記憶 、 知覚 、問題解

決、 創造性 、 論理的思考 など) に関する、科学的研究。)研究者ですね。

そして…

<ニューラルネットワークの・・・研究> をしていて、AI/人工知能の研究の・・・第

一人者 です。

 

《大規模言語モデルの考察》 (162)        

【● 広く、深く学ぶ・・・Transfomer 】 (49)


米/プリンストン大学Princeton University研究者である、ホップフィールドJohn J.

Hopfieldと共に、2024年度の、ノーベル物理学賞受賞しています。

ええと…

受賞理由は…

<深層学習の・・・基礎を・・・築いた業績> と、いう事ですわ。

ですから、そうした基礎の上に、 Transfomer>  が、登場したことになります」

「それと…」北原が言った。「改めて、聞きますが…

<深層学習/・・・ディープラーニング> の、定義とは、どの様なものですか?」

「はい…」茜が、うなづいた。「ええと、そうですね…


 

                                                           (/ネットより画像借用)


《大規模言語モデルの考察》 (163)     
                                                    (/ネットより画像借用)

【● 広く、深く学ぶ・・・Transfomer 】 (50)


IT用語集 』 によると…

  

<深層学習 (ディープラーニング)> とは・・・

 

深層学習、またはディープラーニングとは・・・

人間の神経細胞の仕組みを再現した、ニューラルネットワークを用いた機械学習の

手法の1つであり、多層構造のニューラルネットワークを用いることが、特徴です。

現在では・・・

画像認識や、音声認識、翻訳など、様々な分野で大きな成果を生み出しています。

深層学習の仕組みを使って、画像認識や、音声認識などを行うには、まず、ラベル付

けされたデータ (教師データ)を用いて、学習させる必要があります。

例えば・・・

手書きの、数字をAI によって認識させたいといった場合、手書きした数字の画像と、

その画像に書かれた正しい数字を示したラベルをセットにした、教師データを用意し、

多層構造のニューラルネットワークに入力します。

この教師データを使って、自動的に学習を行い、手書き数字を認識できるようになる、

という仕組みです。

ただ・・・

認識精度を高めるためには・・・

膨大な量の学習データが必要であり、従来はそれを用意することが困難でした。しか

し現在は、インターネットの普及などによって膨大なデータを用意することが可能にな

っています。

また・・・

学習には・・・

膨大な計算を行う必要がありますが、これもコンピューターの進化によって、短時間

で、学習できる環境を整えられるようになりました。このように、環境が整備されたこ

とも、深層学習が、進化した大きな要因です。


  


…と、いう事ですね」

「はい…」北原が、を傾げ、うなづいた。