最近は忙しい。
書こうと思っているけれどもなかなか書けない。ネタがないわけではないが、まだまとまっていないから書けない。就活のこととか書きたいと思うし、数学のことやプログラミングやロシア語などもまとめなければならないが、なかなか難しい。
今回は最近思いついたことを書きたいと思う。
私はAI(深層学習)について勉強している。楽しいといえば楽しい。AIを学ぶことによって、新しい知識を得たのもそうだし、新しい知見が発見したことも事実である。例えば、変分法のアルゴリズム的側面の重要性を認識させられた。
AIを勉強しているが、AIは大量のデータを与えることによって、自動的に特徴量を抽出する。大量のデータを与えることによって、目の前にあるものがコーヒーなのかそうでないのかがわかるのである。
これは逆に言えば、ある画像を認識するためには、いちいち大量のデータを与えなければならないと言うことである。これはある意味で非効率的である。というのも、例えば、コーヒーを認識する機械がようやくできたとして、次にカフェオレを認識しようとすると、また今度はカフェオレのデータを大量に用意しなければならないのである。
これに対して、人間は「類似」という考えによって、そのような非効率的な方法を取らない。つまり、たとえ最初にコーヒーを認識するまでに時間がかかろうとも、次にカフェオレが与えられたとき、コーヒーと同じぐらいの時間をかけずとも容易にカフェオレを理解することができるのである。「カフェオレはこれまで知っているコーヒーに似ている。こことここが同じであるが、ここは違う。味はカフェオレの方が明るい。」などと前の経験を活かして、アナロジーによって少し異なっている概念を容易に習得することができるのである。
「逐一大量のデータを与えなければ物体を認識することができない」というのは非効率的である。一方、類似性などによる認識方法は効率的である。おそらく人間の進化の過程でそのような認識方法を取得したのだと思う。
私はこれまで知っているものとは少し異なる対象に対して、少しのデータから認識できる方法を考えている。コーヒーを認識した機械に対して、たった一枚のカフェオレの画像を与えれば、それでコーヒーとカフェオレと識別できるような方法である。
人間にとっては容易なことも機械にはまだまだ全然できないんだよーーーそう言いたかった。
しかし、一見、非効率的に見える機械学習的方法は、実はいいところもあるということである。つまり、「バイアスがない」ということである。たとえ少し違ったものであったとしても逐一、データを入れなければならないということは、過去のデータに影響されない。対して、我々はアナロジー的思考によってしばしばバイアスが生じてしまうということである。「カフェオレはコーヒーに似ているから苦いのだろう」などである。別の例では、医療とかでバイアスによって誤診をしてしまうかもしれない。機械学習ではそのようなバイアスの心配はない。
機械学習的方法と人間的方法のどちらがいいのかはわからない。だが、人間には機械学習的非効率的方法は使えない。もしも機械はその両方の方法が使えるのようになったら、時と場合によって使い分けができるかもしれない。そうなれば機械は..... 人間を超えるのかもしれない。
あぁ、就活で家族が最悪だ。喧嘩になるは怒鳴るわで散々。ストレス溜まるわ。
僕から以上