概要 コンピュータが自然言語の意味を理解しているのかをテストするウィノグラードスキーマ問題というのがある。2019年時点では250問のウィノグラードスキーマ問題に対して、その正解率は最大で約61%だった。 今回ChatGPT-4で試したら91.5%(正解数 250問/総…
引用をストックしました
引用するにはまずログインしてください
引用をストックできませんでした。再度お試しください
限定公開記事のため引用できません。