2013年11月25日
「ロボットは東大に入れるか」発表会(11/23)レポート
通称「東ロボくんプロジェクト」。NHKでも報道があった通り,発表会があったので参加してきた。以下にレポートを書いたが,超長くなったので,簡潔に先にまとめておく。
・入試は「暗記とパターン」だが,パターン作りというのは,実際には高度な人間の知的能力。だから大学入試を選んだ。
・最終的にコンピュータに身につけて欲しい能力(=東大入試突破に必要な能力)は3つ。「深く正確な(自然言語の)構文解析と意味合成」・「パラフレーズ同定」・「文章の要約」。これらは現在の人工知能ではできない。
・ただし,今回は初回なので,挑戦する入試をセンター試験(模試)に絞った。また,最終的に欲しい能力を目指す本質的な研究ではなく,今回は,小手先の,現状可能なアプローチだけで,どれだけセンター試験で得点できるかに挑戦した。そのセンター模試の結果は約4割の得点率(387/900)。足切り回避まで,まだまだ先は長い。
(筆者注:ただし,人間で言う「未履修分野」が多く,それを詰めれば現状のアプローチだけでセンターはかなり攻略できてしまいそう。)
・このセンター模試の成績を偏差値に換算すると,5教科7科目だと45.0だが,私文系3科目なら47.7。これで見ると,けっこう入れる大学がある。カウントすると404大学でA判定が出る。これを世間はどう受け止めるか。
(筆者注:ただし,学科は不問なので不人気学科ばっかり,国公立大学は事実上ゼロで,私大はボーダーフリーが多い。また,上述のようにほぼセンター式の入試にしか対応していないので,記述式が課されてる大学は受からないと思われる。まだまだロボットがちゃんと受かる大学はそう多くない。)
ということで,詳細は以下。ただし,筆者は情報系が専門ではないので,その辺は注意いただきたい。午前の部が研究者向け,午後の分が一般向けの話で,両方聞いたが,ほぼ同じ話をしていたので,基本的に午後の部を基盤に,一部午前の部の話を入れて書いていく。午後の部は国立情報学研究所側の分析の後,代ゼミ側講師の「東ロボくんを擬人化した上での学習アドバイス」という形で進行した。後者の発表内容は「代ゼミ:」とつけて区別した。
・入試は「暗記とパターン」だが,パターン作りというのは,実際には高度な人間の知的能力。だから大学入試を選んだ。
・最終的にコンピュータに身につけて欲しい能力(=東大入試突破に必要な能力)は3つ。「深く正確な(自然言語の)構文解析と意味合成」・「パラフレーズ同定」・「文章の要約」。これらは現在の人工知能ではできない。
・ただし,今回は初回なので,挑戦する入試をセンター試験(模試)に絞った。また,最終的に欲しい能力を目指す本質的な研究ではなく,今回は,小手先の,現状可能なアプローチだけで,どれだけセンター試験で得点できるかに挑戦した。そのセンター模試の結果は約4割の得点率(387/900)。足切り回避まで,まだまだ先は長い。
(筆者注:ただし,人間で言う「未履修分野」が多く,それを詰めれば現状のアプローチだけでセンターはかなり攻略できてしまいそう。)
・このセンター模試の成績を偏差値に換算すると,5教科7科目だと45.0だが,私文系3科目なら47.7。これで見ると,けっこう入れる大学がある。カウントすると404大学でA判定が出る。これを世間はどう受け止めるか。
(筆者注:ただし,学科は不問なので不人気学科ばっかり,国公立大学は事実上ゼロで,私大はボーダーフリーが多い。また,上述のようにほぼセンター式の入試にしか対応していないので,記述式が課されてる大学は受からないと思われる。まだまだロボットがちゃんと受かる大学はそう多くない。)
ということで,詳細は以下。ただし,筆者は情報系が専門ではないので,その辺は注意いただきたい。午前の部が研究者向け,午後の分が一般向けの話で,両方聞いたが,ほぼ同じ話をしていたので,基本的に午後の部を基盤に,一部午前の部の話を入れて書いていく。午後の部は国立情報学研究所側の分析の後,代ゼミ側講師の「東ロボくんを擬人化した上での学習アドバイス」という形で進行した。後者の発表内容は「代ゼミ:」とつけて区別した。
新井紀子先生の開会の言葉とプロジェクトの趣旨
・主催は国立情報学研究所。共催は富士通と代々木ゼミナール。富士通は,主に数学の研究を共同でやっている。代ゼミは入試問題,及び入試情報の提供。
・発案は2010年,2011年にキックオフ。ただし本格的に「東ロボくん」が受験勉強を始めたのは半年前ほどで,2013年の今回が初の発表。まだまだ東大合格には程遠いが,途中過程を見せることは社会と科学リテラシーを共有する上で意味があると考え,成果の発表会を開くこととした。人工知能にもできないことがあるということは科学リテラシーの共有において重要だと考えた。2016年のセンター足切り突破,2021年(2022年春)の文科の二次試験合格を目標としている。
・目的は「リアルデータを用いた,人工知能をフェアな評価の俎上に乗せ,真の技術的ブレイクスルーを図る」。20年後,コンピュータが発展した未来はどうなっているか,を目撃したい。
・「入試は暗記とパターンではないのか」としばしば聞かれるが,人間のパターンづくりは実際には極めて高度なことをやっている。現状の人工知能では困難。だからこそ,大学入試をチャレンジ先として選んだ。
→ この困難なポイントのうち,東大二次試験突破に向けて必要な能力を具体的に3点挙げると,「深く正確な(自然言語の)構文解析と意味合成」・「パラフレーズ同定」・「文章の要約」。特に3つめの「文章要約」が可能になったら,影響を受けないホワイトカラーの職業は存在しないだろう。
(筆者注:パラフレーズ同定は専門用語らしくぱっとはわからなかったが,「同義語・言い換えの同定・類推」あたりで大体間違ってないっぽい。)
<筆者感想>
目的が明確で,当初思ってたよりもおもしろいプロジェクトだと思った。確かに,これらができるようになるということは,いわゆる文系の能力として必要なものはおおよそ代替できてしまうということで,それは東大二次試験突破とかそういう話ではない。実現するのかどうかすごく不安だが,追えるだけ追っていきたいと思う。それはそれとして,新井先生が東ロボくんを完全に「我が子」「うちの子」と呼んでおり,擬人化が激しくて笑った。
教科全般の話
・基本的に,国立情報学研究所の面々の専門は「自然言語処理」。しかし,大学入試を解く上で,自然言語以外の部分も必要になってくる。具体的に言うと,数式処理と図表の処理。
・そこでまず,数式処理の部分は富士通の協力が入っている。また,現在の研究段階では,図表の読み取りはできない。今回については,アノテーションを付して図表をテキストデータに変換し,自然言語として処理させた。例えば世界史で,古代中国の地図で点a・bの地名を答えさせる問題は,あらかじめ「点a:長安(大興城),点b:洛陽」と人間の側で入力してから解かせた。
<筆者感想>
この辺はもっと詳しい説明が欲しかった。将来的には図像処理の専門家を招いてここも自動化するのか,それとも最後までアノテーションというチートを使ってしまうのか。例示で出された問題について言えば,点aが長安であるという同定自体が最大の難所なので,現時点で東ロボくんはチート使用と言わざるをえない。
社会科(ほぼ世界史)
・社会科は暗記科目だから,教科書の丸暗記で解答できるのではないか?というところからスタート。山川出版社と東京書籍から世界史B・日本史Bの電子データをもらって記憶させた。その上で,歴史用語のセットがどの程度の頻度で同一の章・パラグラフに登場するか,によって正誤文を判定させた。
・たとえば,問題の選択肢に「アケメネス朝のダレイオス1世は,王の道を建設し,駅伝制を敷いた。」というものがあった場合。東ロボくんは山川の世界史Bの教科書を検索し,「ダレイオス1世は,国道として王の道を建設し,駅伝制を敷いた。」という文章を見つけて,これを正文と判断する,という感じ。
・これがけっこううまくいって,世界史Bが58点,日本史Bが56点。これはセンター社会科の点数としては人並み。(筆者注:センター試験の社会科は,おおよそ平均点が60点前後。)
・ただし,問題はある。用語の取り替えではないところの正誤判定は弱い。たとえば,前出の問題文であれば「アケメネス朝のダレイオス1世は,王の道を建設し,駅伝制を”敷かなかった”。」であったとしても,東ロボくんはこれを正文と判断してしまう。なぜなら,文の意味を理解して解答できているわけではなく,「ダレイオス1世」「王の道」「駅伝制」という文字だけ拾って判断しているから。また,少しでも教科書と表現が違うと,それも誤文としてはじいてしまう。これらを乗り越えるためには,新井先生が掲げた「深く正確な(自然言語の)構文解析と意味合成」「パラフレーズ同定」が必要になってくる。今後の最大の課題。
・あと,教科書上の離れた文章同士で出てくるトピックに関する問いは苦手。離れているということは無関係と判断し,誤文と判定してしまう。
・代ゼミ:この「離れたトピック」へのアプローチが苦手なのは,実は人間の受験生も同じ。その意味で,東ロボくんの解答は,社会科に限定すると非常に人間くさい。たとえば人間も東南アジア史は苦手だが,東ロボくんも東南アジア史で壊滅していた。これは興味深いポイント。また,東ロボくんの解法は極めて早慶上智向きで,今の解法では二次の論述がまるで解けないが,これをどう攻略するのか期待したい。
(筆者注:東南アジアの話は,たとえば「義浄はシュリーヴィジャヤのパレンバンに立ち寄った」という文。これは正文だが,教科書の構成上,シュリーヴィジャヤは古代インド・東南アジアの章で出てくるが,義浄は中国史の唐の文化のページで出てくる。当然近接しておらず,さらっと読んだ分には無関係に見える。東ロボくん的には,これは誤文になってしまう。)
<筆者感想>
最大の疑問は,教科書の電子データしか用いず,用語集を用いていないこと。東ロボくん的な解法ならなおさら用語集は必須であるはず。まずはアルゴリズムの改善とか言っている場合じゃない。早く山川出版社から用語集の電子データをもらってくるのだ。また,結果的に数学に次いで出来が良かったのが社会科なわけだが,意外と言えば意外だし、妥当と言えば妥当。確かにセンターレベルの社会科は,用語集的なデータさえ詰められれば,現在の手法のままでも,85点くらいまでは取れてしまうと思う(=足切りは突破可能)。意外と有望かも。まるで必要な能力の違う,二次試験のことを考えなければ,だが。
国語(ほぼ現代文)
・発表者は名古屋大学工学部の教授。今回のプロジェクトでは現在唯一の”外様”。
・解法は,やはり社会科とほぼ同じ。もちろん,教科書ではなくて評論や小説の「本文」と,選択肢に登場する単語の一致数で正誤判定を行った。小説は感情表現(喜怒哀楽)の文字に,重点をつける操作を追加で施した。
・そんないい加減なやり方では無理だろうと思っていたが,何年度か模試と本試を解いてみたところ,平均的な得点はなんと5割をマーク。最高点は70点弱。それでいいのかセンター試験。一致する文字数をカウントして,一番多かった選択肢を正しいとみなしているだけなんだぞ(会場爆笑)。ただ,英語同様に点数のブレが非常に激しく,今回解いた代ゼミ模試は42点(100点満点)と伸び悩んだ。安定性が必要。
・また,やはり社会科と同様の悩みで,95%本文と同じ説明が続いた語尾に「ではない。」のような否定詞をつけられても,東ロボくんは正文と見なしてしまう。意味を理解して解いているわけではないのは同じ。このアプローチは早くも限界が見えてきているので,現状のようなエンジニアリングな手法ではなく,サイエンティフィックな手法を考えていきたい。
・代ゼミ:研究者の指摘通り,問題文の文字数を追っているだけなので,因果関係の逆転に弱い。「○○だから,××」を「××だから,○○」と読んで落とした問題があった。また,辞書的な意味を答えるのは得意だが,文脈に沿ったニュアンスの違いを含んだ言葉の意味を捉えることはできていない。やっぱり,文章読解や意味理解ということころにまでまだ至っていない。が,センター現代文は難易度が高いので,現時点でこれだけとれているというのは将来有望だと思う。
・一応,古文は20点(50点満点),漢文は未履修につき0点(同50点満点),合計は62点(200点満点)。
<筆者感想>
講演者が代ゼミ講師顔負けの話のうまい人で,会場をどっかんどっかん沸かせていた。外様とのことだが,アプローチが内部でやってる英語・社会科とほぼ同じになったのはおもしろいところで。それだけに詰まっているところも同じなのだが。とはいえ,平均50点,最高70点は本当にすごい。代ゼミの講師の指摘通り,センター現代文は多くの受験生のセンター対策で最後まで鬼門で,70点を一度も取ったことがない人も多いはず。特に小説がコンスタントに5割付近とれているのは驚愕している。もう逆輸入して人間も同じ手法で解けばいいんじゃないか。一致する文字数を数える解法。どうすか。
英語(午前の部のみ)
・使っている推論の体系はおおよそ国語に近い。本文から拾ってきて,選択肢と比較。
・点数にブレがあり,今回のように52点だったこともあれば,他の年度のセンター模試や本試では80点代だったこともあった。国語同様,安定性も課題。
<筆者感想>
何より発表者が高校生だったことに驚き。これは日本の将来明るいわ。発表そのものはたどたどしかったが,これからがんばってほしい。本人が「自分の大学受験に役立てばいいと思って始めたが,全然役立ってない」と言っていたのが印象的だったかな。
物理(午前の部のみ)
・東ロボくんの物理の解き方は,問題文や図像をコンピュータの読める形式表現に変換し,それをシミュレーションを使って(メモリ内で)実験させ,解答を出させる。ただし,前述の通り,今回は問題文や図像の形式表現変換は半自動。
・結果は39点(100点満点)。伸び悩んだ原因として,1.シミュレーション自体に不備がある。これは「未履修分野」が存在しているようなものなので,新たなシミュレーションの実装や,モジュールのバグ取りが進めばなんとかなるかも。
・2.形式表現変換の困難さ。現状,問題文や図像をコンピュータが読解できる形式に変換すること自体がかなり難しく,解答不能どころか解答未着手の問題が多かった。特に図像は,高校物理独特の表現が多く,アノテーションつきでも辛い。
<筆者感想>
そもそもなぜ理科は物理を選んだのか。東大文科の受験生なら多数派は生物だろうし,自然言語処理による入試突破が目標なら,なおさら国語的な能力が問われる生物が適切ではなかったか。それはそれとして,高校理科は大学以降の理科と別物で独特,という話はよく聞くところであるので,それがコンピュータを阻害しているというのはおもしろい話かも。
数学
・アプローチは物理と同じ。まず日本語(自然言語)をコンピュータが理解できる形式に変換し,それをあからじめ記憶させている解法にあてはめさせて解かせる。他の科目同様,日本語からの形式変換は半自動,以後は完全自動という状態だが,形式変換も完全自動化させる方向で考えている。
・唯一,センター模試と東大型模試の両方解いた。結果,東大型の模試は得点率50%(文科で40/80)と受験生の平均点(30点ほど)を大きく上回ったが,センター型模試は数1Aが60点,2Bが40点(ともに満点は100点)と壊滅した。普通は東大二次がそれだけ解けたなら,センターは両方90点取れるはず。
・東大二次については,解けなかった問題はまだ解法をコンピュータに覚えさせていない,すなわち「未履修分野」があるのが原因の一つ。今回で言えば,三角関数や確率は未履修分野だった。これは時間をかけて覚えさせていけば攻略できるようになるだろう。もう一つの原因が根深い問題で,形式変換がうまくいかないと,東ロボくんの計算量が爆発的に増えてしまい,なんと試験時間の100分をタイムオーバーする。研究者の方はこれを計算量爆発と呼んでいたが,この計算量はどのくらいひどいかというと,現在のどんなスパコンを用いても100分では処理できないらしい。現行の処理では特にXY座標を使った問題で計算量爆発が起きやすく,今後の最大の課題かも,とのこと。
・センター試験が解けなかった原因は,東ロボくんは自分のやり方で解きたがるため,センター試験についている誘導はむしろ邪魔であり,東ロボくんの選んだ解法と誘導がそれた瞬間白紙解答になる,という現象が発生した。
・代ゼミ:実はセンターにしろ東大二次にしろ,東ロボくんのような解答をしてくる受験生はときどき見かける。こうした受験生に共通する性格として「短気」であることが挙げられ,つまり東ロボくんも普段の性格は短気なのだろうと想像できる(ここで会場大爆笑)。まずは根気を身につけて,一見解けないように見える問題でも,腰を落ち着けてじっくりとりかかることが重要ではないか。
<筆者感想>
解法の選択ミスにより計算量爆発が起きてタイムオーバーするのは人間の受験生でもしばしばやってしまう現象だが,まさかコンピュータが同じことやらかすとは思ってもみなかった。社会科に続いて非常に人間くさい話である。しかし,さすがに二次試験まで到達しているあたり,根本的な相性は全科目で一番良いのだろう。エースとしてがんばってほしいところだ。
代ゼミ側による総評
・センターでは900点満点で400点を割っている。これでは東大の二次は足切りにあう。
・それはそれとして置いといて,現状の偏差値は5教科7科目で45.0だが,これを私文系3科目にすると47.7になる。これで見ると,けっこう入れる大学が多い。カウントすると404大学。
(筆者注:ただし,多くはボーダーフリーの大学である。また,学部学科は問わない状態であるため,不人気学科を選べば,という前提。また,国公立大学は事実上のゼロ。)
・現状のロボットで,多くの私立大学に入れてしまうというのは,1つの事件と言えるのではないか。東ロボくんの今後に期待。
<筆者の全体感想>
どの教科もスタートということで,とりあえずの結果を出そうという姿勢だったように思う。国語の担当者の言を借りれば,どの科目もエンジニアリング的な手法でサイエンティフィックな手法ではなかった。しかし一方で,そもそもセンター試験を解くのにサイエンティフィックな能力はそれほど重要ではなく,エンジニアリングの手法だけでまだまだ点が伸びそうというあたり,むしろマークシート形式自体の限界が見えるのではないか。やっぱ二次試験必要だわ,という熱い現政権批判ができそうな結論が自分の中で出た。
一方,東大二次試験についてはやはりサイエンティフィックな手法が必要で,はっきり言ってしまうと今回までの研究で新井先生の言う3つの能力(「深く正確な(自然言語の)構文解析と意味合成」・「パラフレーズ同定」・「文章の要約」)への挑戦は,失敗していたかそもそも挑戦してなかったかのいずれかであった。次回の発表会では,サイエンティフィックな方向での進化が見たいところである。
・主催は国立情報学研究所。共催は富士通と代々木ゼミナール。富士通は,主に数学の研究を共同でやっている。代ゼミは入試問題,及び入試情報の提供。
・発案は2010年,2011年にキックオフ。ただし本格的に「東ロボくん」が受験勉強を始めたのは半年前ほどで,2013年の今回が初の発表。まだまだ東大合格には程遠いが,途中過程を見せることは社会と科学リテラシーを共有する上で意味があると考え,成果の発表会を開くこととした。人工知能にもできないことがあるということは科学リテラシーの共有において重要だと考えた。2016年のセンター足切り突破,2021年(2022年春)の文科の二次試験合格を目標としている。
・目的は「リアルデータを用いた,人工知能をフェアな評価の俎上に乗せ,真の技術的ブレイクスルーを図る」。20年後,コンピュータが発展した未来はどうなっているか,を目撃したい。
・「入試は暗記とパターンではないのか」としばしば聞かれるが,人間のパターンづくりは実際には極めて高度なことをやっている。現状の人工知能では困難。だからこそ,大学入試をチャレンジ先として選んだ。
→ この困難なポイントのうち,東大二次試験突破に向けて必要な能力を具体的に3点挙げると,「深く正確な(自然言語の)構文解析と意味合成」・「パラフレーズ同定」・「文章の要約」。特に3つめの「文章要約」が可能になったら,影響を受けないホワイトカラーの職業は存在しないだろう。
(筆者注:パラフレーズ同定は専門用語らしくぱっとはわからなかったが,「同義語・言い換えの同定・類推」あたりで大体間違ってないっぽい。)
<筆者感想>
目的が明確で,当初思ってたよりもおもしろいプロジェクトだと思った。確かに,これらができるようになるということは,いわゆる文系の能力として必要なものはおおよそ代替できてしまうということで,それは東大二次試験突破とかそういう話ではない。実現するのかどうかすごく不安だが,追えるだけ追っていきたいと思う。それはそれとして,新井先生が東ロボくんを完全に「我が子」「うちの子」と呼んでおり,擬人化が激しくて笑った。
教科全般の話
・基本的に,国立情報学研究所の面々の専門は「自然言語処理」。しかし,大学入試を解く上で,自然言語以外の部分も必要になってくる。具体的に言うと,数式処理と図表の処理。
・そこでまず,数式処理の部分は富士通の協力が入っている。また,現在の研究段階では,図表の読み取りはできない。今回については,アノテーションを付して図表をテキストデータに変換し,自然言語として処理させた。例えば世界史で,古代中国の地図で点a・bの地名を答えさせる問題は,あらかじめ「点a:長安(大興城),点b:洛陽」と人間の側で入力してから解かせた。
<筆者感想>
この辺はもっと詳しい説明が欲しかった。将来的には図像処理の専門家を招いてここも自動化するのか,それとも最後までアノテーションというチートを使ってしまうのか。例示で出された問題について言えば,点aが長安であるという同定自体が最大の難所なので,現時点で東ロボくんはチート使用と言わざるをえない。
社会科(ほぼ世界史)
・社会科は暗記科目だから,教科書の丸暗記で解答できるのではないか?というところからスタート。山川出版社と東京書籍から世界史B・日本史Bの電子データをもらって記憶させた。その上で,歴史用語のセットがどの程度の頻度で同一の章・パラグラフに登場するか,によって正誤文を判定させた。
・たとえば,問題の選択肢に「アケメネス朝のダレイオス1世は,王の道を建設し,駅伝制を敷いた。」というものがあった場合。東ロボくんは山川の世界史Bの教科書を検索し,「ダレイオス1世は,国道として王の道を建設し,駅伝制を敷いた。」という文章を見つけて,これを正文と判断する,という感じ。
・これがけっこううまくいって,世界史Bが58点,日本史Bが56点。これはセンター社会科の点数としては人並み。(筆者注:センター試験の社会科は,おおよそ平均点が60点前後。)
・ただし,問題はある。用語の取り替えではないところの正誤判定は弱い。たとえば,前出の問題文であれば「アケメネス朝のダレイオス1世は,王の道を建設し,駅伝制を”敷かなかった”。」であったとしても,東ロボくんはこれを正文と判断してしまう。なぜなら,文の意味を理解して解答できているわけではなく,「ダレイオス1世」「王の道」「駅伝制」という文字だけ拾って判断しているから。また,少しでも教科書と表現が違うと,それも誤文としてはじいてしまう。これらを乗り越えるためには,新井先生が掲げた「深く正確な(自然言語の)構文解析と意味合成」「パラフレーズ同定」が必要になってくる。今後の最大の課題。
・あと,教科書上の離れた文章同士で出てくるトピックに関する問いは苦手。離れているということは無関係と判断し,誤文と判定してしまう。
・代ゼミ:この「離れたトピック」へのアプローチが苦手なのは,実は人間の受験生も同じ。その意味で,東ロボくんの解答は,社会科に限定すると非常に人間くさい。たとえば人間も東南アジア史は苦手だが,東ロボくんも東南アジア史で壊滅していた。これは興味深いポイント。また,東ロボくんの解法は極めて早慶上智向きで,今の解法では二次の論述がまるで解けないが,これをどう攻略するのか期待したい。
(筆者注:東南アジアの話は,たとえば「義浄はシュリーヴィジャヤのパレンバンに立ち寄った」という文。これは正文だが,教科書の構成上,シュリーヴィジャヤは古代インド・東南アジアの章で出てくるが,義浄は中国史の唐の文化のページで出てくる。当然近接しておらず,さらっと読んだ分には無関係に見える。東ロボくん的には,これは誤文になってしまう。)
<筆者感想>
最大の疑問は,教科書の電子データしか用いず,用語集を用いていないこと。東ロボくん的な解法ならなおさら用語集は必須であるはず。まずはアルゴリズムの改善とか言っている場合じゃない。早く山川出版社から用語集の電子データをもらってくるのだ。また,結果的に数学に次いで出来が良かったのが社会科なわけだが,意外と言えば意外だし、妥当と言えば妥当。確かにセンターレベルの社会科は,用語集的なデータさえ詰められれば,現在の手法のままでも,85点くらいまでは取れてしまうと思う(=足切りは突破可能)。意外と有望かも。まるで必要な能力の違う,二次試験のことを考えなければ,だが。
国語(ほぼ現代文)
・発表者は名古屋大学工学部の教授。今回のプロジェクトでは現在唯一の”外様”。
・解法は,やはり社会科とほぼ同じ。もちろん,教科書ではなくて評論や小説の「本文」と,選択肢に登場する単語の一致数で正誤判定を行った。小説は感情表現(喜怒哀楽)の文字に,重点をつける操作を追加で施した。
・そんないい加減なやり方では無理だろうと思っていたが,何年度か模試と本試を解いてみたところ,平均的な得点はなんと5割をマーク。最高点は70点弱。それでいいのかセンター試験。一致する文字数をカウントして,一番多かった選択肢を正しいとみなしているだけなんだぞ(会場爆笑)。ただ,英語同様に点数のブレが非常に激しく,今回解いた代ゼミ模試は42点(100点満点)と伸び悩んだ。安定性が必要。
・また,やはり社会科と同様の悩みで,95%本文と同じ説明が続いた語尾に「ではない。」のような否定詞をつけられても,東ロボくんは正文と見なしてしまう。意味を理解して解いているわけではないのは同じ。このアプローチは早くも限界が見えてきているので,現状のようなエンジニアリングな手法ではなく,サイエンティフィックな手法を考えていきたい。
・代ゼミ:研究者の指摘通り,問題文の文字数を追っているだけなので,因果関係の逆転に弱い。「○○だから,××」を「××だから,○○」と読んで落とした問題があった。また,辞書的な意味を答えるのは得意だが,文脈に沿ったニュアンスの違いを含んだ言葉の意味を捉えることはできていない。やっぱり,文章読解や意味理解ということころにまでまだ至っていない。が,センター現代文は難易度が高いので,現時点でこれだけとれているというのは将来有望だと思う。
・一応,古文は20点(50点満点),漢文は未履修につき0点(同50点満点),合計は62点(200点満点)。
<筆者感想>
講演者が代ゼミ講師顔負けの話のうまい人で,会場をどっかんどっかん沸かせていた。外様とのことだが,アプローチが内部でやってる英語・社会科とほぼ同じになったのはおもしろいところで。それだけに詰まっているところも同じなのだが。とはいえ,平均50点,最高70点は本当にすごい。代ゼミの講師の指摘通り,センター現代文は多くの受験生のセンター対策で最後まで鬼門で,70点を一度も取ったことがない人も多いはず。特に小説がコンスタントに5割付近とれているのは驚愕している。もう逆輸入して人間も同じ手法で解けばいいんじゃないか。一致する文字数を数える解法。どうすか。
英語(午前の部のみ)
・使っている推論の体系はおおよそ国語に近い。本文から拾ってきて,選択肢と比較。
・点数にブレがあり,今回のように52点だったこともあれば,他の年度のセンター模試や本試では80点代だったこともあった。国語同様,安定性も課題。
<筆者感想>
何より発表者が高校生だったことに驚き。これは日本の将来明るいわ。発表そのものはたどたどしかったが,これからがんばってほしい。本人が「自分の大学受験に役立てばいいと思って始めたが,全然役立ってない」と言っていたのが印象的だったかな。
物理(午前の部のみ)
・東ロボくんの物理の解き方は,問題文や図像をコンピュータの読める形式表現に変換し,それをシミュレーションを使って(メモリ内で)実験させ,解答を出させる。ただし,前述の通り,今回は問題文や図像の形式表現変換は半自動。
・結果は39点(100点満点)。伸び悩んだ原因として,1.シミュレーション自体に不備がある。これは「未履修分野」が存在しているようなものなので,新たなシミュレーションの実装や,モジュールのバグ取りが進めばなんとかなるかも。
・2.形式表現変換の困難さ。現状,問題文や図像をコンピュータが読解できる形式に変換すること自体がかなり難しく,解答不能どころか解答未着手の問題が多かった。特に図像は,高校物理独特の表現が多く,アノテーションつきでも辛い。
<筆者感想>
そもそもなぜ理科は物理を選んだのか。東大文科の受験生なら多数派は生物だろうし,自然言語処理による入試突破が目標なら,なおさら国語的な能力が問われる生物が適切ではなかったか。それはそれとして,高校理科は大学以降の理科と別物で独特,という話はよく聞くところであるので,それがコンピュータを阻害しているというのはおもしろい話かも。
数学
・アプローチは物理と同じ。まず日本語(自然言語)をコンピュータが理解できる形式に変換し,それをあからじめ記憶させている解法にあてはめさせて解かせる。他の科目同様,日本語からの形式変換は半自動,以後は完全自動という状態だが,形式変換も完全自動化させる方向で考えている。
・唯一,センター模試と東大型模試の両方解いた。結果,東大型の模試は得点率50%(文科で40/80)と受験生の平均点(30点ほど)を大きく上回ったが,センター型模試は数1Aが60点,2Bが40点(ともに満点は100点)と壊滅した。普通は東大二次がそれだけ解けたなら,センターは両方90点取れるはず。
・東大二次については,解けなかった問題はまだ解法をコンピュータに覚えさせていない,すなわち「未履修分野」があるのが原因の一つ。今回で言えば,三角関数や確率は未履修分野だった。これは時間をかけて覚えさせていけば攻略できるようになるだろう。もう一つの原因が根深い問題で,形式変換がうまくいかないと,東ロボくんの計算量が爆発的に増えてしまい,なんと試験時間の100分をタイムオーバーする。研究者の方はこれを計算量爆発と呼んでいたが,この計算量はどのくらいひどいかというと,現在のどんなスパコンを用いても100分では処理できないらしい。現行の処理では特にXY座標を使った問題で計算量爆発が起きやすく,今後の最大の課題かも,とのこと。
・センター試験が解けなかった原因は,東ロボくんは自分のやり方で解きたがるため,センター試験についている誘導はむしろ邪魔であり,東ロボくんの選んだ解法と誘導がそれた瞬間白紙解答になる,という現象が発生した。
・代ゼミ:実はセンターにしろ東大二次にしろ,東ロボくんのような解答をしてくる受験生はときどき見かける。こうした受験生に共通する性格として「短気」であることが挙げられ,つまり東ロボくんも普段の性格は短気なのだろうと想像できる(ここで会場大爆笑)。まずは根気を身につけて,一見解けないように見える問題でも,腰を落ち着けてじっくりとりかかることが重要ではないか。
<筆者感想>
解法の選択ミスにより計算量爆発が起きてタイムオーバーするのは人間の受験生でもしばしばやってしまう現象だが,まさかコンピュータが同じことやらかすとは思ってもみなかった。社会科に続いて非常に人間くさい話である。しかし,さすがに二次試験まで到達しているあたり,根本的な相性は全科目で一番良いのだろう。エースとしてがんばってほしいところだ。
代ゼミ側による総評
・センターでは900点満点で400点を割っている。これでは東大の二次は足切りにあう。
・それはそれとして置いといて,現状の偏差値は5教科7科目で45.0だが,これを私文系3科目にすると47.7になる。これで見ると,けっこう入れる大学が多い。カウントすると404大学。
(筆者注:ただし,多くはボーダーフリーの大学である。また,学部学科は問わない状態であるため,不人気学科を選べば,という前提。また,国公立大学は事実上のゼロ。)
・現状のロボットで,多くの私立大学に入れてしまうというのは,1つの事件と言えるのではないか。東ロボくんの今後に期待。
<筆者の全体感想>
どの教科もスタートということで,とりあえずの結果を出そうという姿勢だったように思う。国語の担当者の言を借りれば,どの科目もエンジニアリング的な手法でサイエンティフィックな手法ではなかった。しかし一方で,そもそもセンター試験を解くのにサイエンティフィックな能力はそれほど重要ではなく,エンジニアリングの手法だけでまだまだ点が伸びそうというあたり,むしろマークシート形式自体の限界が見えるのではないか。やっぱ二次試験必要だわ,という熱い現政権批判ができそうな結論が自分の中で出た。
一方,東大二次試験についてはやはりサイエンティフィックな手法が必要で,はっきり言ってしまうと今回までの研究で新井先生の言う3つの能力(「深く正確な(自然言語の)構文解析と意味合成」・「パラフレーズ同定」・「文章の要約」)への挑戦は,失敗していたかそもそも挑戦してなかったかのいずれかであった。次回の発表会では,サイエンティフィックな方向での進化が見たいところである。
Posted by dg_law at 00:01│Comments(13)│
この記事へのトラックバックURL
この記事へのコメント
自然言語は解析は出来るけど意味の理解はまだまだって感じですかね
世界史の知識も丸暗記しただけで再構成はできていないみたい
世界史の知識も丸暗記しただけで再構成はできていないみたい
Posted by ike at 2013年11月25日 10:44
今後はその意味の理解,本質的な方向での研究が進んでいくのだと思います。期待しましょう。
>世界史の知識も丸暗記しただけで再構成はできていないみたい
まさにそこが現状コンピュータにはできない部分で,人間が自然にやってしまっている部分ですね。
>世界史の知識も丸暗記しただけで再構成はできていないみたい
まさにそこが現状コンピュータにはできない部分で,人間が自然にやってしまっている部分ですね。
Posted by DG-Law at 2013年11月26日 00:12
初めまして.イベントに参加できなかったもので,もし宜しければその
>計算量爆発と呼んでいた
のは具体的にどのような式であった概略で結構ですのでご教示頂けないでしょうか?
>計算量爆発と呼んでいた
のは具体的にどのような式であった概略で結構ですのでご教示頂けないでしょうか?
Posted by ehito at 2013年11月29日 19:02
東大プレの正解した大問については,東ロボくんの解答用紙が配布されたのでわかっているのですが,誤答(計算量爆発を起こした問題)については配布されなかったので,わかりません。お役に立てず,すみません。
ただし,国立情報学研究所は広く協力を求めており,参加者にはある程度情報が公開されるようですので,問い合わせてみてもいいかもしれません。
http://21robot.org/FAQ/
以下の理系の友人からのコメント。
「東ロボくんの解法は,日本語を逐語訳で(半自動で)意味を付加し,東ロボくん自身がコードに変換しています。
(その理由として,将来的にこの作業も完全自動化を目指しているからだと考えられます。そのため,コードが非常に汚い。)
そのコードを一階論理式に変換し,大学院数学的な処理をしているようです。簡単に言うと,座標空間を定義し,既存の定理によりアルゴリズムからはじき出しているようです。ただし,その過程が”実閉体の体系のRCFの式”,”Tarski-Seidenbergの定理”,”Tarskiの量子化除去アルゴリズム”などという単語が出てくる時点でお察しください。センター数学が解けないわけですよね。
はてなダイアリーの方を拝見いたしました。ehitoさんの手法を用いるのであれば,おっしゃる通り,自然言語処理の側で相当がんばっていただいて,日本語をコードに変換する段階での大きな工夫が必要になるかと思われます。」
ただし,国立情報学研究所は広く協力を求めており,参加者にはある程度情報が公開されるようですので,問い合わせてみてもいいかもしれません。
http://21robot.org/FAQ/
以下の理系の友人からのコメント。
「東ロボくんの解法は,日本語を逐語訳で(半自動で)意味を付加し,東ロボくん自身がコードに変換しています。
(その理由として,将来的にこの作業も完全自動化を目指しているからだと考えられます。そのため,コードが非常に汚い。)
そのコードを一階論理式に変換し,大学院数学的な処理をしているようです。簡単に言うと,座標空間を定義し,既存の定理によりアルゴリズムからはじき出しているようです。ただし,その過程が”実閉体の体系のRCFの式”,”Tarski-Seidenbergの定理”,”Tarskiの量子化除去アルゴリズム”などという単語が出てくる時点でお察しください。センター数学が解けないわけですよね。
はてなダイアリーの方を拝見いたしました。ehitoさんの手法を用いるのであれば,おっしゃる通り,自然言語処理の側で相当がんばっていただいて,日本語をコードに変換する段階での大きな工夫が必要になるかと思われます。」
Posted by DG-Law at 2013年11月30日 00:02
早速のご案内,ありがとうございます.実はリーダーのA先生にも直接メールでお尋ねしたのですが,時期にあらずとのお返事だったもので(涙).
量子化除去(QE)については2011年頃の私のブログに詳述していますが,Seidenbergの方法はQEとしては最も初期のもので,現在の主流は代数的円筒分解(CAD)になっています.と言ってもこれも70年代のものですが...と無駄口を叩いてしまいました.ともあれ,お手数をお掛け致しました.https://twitter.com/atp_cas
量子化除去(QE)については2011年頃の私のブログに詳述していますが,Seidenbergの方法はQEとしては最も初期のもので,現在の主流は代数的円筒分解(CAD)になっています.と言ってもこれも70年代のものですが...と無駄口を叩いてしまいました.ともあれ,お手数をお掛け致しました.https://twitter.com/atp_cas
Posted by ehito at 2013年11月30日 00:43
>「ではない。」のような否定詞をつけられても,
「反対の賛成」=「賛成の反対」だということが、正しく理解できるか。
入試現代文は読みづらい悪文が多いが、決して間違いというわけではないから。
>どの科目もエンジニアリング的な手法でサイエンティフィックな手法ではなかった。
専門の研究者だけで固まっているような感じで、これでは「既成の研究成果」という枠組みからは出られない。
いくら正論でも他人の模倣ならその価値は低く、逆に誤謬であっても独自性があれば価値は高い。
世界のどこにも開発されていない分野を開拓するのであれば、素人の「一発ギャグ」に期待したいところ。
その日は朝から夜だった / 嘉門 達夫
http://petitlyrics.com/kashi/200133/
その日は朝から夜まで雨だった、は通じる。
その日は朝から雨だった、も通じる。
けれども、その日は朝から夜だった、は通じない。
「から」という助詞の解釈にしても、朝とか夜とかは「時間帯」という概念で理解されている必要がある。
朝という時間帯で同時に夜という状況はありえない、コンピュータはこのことを正しく理解しているか。
「概念辞書」の世界 鳥澤 健太郎 - NICT NEWS
http://www.nict.go.jp/publication/NICT-News/0912/02.html
コンピュータは数学でも未だに文章題が苦手であるが、文章題を読み解くための「概念辞書」をどうするかが重要と思う。
特に「共通概念」が掴めるようになれば、苦手の文章題も克服されるものと思われる。例えば、
小学1年生の算数の問題難しすぎワロタ
http://blog.livedoor.jp/nemusoku/archives/27609860.html
こういう数え上げの文章題は、「価格」と「商品」についての組み合わせの問題と理解すれば、
100円が1000円に変わろうと、チョコレートやせんべいがえんぴつや消しゴムに変わっても正しく応用できる。
「反対の賛成」=「賛成の反対」だということが、正しく理解できるか。
入試現代文は読みづらい悪文が多いが、決して間違いというわけではないから。
>どの科目もエンジニアリング的な手法でサイエンティフィックな手法ではなかった。
専門の研究者だけで固まっているような感じで、これでは「既成の研究成果」という枠組みからは出られない。
いくら正論でも他人の模倣ならその価値は低く、逆に誤謬であっても独自性があれば価値は高い。
世界のどこにも開発されていない分野を開拓するのであれば、素人の「一発ギャグ」に期待したいところ。
その日は朝から夜だった / 嘉門 達夫
http://petitlyrics.com/kashi/200133/
その日は朝から夜まで雨だった、は通じる。
その日は朝から雨だった、も通じる。
けれども、その日は朝から夜だった、は通じない。
「から」という助詞の解釈にしても、朝とか夜とかは「時間帯」という概念で理解されている必要がある。
朝という時間帯で同時に夜という状況はありえない、コンピュータはこのことを正しく理解しているか。
「概念辞書」の世界 鳥澤 健太郎 - NICT NEWS
http://www.nict.go.jp/publication/NICT-News/0912/02.html
コンピュータは数学でも未だに文章題が苦手であるが、文章題を読み解くための「概念辞書」をどうするかが重要と思う。
特に「共通概念」が掴めるようになれば、苦手の文章題も克服されるものと思われる。例えば、
小学1年生の算数の問題難しすぎワロタ
http://blog.livedoor.jp/nemusoku/archives/27609860.html
こういう数え上げの文章題は、「価格」と「商品」についての組み合わせの問題と理解すれば、
100円が1000円に変わろうと、チョコレートやせんべいがえんぴつや消しゴムに変わっても正しく応用できる。
Posted by msio at 2013年12月04日 23:41
>特に図像は,高校物理独特の表現が多く,
独特の表現が多いのであれば、それなら却って「この図のこの部分はこう解釈する」とパターン化できると思う。
テンプレートマッチング
パターンを検出するための小さな画像(テンプレート)を用意してお
き、与えられた画像の中を移動させて一致する場所があるか探す
画像同士を照らし合わせるため形の検出が正確
http://www.cc.kyoto-su.ac.jp/~g1045326/images/PowerLunch_20130417_SimilarImage.pdf
この研究では,領域分割アルゴリズムを用いて領域分割を行い,領域ごとの特徴量を利用して領域内の物体を単語に関連付ける手法である。
http://www.kochi-tech.ac.jp/library/ron/2012/g25/M/1155089.pdf
例えば以下のような図柄理解に関しては、「下に凸のカーブと、それに接する円」とも考えられるが、同時に円の内側に接するジェットコースター=「円の内側に接しながら動く物体」が存在すると認識される必要がある。
「宙返り」「ジェットコースターの模型」「車両の運動」だけでは理解困難だろうか。
これは「宙返り」の概念と、「ジェットコースター」が車両のカテゴリーに含まれることが理解できれば十分と思われる。
動物体の進行経路については「途中で宙返り」と書いてあるのだから、その概念に矛盾しないように解読すれば良い。
またどこでどのように「宙返り」するかについての曖昧性解消は、既存の物理シミュレータで何とかなると思う。
この2010年のジェットコースターの問題は、受験生であれば、中央に1回のループがある連続したトラックであると容易に理解できるが、この図だけからでは、下に凸のカーブと、それに接する円とも考えられてしまう。そのどちらであるかは経験に基づく知識が必要であり、人工知能にとっては非常に難しい問題であるという。
http://news.mynavi.jp/articles/2011/12/15/21robot/001.html
独特の表現が多いのであれば、それなら却って「この図のこの部分はこう解釈する」とパターン化できると思う。
テンプレートマッチング
パターンを検出するための小さな画像(テンプレート)を用意してお
き、与えられた画像の中を移動させて一致する場所があるか探す
画像同士を照らし合わせるため形の検出が正確
http://www.cc.kyoto-su.ac.jp/~g1045326/images/PowerLunch_20130417_SimilarImage.pdf
この研究では,領域分割アルゴリズムを用いて領域分割を行い,領域ごとの特徴量を利用して領域内の物体を単語に関連付ける手法である。
http://www.kochi-tech.ac.jp/library/ron/2012/g25/M/1155089.pdf
例えば以下のような図柄理解に関しては、「下に凸のカーブと、それに接する円」とも考えられるが、同時に円の内側に接するジェットコースター=「円の内側に接しながら動く物体」が存在すると認識される必要がある。
「宙返り」「ジェットコースターの模型」「車両の運動」だけでは理解困難だろうか。
これは「宙返り」の概念と、「ジェットコースター」が車両のカテゴリーに含まれることが理解できれば十分と思われる。
動物体の進行経路については「途中で宙返り」と書いてあるのだから、その概念に矛盾しないように解読すれば良い。
またどこでどのように「宙返り」するかについての曖昧性解消は、既存の物理シミュレータで何とかなると思う。
この2010年のジェットコースターの問題は、受験生であれば、中央に1回のループがある連続したトラックであると容易に理解できるが、この図だけからでは、下に凸のカーブと、それに接する円とも考えられてしまう。そのどちらであるかは経験に基づく知識が必要であり、人工知能にとっては非常に難しい問題であるという。
http://news.mynavi.jp/articles/2011/12/15/21robot/001.html
Posted by msio at 2013年12月05日 08:05
>この2010年のジェットコースターの問題は、受験生であれば、中央に1回のループがある連続したトラックであると容易に理解できるが、
本物のジェットコースターはらせん運動であって円運動ではない。この点、入試問題は作為的である。
2.よくある鉛直面内の円運動の入試問題
http://www.shinko-keirin.co.jp/keirinkan/kori/science/buturi/17.html
類似の図柄の問題は2010年以前の他大学でも出題されており、この図のこの部分はこう読むものとインプットするのが良い。
本物のジェットコースターはらせん運動であって円運動ではない。この点、入試問題は作為的である。
2.よくある鉛直面内の円運動の入試問題
http://www.shinko-keirin.co.jp/keirinkan/kori/science/buturi/17.html
類似の図柄の問題は2010年以前の他大学でも出題されており、この図のこの部分はこう読むものとインプットするのが良い。
Posted by msio at 2013年12月05日 23:01
どうリアクションしていいものか悩んでますが。
とりあえず,本コメント欄の方のみならず,ブコメでも勘違いされている方がいますが,「今回は初回だから,とりあえず既存のもの,かつエンジニアリング的にやってみよう」ということでこのような手法をとっただけであって,本研究プロジェクトがエンジニアリング的な手法でしか入試に挑まないわけではありません。
むしろ,これは本質的に”研究”プロジェクトですから,初回の今回だけが例外的であって,次回(来年)からは徐々に科学的手法に移行していくはずです。それを期待して待ちましょう。
言語の意味や概念を人工知能に理解させることは,本プロジェクトの主眼の一つですね。
とりあえず,本コメント欄の方のみならず,ブコメでも勘違いされている方がいますが,「今回は初回だから,とりあえず既存のもの,かつエンジニアリング的にやってみよう」ということでこのような手法をとっただけであって,本研究プロジェクトがエンジニアリング的な手法でしか入試に挑まないわけではありません。
むしろ,これは本質的に”研究”プロジェクトですから,初回の今回だけが例外的であって,次回(来年)からは徐々に科学的手法に移行していくはずです。それを期待して待ちましょう。
言語の意味や概念を人工知能に理解させることは,本プロジェクトの主眼の一つですね。
Posted by DG-Law at 2013年12月06日 00:38
>本コメント欄の方のみならず,ブコメでも勘違いされている方がいますが,
その辺は、熱中しすぎて自分勝手な思い込みで勇み足になってしまったのかもしれませんが、自分としては本プロジェクトは将来的に大きな可能性を秘めていると思っています。特に二次試験の東大理系数学が6題中2題完答を達成しているのに対して、センター試験の数学では平均点前後ってとこに、著しいアンバランスを感じます。
その旨については発表会にでも説明されていましたが、それでも言いたいことは山ほどたったのに、質問の機会も与えられず、また質問サイトも設けられていないので、ここでブチまけてしまいました。ご迷惑おかけして申し訳ありませんでした。
有料でもいいから、「東ロボ」の一般公開と、それについてのサポートシステムも設けて欲しいです。
初回の今回だけが例外的とのことなら、改良後の一般公開の予定時期についても述べて欲しかったです。
その辺は、熱中しすぎて自分勝手な思い込みで勇み足になってしまったのかもしれませんが、自分としては本プロジェクトは将来的に大きな可能性を秘めていると思っています。特に二次試験の東大理系数学が6題中2題完答を達成しているのに対して、センター試験の数学では平均点前後ってとこに、著しいアンバランスを感じます。
その旨については発表会にでも説明されていましたが、それでも言いたいことは山ほどたったのに、質問の機会も与えられず、また質問サイトも設けられていないので、ここでブチまけてしまいました。ご迷惑おかけして申し訳ありませんでした。
有料でもいいから、「東ロボ」の一般公開と、それについてのサポートシステムも設けて欲しいです。
初回の今回だけが例外的とのことなら、改良後の一般公開の予定時期についても述べて欲しかったです。
Posted by msio at 2013年12月06日 20:16
そういうことでしたら,お気になさらず。
あまりにも無関係な内容でない限り,ここのコメント欄は基本的にオープンです。
一応,
>質問の機会も与えられず、
午前の部の研究者向けワークショップと,午後の部の一般向けの間の昼休憩は自由質問OKでした。研究者の方々の昼御飯の邪魔にならない程度に,でしたが。
>また質問サイトも設けられていないので
>有料でもいいから、「東ロボ」の一般公開と、それについてのサポートシステムも設けて欲しいです。
HPで参加者の募集があります。情報学系の研究者であれば,場合によってはある程度の情報がエられるかもしれません。
ただし,↑のehitoさんが数学について質問したところ「時期にあらず」と断られたそうですが……
>初回の今回だけが例外的とのことなら、改良後の一般公開の予定時期についても述べて欲しかったです。
2016年センター試験突破目標だそうですので,それまでには何度か,今回のような報告会が行われると思います。
あまりにも無関係な内容でない限り,ここのコメント欄は基本的にオープンです。
一応,
>質問の機会も与えられず、
午前の部の研究者向けワークショップと,午後の部の一般向けの間の昼休憩は自由質問OKでした。研究者の方々の昼御飯の邪魔にならない程度に,でしたが。
>また質問サイトも設けられていないので
>有料でもいいから、「東ロボ」の一般公開と、それについてのサポートシステムも設けて欲しいです。
HPで参加者の募集があります。情報学系の研究者であれば,場合によってはある程度の情報がエられるかもしれません。
ただし,↑のehitoさんが数学について質問したところ「時期にあらず」と断られたそうですが……
>初回の今回だけが例外的とのことなら、改良後の一般公開の予定時期についても述べて欲しかったです。
2016年センター試験突破目標だそうですので,それまでには何度か,今回のような報告会が行われると思います。
Posted by DG-Law at 2013年12月06日 22:26
>そういうことでしたら,お気になさらず。
>あまりにも無関係な内容でない限り,ここのコメント欄は基本的にオープンです。
レスありがとうございます。
https://twitter.com/motactn
私、ツイッターもやっておりまして、最近は東ロボと自然言語処理に凝って、それについていろいろ考察しております。
必ずしも研究者の興味を引くような内容かどうかはわかりませんが、もし良ければ私のツイートを一読してみませんか。
【ロボット】人工知能「東ロボくん」、センター模試の偏差値は45、
中堅私大よりやや下のレベルであれば十分合格可能
http://anago.2ch.net/test/read.cgi/scienceplus/1385212565/
自然言語処理スレッド その3
http://toro.2ch.net/test/read.cgi/tech/1235129481/
2チャンネルの掲示板にもいくつか書き込みをしております。これも参考になるかどうかはわかりませんが。
>あまりにも無関係な内容でない限り,ここのコメント欄は基本的にオープンです。
レスありがとうございます。
https://twitter.com/motactn
私、ツイッターもやっておりまして、最近は東ロボと自然言語処理に凝って、それについていろいろ考察しております。
必ずしも研究者の興味を引くような内容かどうかはわかりませんが、もし良ければ私のツイートを一読してみませんか。
【ロボット】人工知能「東ロボくん」、センター模試の偏差値は45、
中堅私大よりやや下のレベルであれば十分合格可能
http://anago.2ch.net/test/read.cgi/scienceplus/1385212565/
自然言語処理スレッド その3
http://toro.2ch.net/test/read.cgi/tech/1235129481/
2チャンネルの掲示板にもいくつか書き込みをしております。これも参考になるかどうかはわかりませんが。
Posted by msio at 2013年12月07日 07:30
記事本文にも書きましたし,ブログの他の記事をちらっと見ていただければわかると思いますが,私は自然言語処理の専門家でもなんでもないです。むしろ門外漢もいいところで。
Posted by DG-Law at 2013年12月07日 18:38