◆津田和彦先生 「テキストマイニングとその応用」
[プレゼン発表]
津田先生は、東京キャンパスにあるビジネスサイエンス系の先生です。今回は、教員プレゼンバトルに参加するために筑波キャンパスまでお越しいただきました。筑波キャンパスで学ぶ私たちにとって、今まで東京キャンパスとはあまり接点がなかったと思います。今後TGNでは、東京キャンパスも積極的に巻き込んで筑波大学全体を学術的に盛り上げていきたいと思っています。さて、プレゼン内容に話を戻します。津田先生は、日本語や英語などのいわゆる自然言語(コンピュータ言語と比較してこのように呼ぶ)で書かれた文章の中から、内容を計算機を用いて抽出する研究を行っています。人間でない計算機からすると、ネット上の文章やメールは無機質な文字の羅列にあたるため、そこから内容を引き出すなんて信じられません。しかしそれを可能にするのが、膨大なデータの中から規則性を掘りだす、データマイニングという計算機科学の手法です。データマイニングの手法では、様々な形でやりとりされる文書を主語と述語に分解し、高度な計算を駆使して文章内容をくみ取ります。特に、文末の述語に注目すると、その文章が肯定的な内容なのか、あるいは否定的な内容であるのか大体判定できるそうです。ところで、ネット上の文章やメールのやりとりには顔文字がよく使われます。携帯メールで活用している方も多いのではないでしょうか。意外にもこの顔文字が、文章の内容を読み取るのに結構役に立つそうです。例えば文末に、(;`´)oという顔文字があったとします。この時、顔文字の中の“`´”に注目することで、怒りを表す内容であることを引き出すことができるそうです。こうした研究技術は、試験的に宿泊サイトの批評の解析などにも応用されているようです。ネット上でやりとりされる文章がますます増えている昨今、津田先生の研究は今後大きな応用の可能性を秘めていると感じました。津田先生のプレゼンは、常に聴衆を見ながら語りかけ、私たちと呼吸を合わせながら発表するスタイルでした。何十人もの受講生を相手にしているにも関わらず、あたかも一対一で話を聞いているかのような錯覚を覚え、プレゼンに自然と引き込まれていきました。「聴衆とリズムを合わせる」という感覚が、プレゼンを生き生きと魅力的なものにするということを認識しました。
[質疑応答]
質疑応答では、異分野間のコミュニケーションらしい議論が繰り広げられました。特に白熱したやりとりを紹介します。
Q. 「部屋は広いけど料理はちょっと。。。」というように、日本語には真意を明らかにせずに、相手に空気を読ませるような文章表現がある。このような表現から内容をくみ取るようなことは可能だろうか。(文学を専攻する大学院生)
A. 「。。。」(3点リーダー)という文章表現の場合、 直前の単語でほとんど意味が決定されている。今の例だと、直前の「ちょっと」が文章全体を否定的な意味に導いている。このような3点リーダーに関しては、90%くらいの正答率で文意を特定できる。
Q. それでは、他にも嫌味や皮肉を文章からくみ取ることは可能か。
A. これらはなかなか難しい。しかし、顔文字の解析が役に立つ場合が多い。
[種明かしディスカッション]
種明かしディスカッションのコーナーでは、プレゼン発表の極意や、気を付けていることなどを教えてもらったり、根掘り葉掘り質問攻めにするコーナーです。毎回、目からうろこの情報ばかりですが、これは実際会場に来て聴講した人の特権ということで、ここでは公表しません。
◆遠藤靖典先生 「クラスタリングによる知識発見」
[プレゼン発表]
遠藤先生が専門とするクラスタリングとは、人間の手には負えないような沢山のデータを、類似なもの同士に分類する計算機科学の手法のことです。みなさんお気づきだと思いますが、遠藤先生とひとつ前の発表者の津田先生の研究分野は非常に近いと思います。現在、データマイニングやクラスタリングは、ビジネス、シス情と研究科を越えて活発に研究されており、今後大注目の研究分野のようです。さて、私たちが普段何か物事を分類するときには、分類するための指針のようなものを使っていると思います。(例えば、タコとイカを分類するのは“足の数”でしょうか?)このような指針のことを計算機科学の分野では、「教師」と呼ぶそうです。しかし、いつでも適切な教師が存在するとは限りません。また、無理に教師を設定しようとすると、誤った分類を導きかねません。そこで、遠藤先生は、「教師なし」で分類を可能にするクラスタリング手法について紹介されました。つまり、データのみの情報を用いて分類を行うことができるそうです。研究事例として、twitter上でのデマ情報の検出について発表されました。twitterは、誰でも気軽に情報発信ができ、伝達スピードは既存のどのメディアよりも速いことが知られています。そして、東日本大震災では、災害時の情報伝達に非常に優れているということが明らかになりました。しかし一方で、twitter上に多くのデマが生まれ、それが混乱を引き起こすことが浮き彫りとなりました。そのため、今後より有用な情報伝達メディアとして扱うために、害のあるデマと本当に有用なニュースを見分けることが要求されます。そこで、遠藤先生はクラスタリングの研究手法を応用し、twitter上のデマ検出に取り組みました。具体的には、twitterの情報のみを使って(教師なしで)、「デマ」と「本当のニュース」を分類する手法を提案されました。その結果、なんと80%の精度で、デマと本当のニュースを分類することができるようになったそうです。遠藤先生は発表中、ステージを飛び出して会場を自由に行き来し、躍動感溢れる発表を展開されました。そのため、計算機科学という緻密な研究内容の発表にも関わらず、研究に対する情熱が存分に伝わってきました。講演後の休憩時間中も、質疑応答のコーナーでは物足りなかった学生たちが列をなして質問している姿が印象的でした。
[質疑応答コーナー]
質疑応答では、異分野間のコミュニケーションらしい議論が繰り広げられました。特に白熱したやりとりを紹介します。
Q. twitterの文章が肯定または否定的な内容を含むことと、そのtweetがデマであることはどのように対応するのか。(物理学専攻の大学院生)
A. デマには危機感を煽ることを目的にしたものが多いので、否定的な内容がデマの特徴の一つとなる。そのため、デマの同定には、文章中の否定的な部分の抽出が有用となる。
Q. 実用上、不安感を煽るような否定的デマは早急に同定する必要があるだろう。逆に「私はダイエットに成功した」みたいな肯定的デマは広まってもあまり害はない。(笑)
[種明かしディスカッション]
種明かしディスカッションのコーナーでは、プレゼン発表の極意や、気を付けていることなどを教えてもらったり、根掘り葉掘り質問攻めにするコーナーです。毎回、目からうろこの情報ばかりですが、これは実際会場に来て聴講した人の特権ということで、ここでは公表しません。
◆岩井宏暁先生 「イネの細胞壁をデザインする」
[プレゼン発表]
岩井先生は、植物生理学、植物細胞生物学を専門に研究している先生です。今回は、バイオ燃料への応用を目指した、イネの細胞壁に関する基礎研究について発表して頂きました。岩井先生は、「植物のかたちはどうやってできあがるのだろうか」という素朴な疑問から植物の細胞の研究をはじめられたそうです。植物はレンガのように積まれた細胞で作られており、その細胞をがっちりと支えているのが細胞壁です。この細胞壁が植物のかたちづくりに果たす役割を調べる一方で、逆に細胞壁を自由にデザインすることで、何かに役立つ植物を作ることができます。そこで注目されたのがバイオ燃料への応用です。地球上のエネルギー問題が深刻化してきているなかで、バイオ燃料にかかる期待は日々増すばかりです。しかし、バイオ燃料をもっと実用的なものにするには、まだまだ克服しなければならない問題点が多いそうです。その中でも、茎などの食べられない部分をより効率よく燃焼できる作物を開発することが求められています。そこで岩井先生は、バイオ燃料の源となる、細胞壁中の「セルロース」を増やす研究に着手されました。試行錯誤の結果、セルロース同士を結ぶ“ワイヤー”役である「ヘミセルロース」の発現を抑えると、セルロースの量が増加することを発見しました。さらに、今回発見したセルロースを多く含むイネは、丈夫で病気にもなりにくい性質を併せ持つことも分かったそうです。以上の性質は、バイオ燃料の効率化に向けた大きな示唆を与えるそうです。「植物のかたちはどうなっているのだろうか」、という基礎的な問題意識が、エネルギー問題に関わるバイオ燃料の研究へと結実していく展開にワクワクさせられました。「わたしも研究頑張ろう!」と思った受講生も多かったのではないでしょうか。また岩井先生は、専門外の人にとっては全く想像できない細胞壁の中の世界を、ビルの構造に例えて説明されました。そのことで、呪文のように聞こえる「セルロース」や「ヘミセルロース」も身近なものに感じることができました。やはり、専門外の人には、分かりやすい対象に例える技術が大事であると痛感しました。
[質疑応答コーナー]
質疑応答では、異分野間のコミュニケーションらしい議論が繰り広げられました。特に白熱したやりとりを紹介します。
Q. イネ全体の内、食べられない部分をバイオ燃料に活用する一方で、食べる部分に遺伝子の組み換えに伴う何らかの負の影響が出たりしないか。(システム情報工学研究科の院生)
A. 本研究の特色は、ヘミセルロースの量を抑えるとセルロースが増加するという、細胞自身の機能を使うことにある。また、本研究はトウモロコシのように直近の実用化を目指したものではなく、何十年も先を見越した基礎研究に位置づけられる。なので、食べる部分とバイオ燃料を兼ねるためにイネの研究をしているという意図よりも、研究に適したモデル生物としてのイネの役割に注目している。
[種明かしディスカッション]
種明かしディスカッションのコーナーでは、プレゼン発表の極意や、気を付けていることなどを教えてもらったり、根掘り葉掘り質問攻めにするコーナーです。毎回、目からうろこの情報ばかりですが、これは実際会場に来て聴講した人の特権ということで、ここでは公表しません。
文責:尾澤岬