こんにちは。TFUG Utsunomiyaの木村です。
2018年4月22日(日)にTFUG Utsunomiya #10を宇都宮大学 陽東キャンパス 9号棟1F 9-108室で開催しました。
参加者数
参加者数は7名でした。初参加の方が1名いらっしゃいました。
タイムスケジュール
13:30 〜 | 開場 |
14:00 〜 14:10 | 今日の概要説明 |
14:10 〜 14:30 | 自己紹介 |
14:30 〜 16:00 | TensorFlow/KerasによるWord2vec |
16:00 〜 16:15 | 休憩 |
16:15 〜 17:00 | TensorFlow/KerasによるWord2vec(続き) |
17:00 〜 17:15 | 感想 |
会場の様子
実施内容
今回は、ニューラルネットを使った単語の埋め込み表現(分散表現)の方法としてword2vecを、「挑戦! word2vecで自然言語処理(Keras+TensorFlow使用)」を参考に学んでいきました。最初に単語の埋め込み表現の概要を紹介し、CBOWモデルとSkip-gramモデルの仕組みについてディスカッションを行いました。その後は各自、青空文庫にある小説を選んでテキストをMecabによる分かち書きとword2vecのためのデータセット作りを行いました。
感想
参加者のみなさんは言語処理がはじめてで最初は分からないことが多かったようですが、ディスカッションを通してCBOWやSkip-gramによる埋め込み表現については納得していただけたようです。また、データセット作りからword2vecの実装までできた方は、夏目漱石「こころ」をword2vecで学習させて「K」と「お嬢さん」のコサイン類似度が近いことが分かり喜んでいました。言語は身近なテーマなので興味を持ってもらえて良かったです。中国語を母語とする方が3名参加していたので、次回はニューラルネットによる漢詩の自動生成などもやってみていけたらと考えています。
次回予定
次回のTFUG Utsunomiya #11はゲスト講師の方をお呼びしてディープラーニングを使った開発についてお話していただく予定です。開催日は5月27日に予定しております。