鴨鍋記録

何の脈絡もなく雑文を投下します

NLPまわりで夏休みに手を出したこと

NLPまわりで色々手を出して全体的に中途半端になった感が否めない夏休みだったが、とりあえず手を出したことをザクッと(自己満足のために)殴り書く。

 

多くのトピックがまとまっててコードを書くことに重点が置かれている入門書(?)ということで

入門 自然言語処理

入門 自然言語処理

 

 に手を出した(まだ8章までしか進められてない…)。想像以上に演習問題が多いので、最初は適当にかいつまんで最後まで目を通す方が良かったかも。あと出版時のnltkのバージョンが古かったりしてて、なぜか上手くいかないときは原語のサイトを見るなどした。

 

 で、名著名著と謳われている

言語処理のための機械学習入門 (自然言語処理シリーズ)

言語処理のための機械学習入門 (自然言語処理シリーズ)

 

も読んだ(章末問題はやってない…)。 具体例を出して丁寧に計算過程を追って解説してくれていて確かに良いと思う。ただ勉強不足なもので特にラグランジュ云々の話になるとよく分からなかった。B1のときやった気もするんだけどなぁ…どうだっけ…要復習。

 

 上の本には最近流行のでーぷらーにんぐとやらの話は載ってなかったので

深層学習による自然言語処理 (機械学習プロフェッショナルシリーズ)

深層学習による自然言語処理 (機械学習プロフェッショナルシリーズ)

 

 こちらの本も読んでいる(まだ途中)。ていうか本当に数式多いよね…抑えてはあるんだろうけど…普通に頭が悪いので実装例書いてくれないとマジで雰囲気程度しか理解できねぇ…まだB3だし雰囲気程度でも充分か…?数学できるようになりたいよね…

 

あと輪読で使われているらしい

Speech and Language Processing: International Edition

Speech and Language Processing: International Edition

 

も借りて読もうとした。読もうとして、分厚すぎて一人で読むものでもないと気づいた(輪読で使うのである!)。 英語だし物凄く読むのに時間がかかる。たぶんコレ辞書代わりに使うやつじゃないかな…

 

最後にここ数日は(クジラ本の演習問題にいい加減飽きたというのもあって)

Graham Neubig - チュートリアル資料

をこなしている。説明が丁寧で、数式も抑えられてて優しい。あと疑似コードは素直にPythonの文法に書き直せば、それで普通に動いてしまう。優しい。

 

と、まぁそんな感じで夏休みが終わった。本読みとコーディング以外だとマジでTwitter眺めるか昼寝しかしてない気がする。悲しいね。