KDP(電子出版)のメモ 急急如律令

Amazon Kindleダイレクト・パブリッシングでの電子出版や電子書籍の作成販売について、文章やイラストの作成や編集方法について書いています。

青空文庫の構文解析

 青空文庫のパーサーを作ってみようかなと思ったので調べてみた。正規表現でやっていたこともあってオライリー本を流し読みしてたのだけど。複雑になると変換が失敗しそうだと危惧はしている。構文解析をまじめにやってみよう。

 

 構文解析ではPEGというのがあるらしい。またAST木というのもあるようだ。

この辺全然わかっていないのでちゃんと勉強する必要がある。

投稿小説サイト変換ツールを作った時にもっと精度を上げるには正規表現から、構文解析をきちんとする必要がありそうだ。できるかはわからないが青空文庫のパーサーを利用するには、ほかもAST木で表す必要がありそうである。

github.com

qiita.com

抽象構文木

github.com

kmizu.hatenablog.com