青空文庫のパーサーを作ってみようかなと思ったので調べてみた。正規表現でやっていたこともあってオライリー本を流し読みしてたのだけど。複雑になると変換が失敗しそうだと危惧はしている。構文解析をまじめにやってみよう。
構文解析ではPEGというのがあるらしい。またAST木というのもあるようだ。
この辺全然わかっていないのでちゃんと勉強する必要がある。
投稿小説サイト変換ツールを作った時にもっと精度を上げるには正規表現から、構文解析をきちんとする必要がありそうだ。できるかはわからないが青空文庫のパーサーを利用するには、ほかもAST木で表す必要がありそうである。