青空文庫でラヴクラフトがあったのでEPUB化してみようとしています。が、青空文庫注記とHTMLがありまして。それでもEPUBにしようとする場合に、青空文庫とHTMLをマークダウン形式にしてでんでんマークダウン形式にして、でんでんコンバーターでEPUBに変換する方法をとってみます。
ルビ変換
青空文庫のルビをでんでんマークダウン形式に変換
|水面《みなも》→{水面|みなも}
に変換する。
検索する文字列
|?([\p{Han}]+)《(.+?)》
置換後の文字列
{\1|\2}
漢字とひらがなのルビの場合で鬼車の時は使えそう。アルファベットにふりがなは変換されないので注意されたし。
参考:
青空文庫ルビを正規表現でInDesignルビに変換する: InDesign使いこなしの鉄則
脚注
でんでんコンバーターの脚注。 どうせならば、脚注もでんでんコンバーターの機能を使って機能を試してみることにする。EPUBリーダーだと脚注の部分をタップするとポップアップして表示される。
HTMLからマークダウンに変換する HTML を Markdown へ変換
* (*1-1)を[^1-1]:に変換する
\* \(\*(\d+?)-(\d+?)\)
[^\1-\2]:
(*1-1)を[^1-1]に変換する
\(\*(\d+?)-(\d+?)\)
[^\1-\2]
でんでんコンバーターの説明では脚注は数字でしかダメなように書いてあったが、半角ならば良さそうなので、そのままにしておきます。
リンクのURLに()が含まれている場合(を%28にして、)を%29にするといい
参考:
右寄せや中央寄せ
右寄せや中央寄せは前に書いたのでそれを見ればわかると思う。
centerタグを
<center> </center>
<div class="align-center" markdown="1"> </div>にして
cssに
.align-center {
text-align: center;
}
を追加する。
問題はhtmlをマークダウンにするときに
<p align="right"> のような pタグの属性が削除されてしまうので、その前に変換するか後で変換する。