KDP(電子出版)のメモ 急急如律令

Amazon Kindleダイレクト・パブリッシングでの電子出版や電子書籍の作成販売について、文章やイラストの作成や編集方法について書いています。

「小説家になろう」や「カクヨム」の相互変換するツールを作ってみた

変換ツール

小説家になろうカクヨム、Pixiv、青空文庫、でんでんコンバーターの相互変換ツールを作ったのでgithubにおいておく。

リンク:小説投稿サイト相互変換

ソースコード

github.com

 これを作ろうとしたきっかけは、投稿小説サイトでは読む側の変換ツールはあるが投稿する側のツールが少ないと思ったから。一度作ったものをいろいろな形式に変換できれば、変換にかかる時間が減って執筆に時間を充てられるだろう。

 

 まだできていないのが傍点の処理部分で取りあえず動くようにしておいた。それぞれの形式では表現できない注記がありかつ種類が多いので、一旦青空文庫形式に変換してからそれぞれの形式に出力するようになっている。そのほうが作業量が減らせそうだから。

 2回変換することになるのでミスがあると、ぐちゃぐちゃになる可能性がある。挿絵とリンクの変換はまだやっていない。小説家になろうのルビの変換は怪しい所がある。

 

投稿小説サイトのEPUB変換ツール

github.com

 

github.com

小説家になろう/小説を読もう!」(+関連サイト)「NEWVEL-LIBRARY」「FC2小説」「HAMELN」「Arcadia」「novelist.jp」「dNoVeLs」「暁」「カクヨム」「ノベルアップ+」から取得が可能です。

 

github.com

 

 

JavaScript 第6版

JavaScript 第6版

 

 

「小説家になろう」や「カクヨム」の相互変換するツールをつくろうかな

 まえにさ、小説投稿サイトの形式を見たけどその変換できるサイトを作ってみようかなと思ったので、要件を整理してみることにした。ついでにEPUBにも変換できるように青空文庫の注記やでんでんマークダウン形式にも変換できるようにしてみようかなと思っている。

 基本的にはjavascriptでやるつもりなので、githubで公開しちまえばいいか。でんでんコンバーターはどこで儲けるつもりなのかがわからないので、どこまで機能をつけていいのかがわからない。初期状態のままではでんでんコンバーターに傍点機能がついていない。なので、CSSを弄くって傍点をつけることになるがそういうことやっていいんだろうか。

99nyorituryo.hatenablog.com

 

 

自動ルビふりツール

http://furi.herokuapp.com/

 

書いた文章の漢字の部分にふりがなを打ってくれるツール。全部の漢字にルビを振ったり、小学生や中学生や一般向けなどの水準ごとにルビをふるかどうかを決めることができる。ただ間違うこともあるので注意が必要。手作業で入力するよりは楽。

 

()いた文章(ぶんしょう)漢字(かんじ)部分(ぶぶん)にふりがなを()ってくれるツールだよ。

<ruby>書<rp>(</rp><rt>か</rt><rp>)</rp></ruby>いた<ruby>文章<rp>(</rp><rt>ぶんしょう</rt><rp>)</rp></ruby>の<ruby>漢字<rp>(</rp><rt>かんじ</rt><rp>)</rp></ruby>の<ruby>部分<rp>(</rp><rt>ぶぶん</rt><rp>)</rp></ruby>にふりがなを<ruby>打<rp>(</rp><rt>う</rt><rp>)</rp></ruby>ってくれるツールだよ。

HTMLでルビを直接書くとこうなって、コード部分での可読性や編集性が悪すぎる。互換性の保持のために長くなっている部分もある。

 

BCCKS

{書}(か)いた{文章}(ぶんしょう)の{漢字}(かんじ)の{部分}(ぶぶん)にふりがなを{打}(う)ってくれるツールだよ。

 でんでんマークダウン

{書|か}いた{文章|ぶんしょう}の{漢字|かんじ}の{部分|ぶぶん}にふりがなを{打|う}ってくれるツールだよ。

 ラノベのルビで、例えば

暗黒(ダーク)(ソード)

のような中二病読みというのかラノベルビというのかよくわからないのをやろうとすると手動になる。

ルビの置換

BCCKSから青空文庫やなろう、カクヨムのルビを変換するには正規表現をONにして置換する

 \{(.+?)\}\((.+?)\)

| $1《 $2》

 でんでんマークダウンから青空文庫やなろう、カクヨムに変換

\{(.+?)\|(.+?)\}

| $1《 $2》

青空文庫やなろう、カクヨムから

ルビの振り方|マニュアル

 

 この形式の変換で問題になるのが基本は|漢字《ルビ》の形式だが|を省略するパターンが有る。他に漢字(かんじ)のようなワードからテキスト出力した場合にできるパターンもある。通常の()を表示するためにはエスケープするために|()として使う。

|(.+?)((.+?))

|(.+?)\((.+?)\)

| $1《 $2》

漢字にひらがなでふりがな

 \p{Han}+?《 \p{Hiragana}+?》

 \p{Han}+? \( \p{Hiragana}+?\)

 

漢字にカタカナでふりがな

 \p{Han}+?《 \p{Katakana}+?》

 \p{Han}+? \( \p{Katakana}+? \)

 

| $1《 $2》

ほかかなろうに変換する場合には()を|()に変換する。

\(.+?\)

|$0

pixiv仕様

rb:pixiv > ピクシブ

\[\[rb:(.+?) > (.+?)\]\]

傍点

 文章に傍点をつけて強調があるがはてなブログでつけようとしたら失敗した。傍点にはsesameとdotがあって、﹅と・を傍点につける。問題はでんでんコンバーターに傍点の機能が標準ではついてないのでCSSを弄る必要があって急に難易度が上がる。小説家になろうでは、ルビの部分に傍点をつけて代わりにしているが、カクヨムでは傍点専用の注記がある。

rashita.net

blog.livedoor.jp

青空文庫

○○[#「○○」に傍点]

○○[#「○○」に丸傍点]

なろう

﹅や・分割している場合や一体になっている場合がある。

 |漢《・》|字《・》 

漢字《・・》

カクヨム

カクヨムの傍点ではドットである。

《《漢字 》》

改ページ

小説家になろうで改ページの機能があったのででんでんコンバーターように変換する。

でんでんコンバーターでは前後に空行を入れて区切る、

青空文庫

[#改ページ]

なろう

【改ページ】

 ピクシブ

[newpage]

でんでんコンバーター

 

=======================================

 

 

【改ページ】を\n=======================================\n

のように変換すればいいかな

 改行

でんでんコンバーター

改行を2×改行に

<p><br/></p>

 挿絵

挿絵は小説投稿サイトで用意されたところに画像を置く必要がある。

青空文庫

[#説明(ファイル名、横サイズ×縦サイズ)入る]

pixv

[pixivimage:イラストID]

カクヨムなし

小説家になろう

挿絵の挿入|マニュアル

<i3724|23>がURLに変換される。

http://23.mitemin.net/i3724/

 

でんでんコンバーター

 ![代替テキスト](img.jpg)

 

章や節

青空文庫

[#中見出し]〇〇[#中見出し終わり]

pixiv
[chapter:章タイトル]

小説家になろう

章管理|マニュアル

kakuyomu.jp

でんでんコンバーター

 ## 見出しレベル2 ##

 

電書ちゃんがツイキャス始めたようです。

twitcasting.tv

 

 下のアフィリエイトから商品を買うと私にお金が入ります。

 

一太郎2016でepubを作ってみた感想

 

一太郎2016 通常版

一太郎2016 通常版

 

 


一太郎の新バージョンが出たようなので使用してどんなもんかなということを試用版で確認してみた。どんな機能があるのかどうかはよくは知らないんだけれど、買うならば読み上げ機能とかがあったらいいなと思う。

 EPUB出力機能は良くなっているのかどうかを調べてた。さて、wordと一太郎のどっちがいいかを考えて一太郎を試すことにしているが、ATOKが欲しいだけのような気もする。日本語入力支援ソフトの実力がそこまで精度がいいかわからないが、どのようなものになるだろう。

 日本語入力支援ソフトIMEでウィンドウズだったら、GoogleIMEとかBaidu IMEというやっかいなソフトもあるな。

 それでもATOKという安心感はだいぶ違う。GoogleIMEの場合は、最近の言葉がすぐ入力に反映されやすいが、ATOKの場合は候補機能や訂正機能が優秀だと思う。

一太郎

 一太郎で使う機能として、文字校正機能を使うとウェブ上での文字校正するよりは作業ははかどりやすい。GoogleIMEよりは、使いやすいように感じている。そういうもんだろうと本来の機能ではなくある程度制限されている感じではあるが、値段ぐらいの価値はありそうに見える。

 電子書籍の機能

 一太郎にEPUB出力機能がついているのは機能一覧に紹介されている。正直のところどの程度の表現が電子書籍に対応しているのかがどうもわかりづらく感じる。

目次

 一太郎の目次では、何も設定していないと初期設定で何かを目次にするようにされているので、「本文1」と目次が表示される。epubでは、目次がない電子書籍はよくないのでそうなっている。キンドルで買った本にもたまに目次が「本文1」になっていることがある。それは一太郎で作ったんだなとみればすぐにわかる目印になっている。

 

一太郎電子書籍を作る際の目次の付け方。

[053728]電子書籍(EPUB・Kindle/mobi形式)で保存するデータに、目次を作成したい

 縦書き

 電子書籍には横書き設定と縦書きがありそのほかに固定レイアウトもある。その電子書籍一太郎で出力するときに設定をどのようにするのかが一見してよくわからないように感じた。縦書きの設定だが、表示を縦書きにするとEPUBに出力したときも縦書きに表示されるようになった。つまり、縦書きか横書きかの出力を切り替えるには、表示を変えるといいようだ。

 

データ管理

 ほかに気になった点は一太郎では、編集内容と出力が同じなのでどこを編集したかがわかりづらい。見出しを指定したつもりじゃなかった部分にまで見出し設定されていると、epubに出力されてからしか気づかないだろう。

 一太郎で出力するのはいいがjtdファイルとして保存されるので、一太郎を買わないと後々編集することができなくなるというのが問題かもしれない。

 一太郎のファイル形式がよくわからないのでほかの形式にどのように変換するのかがわからない。たとえばルビをつけたとしてもほかのファイル形式に変換する場合に、どうすればいいかがわからなくなるだろう。

ルビ振り

ルビの振り方は、いろんな形式で使われているので相互に変換できれば使い勝手胃がいいだろう。たとえば、青空文庫形式で作っていたファイルを、一太郎に読み込ませようとするとき。青空文庫特有のルビの振り方がそのままでは一太郎が認識しない。それを変換することができるマクロがあった。

必要は発明のマクロ

 一太郎をインストールしたままではマクロの機能が隠されているので、見つけるのが苦労した。初期設定では、必要最低限の機能が見えるようになっているようだ。

99nyorituryo.hatenablog.com

でんでんコンバーターでラヴクラフトをEPUB化した

 

前の記事で青空文庫ラヴクラフトの本をEPUB課する作業の中で気づいたことをメモしておきます。

HTMLからEPUBへの変換を試してみる - KDPのメモ 急急如律令

 

 でんでんコンバーターでガッツリEPUBファイルを作ったらどういうところで躓くかを調べてみました。まずはじめに文字数制限がきになるかもしれない10万次ぐらいからエラーが出ている感じがします。マークダウン形のバリッドの問題もある。電書ちゃんのでんでんエディター を使って確認はできるが、おかしい文章を上げた時にエラーが出ている場所を特定できないという感じがした。もう一つの問題が、画像ファイルを確認するときに、アップロードをどうするかという感じがした。そこでATOMエディタで、マークダウンビュワーで画像を確認した。

conv.denshochan.com

作成したEPUBは次のリンクにおいてある。

www.dropbox.com

青空文庫のリスト

作家別作品リスト:ラヴクラフト ハワード・フィリップス

 

www.asahi-net.or.jp

この中では脚注あったので脚注もでんでんマークダウンで表しました。

 

章や節が中央寄せになっていたので、CSSのH4やH5の部分に中央寄せに指定しています。

text-align: center;

 

HTMLからEPUBへの変換を試してみる

青空文庫ラヴクラフトがあったのでEPUB化してみようとしています。が、青空文庫注記とHTMLがありまして。それでもEPUBにしようとする場合に、青空文庫とHTMLをマークダウン形式にしてでんでんマークダウン形式にして、でんでんコンバーターEPUBに変換する方法をとってみます。

作家別作品リスト:ラヴクラフト ハワード・フィリップス

 

ルビ変換

青空文庫のルビをでんでんマークダウン形式に変換

|水面《みなも》→{水面|みなも}

に変換する。

検索する文字列

|?([\p{Han}]+)《(.+?)》

置換後の文字列

{\1|\2}

漢字とひらがなのルビの場合で鬼車の時は使えそう。アルファベットにふりがなは変換されないので注意されたし。

 

参考:

青空文庫ルビを正規表現でInDesignルビに変換する: InDesign使いこなしの鉄則

 

脚注

でんでんコンバーターの脚注。 どうせならば、脚注もでんでんコンバーターの機能を使って機能を試してみることにする。EPUBリーダーだと脚注の部分をタップするとポップアップして表示される。

www.asahi-net.or.jp

HTMLからマークダウンに変換する HTML を Markdown へ変換

* (*1-1)を[^1-1]:に変換する

\* \(\*(\d+?)-(\d+?)\)

[^\1-\2]:

 

(*1-1)を[^1-1]に変換する

\(\*(\d+?)-(\d+?)\)

[^\1-\2]

でんでんコンバーターの説明では脚注は数字でしかダメなように書いてあったが、半角ならば良さそうなので、そのままにしておきます。

 

リンクのURLに()が含まれている場合(を%28にして、)を%29にするといい

参考:

paulownia.hatenablog.com

パーセントエンコーディング - Wikipedia

右寄せや中央寄せ

右寄せや中央寄せは前に書いたのでそれを見ればわかると思う。

99nyorituryo.hatenablog.com

centerタグを

<center> </center>

<div class="align-center" markdown="1">  </div>にして

css

.align-center {
text-align: center;
}

を追加する。

 問題はhtmlをマークダウンにするときに

<p align="right"> のような pタグの属性が削除されてしまうので、その前に変換するか後で変換する。