KDP(電子出版)のメモ 急急如律令

Amazon Kindleダイレクト・パブリッシングでの電子出版や電子書籍の作成販売について、文章やイラストの作成や編集方法について書いています。

bunkoOCRを試してみた

OSSのOCRソフトがないかなと調べていると、精度良さげなのが出ていたので試してみた。特徴はふりがなを含めてOCRに表示できる。フリガナを除外する機能もある。 bunkoOCR lithium03.info

スキャナーできれいに取り込んだものだと精度が高い。 そこで「国立国会図書館デジタルコレクション」の画像をダウンロードして試してみた。 問題なのが旧字体があるとミスが増える感じ。

いいデータがないかなと思って、青空文庫をOyaziViewerで表示したものをocrにかけてみた。フォントを色々変えたり、背景色を変更などをすると間違いが多い部分も出てきた。フォントによって制度に差が出るのだろうか。

oyaziviewer.com

坊ちゃん

2

になって手が使えぬから、無暗に手を|振《ふ》ったら、袖の中にある勘太郎の頭が、右左へぐらぐら|靡《なび》いた。しまいに苦し がって袖の中から、おれの二の|腕《うで》へ食い付いた。痛かったから勘太郎を垣根へ押しつけておいて、|足搦《あしがち》をかけて向う へ|倒《たお》してやった。山城屋の地面は菜園より六尺がた低い。勘太郎は四つ目垣を半分|崩《くず》して、自分の領分へ|真逆様《まっぱかさま》に落 ちて、ぐうと云った。勘太郎が落ちるときに、おれの袷の片袖がもげて、急に手が自由になった。その晩母が山城屋 に|詫《わ》びに行ったついでに袷の片袖も取り返して来た。 この外いたずらは大分やった。大工の|兼公と肴屋《かねこうさかなや》の|角《かく》をつれて、|茂作《もさく》の|人参�《にんしんばたけ》をあらした事がある。人参の芽が |出揃《でそろ》わぬ|処へ�《ところわら》が一面に|敷《し》いてあったから、その上で三人が半日|相撲《す�う》をとりつづけに取ったら、人参がみんな|踏《ふ》みつ ぶされてしまった。|古川《ふるかわ》の持っている|田圃《たんぼ》の|井戸《いど》を|埋《う》めて|尻《しり》を持ち込まれた事もある。太い|孟宗《もうそう》の節を抜いて、深く 埋めた中から水が|湧《わ》き出て、そこいらの|稲《いね》にみずがかかる|仕掛《しかけ》であった。その時分はどんな仕掛か知らぬから、石や |棒《ばう》ちぎれをぎゅうぎゅう井戸の中へ|挿《さ》し込んで、水が出なくなったのを見届けて、うちへ帰って飯を食っていたら、 古川が|真赤《まつか》になって|怒鳴《どな》り込んで来た。たしか|罰金《ばっきん》を出して済んだようである。 芝|居《ばい》の|真似《まね》をして|女形《おん�がた》になるのが好きだった。おれを見る度にこいつはどうせ|�《ろく》なものにはならないと、おやじがし  おやじはちっともおれを|可愛《かわい》がってくれなかった。母は兄ばかり|贔屓《ひいき》にしていた。この兄はやに色が白くって、 云った。乱暴で乱暴で行く先が案じられると母が云った。なるほど碌なものにはならない。ご覧の通りの始末である。 行く先が案じられたのも無理はない。ただ|懲役《ちょうえさ》に行かないで生きているばかりである。  母が病気で死ぬ|二三日《に�んち》前台所で宙返りをしてへっついの角で|肋骨《あばらぼね》を|摸《う》って大いに痛かった。母が大層|�《おこ》っのようなものの顔は見たくないと云うから、親類へ|泊《とま》りに行っていた。するととうとう死んだと云う|報知《しらせ》が来た。そ

う早く死ぬとは思わなかった。そんな大病なら、もう少し|大人《おとな》しくすればよかったと思って帰って来た。そうしたら 例の兄がおれを親不幸だ、おれのために、おっかさんが早く死んだんだと云った。|口惜《くや》しかったから、兄の横っ面を 張って大|変叱《しか》られた。  母が死んでからは、おやじと兄と三人で|暮《くわ》していた。おやじは何にもせぬ男で、人の顔さえ見れば貴様は|駄目《だめ》だ駄 目だと口癖のように云っていた。何が駄目なんだか今に分らない。|妙な《みよう》おやじがあったもんだ。兄は実業家になると か云ってしきりに英語を勉強していた。元来女のような性分で、ずるいから、仲がよくなかった。十日に|一遍《いつくん》ぐらい の割で|喧嘩《けんか》をしていた。ある時|将棋《しようぎ》をさしたら|卑怯《ひきよう》な|待駒《まわ�ま》をして、人が困ると|嬉《うれ》しそうに冷やかした。あんまり腹が 立ったから、手に在った飛車を|眉間《みけん》へ|擲《たた》きつけてやった。眉間が割れて少々血が出た。兄がおやじに|言付《いつ》けた。おや じがおれを|勘当《かんどう》すると言い出した。  その時はもう仕方がないと観念して先方の云う通り勘当されるつもりでいたら、十年来召し使っている|清《さよ》という下 女が、泣きながらおやじに|詫《あや》まって、ようやくおやじの|怒《いか》りが解けた。それにもかかわらずあまりおやじを|怖《こわ》いとは 思わなかった。かえってこの清と云う下女に気の�であった。この下女はもと|由緒《ゆいしよ》のあるものだったそうだが、|瓦解《がかい》 のときに|�落《れいらく》して、つい|幸公《ほうこう》までするようになったのだと聞いている。だから|婆《ばあ》さんである。この婆さんがどういう |因縁《いんえん》か、おれを非常に可愛がってくれた。不思議なものである。母も死ぬ三日前に|愛想《あいそ》をつかした おやじも年中 持て余している 町内では乱暴者の悪太郎と|爪弾《つまはじ》きをするこのおれを無暗に|珍重《ちんち�う》してくれた。おれは|到底《�うてい》人に 好かれる|性《たち》でないとあきらめていたから、他人から木の|端《はし》のように取り|扱《あつか》われるのは何とも思わない、かえってこの 清のようにちやほやしてくれるのを|不審《ふしん》に考えた。清は時々台所で人の居ない時に「あなたは|真《ま》っ|直《すぐ》でよいご気性

3

坊ちゃん 背景白

たれ

張っ

2

がって袖の中から、おれのの|腕《うて》へ食い付いた。痛かったから勘太郎を垣根へ押しつけておいて、|足搦《あしかつ》をかけて向う へ|倒《たお》してやった。山城屋の地面は|�園より六尺がた低い。勘太郎は四つ目垣を半分崩《くす》して、自分の領分へ|真逆様《まったかさま》に落 ちて、ぐうと云った。勘太郎が落ちるときに、おれの袷の片袖がもげて、急に手が自由になった。その晩母が山城屋 に|詫《わ》びに行ったついでに袷の片袖も取り返して来た。 出|揃《そろ》わぬ|処《とごろ》へ|菓《わら》が一面に|敷《し》いてあったから、その上で二人が半|日相撲《すもう》をとりつづけに取ったら、人参がみんな|踏《ふ》みつで この外いたずらは大分やった。大工の|兼公《かねど�》と|肴屋《さが�や》の|角《かく》をつれて、|�作《おさく》の|人参畠《にんじんぱたけ》をあらした事がある。人参の芽が ぶされてしまった|古川《ふ。かわ》の持っている|田圃《たんぽ》の|井戸《いど》を|埋《う》めてい|尻《しり》を持ち込まれた事もある。太い|孟宗《わうたう》の節を抜いて、深く。 埋めた中から水が|湧《わ》き出て、そこいらの|稲《いね》にみずがかかる|仕掛《かり》であった。その時分はどんな仕掛か知らぬから、石や |棒《ぼう》ちぎれをぎゅうぎゅう|井戸の中へ挿《さ》し込んで、水が出なくなったのを見届けて、うちへ帰って飯を食っていたら、 古川が|真赤《まっか》になって|怒鳴《どな》り込んで来た。たしか|罰金《ばつきん》を出して済んだようである。 |おやじはちっともおれを可愛《かわい》がってくれなかった。母は兄ばかり|鼻屓《ひいざ》にしていた。この兄はやに色が白くって、 |芝居《しばい》の|真似《まね》をして|女形《おんやがた》になるのが好きだった。おれを見る度にこいつはどうせ|碌《うぐ》なものにはならないと、おやじが 云った。乱暴で乱暴で行く先が案じられると母が云った。なるほど碌なものにはならない。ご覧の通りの始末である。 行く先が案じられたのも無理はない。ただ|懲役《ちょうえき》に行かないで生きているばかりである。  母が病気で死ぬ|三日《さんも》前台所で宙返りをしてへっついの角で|肋骨《あばら�ね》を|撲《う》って大いに痛かった。母が大|眉怒《おこ》って、お前に のようなものの顔は見たくないと云うから、親類へ|泊《とま》りに行っていた。するととうとう死んだと云う|報知《しらせ》が来た。そ う|早く死ぬとは思わなかった。そんな大病なら、もう少し大人《おどな》しくすればよかったと思って帰って来た。そうしたら 例の兄がおれを親不孝だ、おれのために、おっかさんが早く死んだんだと云った。|口惜《くや》しかったから、兄の横っ面を

 か

叱

変

母が死んでからは、おやじと兄と三人で|暮《くつ》していた。おやじは何にもせぬ男で、人の顔さえ見れば貴様は|駄目《だめ》だ駄 目だと口癖のように云っていた。何が駄目なんだか今に分らない。|妙《みょう》なおやじがあったもんだ。兄は実業家になると か云ってしきりに英語を勉強していた。元来女のような性分で、ずるいから、仲がよくなかった。十日に|一遍《いっぺん》ぐらい の割で|喧嘩《けんか》をしていた。ある時|将棋《しようま》をさしたら|卑怯《ひきょう》な|待駒《まわごま》をして、人が困ると|嬉《うれ》しそうに冷やかした。あんまり腹が 立ったから、手に在った飛車を|眉間《かけん》へ|擲《たた》きつけてやった。眉間が割れて少々血が出た。兄がおやじに|言付《いつ》けた。おや じがおれを|�当《かんどう》すると言い出した。  その時はもう仕方がないと観念して先方の云う通り動当されるつもりでいたら、十年来召し使っている|清《きよ》 � という下 女が、泣きながらおやじに|詫《あや》まって、ようやくおやじの|怒《いか》りが解けた。それにもかかわらずあまりおやじを|怖《わ》いとは 思わなかった。かえってこの清と云う下女に気の毒であった。この下女はもと|由緒《ゆいしょ》のあるものだったそうだが、|瓦解《がかい》 のときに|零落《れいらく》して、つい|奉公《ほうこう》までするようになったのだと聞いている。だから|婆《ばあ》さんである。この婆さんがどういう |因縁《いんえん》か、おれを非常に可愛がってくれた。不思議なものである。|母も死ぬ三日前に愛想《あいそ》をつかした おやじも年中 持て余している 町内では乱暴者の悪太郎と|爪弾《つまはじ》きをするこのおれを無暗に|珍重《ちんたよう》してくれた。おれは|到底《とうてい》人に 好かれる|性《たち》でないとあきらめていたから、他人から木の|端《はし》のように取り|扱《あつか》われるのは何とも思わない、かえってこの 清のようにちやほやしてくれるのを|不審《ふじん》に考えた。清は時々台所で人の居ない時に「あなたは|真《ま》っ|直《すぐ》でよいご気性 だ」と|賞《は》める事が時々あった。しかしおれには清の云う意味が分からなかった。|好《い》い気性なら清以外のものも、もう 少し善くしてくれるだろうと思った。清がこんな事を云う度におれはお世辞は|嫌《きつ》いだと答えるのが常であった。する と婆さんはそれだから好いご気性ですと云っては、嬉しそうにおれの顔を|眺《だが》めている。自分の力でおれを製造して

 �