« 2020年6月 | トップページ | 2020年8月 »

2020年7月

2020/07/15

「なろう一括取得から青空文庫形式」の小見出しに連番を付与(2021/05/03追記)

「小説家になろう」のテキストに青空文庫形式の注記を付けひとまとめにして読むスタイルが定着しているのですが、先日ふと困ったことがありました。

アニメ化いっそう読者の裾野が広がった本好きの下剋上」の、5冊目のふぁんぶっくに向けて香月美夜先生がQ&Aを募集されたところ、ものすごい反響があったのですが(その1, その2, その3)、パッと見にも既出の情報が多くて大変だと感じていたところ、香月先生が分類のお手伝いを募集されて、手を挙げられた5名の方がたった10日足らずで作業を終えられました。まさしく「シュタ速しゅたはや」で、下手に手を挙げなくて良かったと思っています(汗
そして既出分をまとめてアップされたのを見ると、自信を持って正解できるのは3割ぐらいな感じで、この機会に確認し直しておきたいところが何カ所も出てきました。
しかし、まとめに記載されている話数(節の連番)が私の作った一括テキストには入っておらず、「なろう」のwebでもPCでリンクにカーソルを合わせるか、
Renban1
節を開くかしないと確認できないなど、少々不便を感じました。(URLを直打ちするという手はありますが…)
Renban2

そこで4ヶ月ぶりにスクリプトをいじって、小見出しに連番を付けるようにしました。連番付与はオプションではなく基本機能の追加です。また、元々取得できない短編(=単話もの)はメッセージを出して終了するようにしました(従来はTracebackしていました(汗
ダウンロード - narou2az.py

…連番なんて要らないよ、という方はこちら(2020/03/21にアップしたもの)をお使い下さい。
ダウンロード - narou2az20200321.py

なお、動作にはPython3(3.3.0以上)とbeautifulsoup4が必要です。(逆に、確認した範囲ではbeautifulsoup4さえ動けばPython3のバージョンは問いません。)

では、
今回のスクリプトで作成した一括テキストをBOOX Poke Pro上の読書尚友で読み込んでみます。
読書画面では小見出しの下に" #n"が付き、
Renban3
目次画面では小見出しの右に" #n"が付くようになりました。
Renban4
また、"#n"を検索すれば読みたい節に簡単にジャンプできます(本文と青空文庫形式の注記とで2重になっています)。
Renban5
…読書尚友の検索は本当に速いので、話数で検索しやすいように小細工するのはやめました。

ご利用は自己責任で。

パドラッパ from MacBook Air (2017)

ps.
radonによる保守性miがA (53.62)からA (53.26)に下がりましたが、まぁこれぐらいは…

【2021/05/03追記】
今後、こちらのスクリプトは随時最新版に差し換えます。更新履歴および最新版の確認はGitHubをご覧ください(詳しくはこちら)。

| | | コメント (0)

« 2020年6月 | トップページ | 2020年8月 »