今週買った本。
●高原英理編『乱歩心象作品集』(中公文庫)
●柳川一『三人書房』(創元推理文庫)
●筒井康隆『筒井康隆エッセイ集成1 SFを追って』(早川書房)
●レーシャ・ウクライーンカ他『ウクライナ怪奇幻想奇譚集 木精 森の歌』(高野昂訳/バラーチカ叢書)
●『紙魚の手帖 Vol. 25』(東京創元社)
○Sue Minix The Murderous Type (Avon, 2023)
○Sue Minix A Chapter on Murder (Avon, 2023)
○Sue Minix A Cover for Murder (Avon, 2024)
○SenLinYu Alchemised (Del Rey, 2025)
今週はすべて電子書籍。
YomiTokuでpdf化書籍からのテキスト抽出の精度が格段に上がったものの、処理に要する時間は長くなったので、もっと速いPCが欲しい。
今週pdf化した本。
◆門田充宏『ウィンズテイル・テイルズ 時不知の魔女と刻印の子』(集英社文庫)
◆門田充宏『ウィンズテイル・テイルズ 封印の繭と運命の標』(集英社文庫)
◆イアン・コールドウェル&ダスティン・トマスン『フランチェスコの暗号 上』(新潮文庫)
◆イアン・コールドウェル&ダスティン・トマスン『フランチェスコの暗号 下』(新潮文庫)
◆マット・ラフ『魂に秩序を』(新潮文庫)
◆ウェン・スペンサー『ティンカー』(ハヤカワ文庫)
◆ロバート・J・W・エヴァンズ『魔術の帝国 上』(ちくま学芸文庫)
◆ロバート・J・W・エヴァンズ『魔術の帝国 下』(ちくま学芸文庫)
◆アラン・ソーカル&ジャン・ブリクモン『「知」の欺瞞』(岩波現代文庫)
◆スティーヴ・ラスニック・テム『深き霧の底より』(創元ノヴェルズ)
今週買った本。
●デ・ラ・メア『運命の時計』(金原瑞人訳/理論社)
●トリスタン・ガルシア『7』(高橋啓訳/河出書房新社)
●伊藤比呂美『わたしのおとうさんのりゅう』(左右社)
●小川公代『ゆっくり歩く』(医学書院)
●Suhas Pai『実践 LLMアプリケーション開発』(オライリージャパン)
●『紙魚の手帖 Vol. 25』(東京創元社)
以上、かな。
YomiTokuを使ったOCRの縦書き日本語に対する読み取り精度があまりにもよいので、今まで使ってゐたocrmacからpythonスクリプトを作りかへる。段落構成がほぼ再現できて、ページによる分断もなくなり、ノンブルや柱の文字の混入もほぼ消え、振り仮名もほとんど除去できるやうになった。これで全部処理をやり直したい。
今週pdf化した本。
◆海野十三『獏鸚』(創元推理文庫)
◆海野十三『火葬国風景』(創元推理文庫)
◆小川公代『ゆっくり歩く』(医学書院)
◆ガブリエル・ガルシア=マルケス『百年の孤独』(新潮文庫)
少ない。もっと処理したつもりだったのに。
今週買った本。
●オットー・ペンズラー編『魔術ミステリ傑作選』(中村能三他訳/創元推理文庫)
●サラ・ブルックス『侵蝕列車』(川野靖子訳/新潮文庫)
●ミハイル・ブルガーコフ『巨匠とマルガリータ』(石井信介訳/新潮文庫)
●ミハイル・ブルガーコフ『犬の心臓・運命の卵』(増本浩子、ヴァレリー・グレチュコ訳/新潮文庫)
●小林信彦『夢の砦』(新潮文庫)
最初の一冊以外、楽天電子書籍で。
pdf化した本をOCR処理してテキストの抽出をするpythonスクリプトの改良を試みる日々。もともとの段落構成を再現して、他の改行を削除するとか、ノンブルや柱を除去するとか。LLMを導入しようとして、LLMに反対されるなど。
今週pdf化した本。
◆ニール・スティーヴンスン『ターミネーション・ショック』(パーソナルメディア)
◆オットー・ペンズラー編『魔術ミステリ傑作選』(創元推理文庫)
◆高島雄哉『ホロニック:ガール』(創元SF文庫)
今週も少ない。