
[ICT] PDF/Text to MP3 – Text Processing to speech (Win32) を試した

たまに sorceforge (ソースフォージ)を彷徨いにいくと、あれこれ自分もお蔵入りになっているソース類を纏めて公開してみたいなという気に駆られるが、いつもの如く「これ、自分のアレに似てる。いっちょ、試してみよっか」ということで、今日はコレを。


PDF/Text to MP3 – Text Processing to speech


typo という控えめな主張なところが気に入った。

Loading a PDF when no PDF is selected gives an error.
“Occurance” mispelled. “Occurrence” is correct


誤魔化し方がうまいのは、専門生>大学生>社会人大学院生 という感じがここ2~3年での印象がある。
まず開発どころか設計すらしないのに、UI モデルがうまくできないから開発できないとかいう社会人大学院生は基礎力が絶対的に不足している。


■ zip ファイルの構成

├── [4.1M] IKVM.OpenJDK.Core.dll
├── [6.0M] IKVM.OpenJDK.SwingAWT.dll
├── [804K] IKVM.OpenJDK.Text.dll
├── [1.8M] IKVM.OpenJDK.Util.dll
├── [960K] IKVM.Runtime.dll
├── [4.3M] Text Processing.exe
├── [ 188] Text Processing.exe.config
├── [ 68K] Text Processing.pdb
├── [ 22K] Text Processing.vshost.exe
├── [ 188] Text Processing.vshost.exe.config
├── [3.1K] Text Processing.vshost.exe.manifest
├── [ 856] Text Processing.xml
├── [ 82K] commons-logging.dll
├── [220K] fontbox-1.8.9.dll
├── [3.9M] pdfbox-1.8.9.dll
├── [ 932] readme.txt
└── [ 277] wx.NET.dll.config
0 directories, 17 files

■readme.txt の中身

Text2MP3 Release:1.01
Browse the web for PDF▒s and save them to you HD.
Load your PDF▒s from HD and strip them down to text.
Manipulate / change the text.
Find specific words and replace them. (useful for manipulating Names and Surnames that are misread by the Voice)
Text Editing: Font, Colour, Bold, Italics, Undo, Redo, Cut, Copy and Paste.
Save the text as Word Doc, Text File, CSV file or RTF file.
Get the text read to you. Male and Female voices available.
Speech Controls: Play, Pause, Resume and Stop. Voice Speed and Volume.
Rough estimate of the length in minutes of the MP3 being exported.
Save as Audio MP3. No need to listen to the whole transcript to be able to export.
Word Count, Character Count and List of all words in the transcript.
Number of occurances list for selected word(s)
Convert Audio MP3 back to text
Known Bugs:
// Sourceforge に書かれていることと若干の相違はあるが、許容範囲でしょう。
// ソース Text2MP3-Source.zip のほうは、、ダウンロードさせてくれないリダイレクト設定になっているので、読まれたくないのかな?





■試してみた (日本語 PDFで)

UI に ミニWebブラウザ(httpクライアント)があるので、おそらくは URL キックさせてそこから MP3, DOC 出力させられると思うが、するならニュースページの見出し項目を定時クロールし、そこから自分の podcast 鯖へ sftp で格納するとか、、自分のアイデアが多数沸いてきたので、評価ポイントは割愛。


MP3 ・・・ PDF Reader 経由による Text-To-Speech とほぼ同等

DOC ・・・ PDF Reader から DOC エンコードとほぼ同等


PDF 資料の音声化が必要なとき、PC に詳しいヲタクが身近にいないときに。多少の聞きづらいことがあっても、まぁまぁいいかな。




投稿者 斉藤之雄 (Yukio Saito)

Global Information and Communication Technology OTAKU / Sports volunteer / Social Services / Master of Technology in Innovation for Design and Engineering, AIIT / BA, Social Welfare, NFU / twitter@yukio_saitoh