[ICT] PDF/Text to MP3 – Text Processing to speech を試した(Win32)

[ICT] PDF/Text to MP3 – Text Processing to speech (Win32) を試した

たまに sorceforge (ソースフォージ)を彷徨いにいくと、あれこれ自分もお蔵入りになっているソース類を纏めて公開してみたいなという気に駆られるが、いつもの如く「これ、自分のアレに似てる。いっちょ、試してみよっか」ということで、今日はコレを。

Text2MP3

PDF/Text to MP3 – Text Processing to speech

https://sourceforge.net/projects/text-to-mp3/


既知のバグ
typo という控えめな主張なところが気に入った。

Loading a PDF when no PDF is selected gives an error.
“Occurance” mispelled. “Occurrence” is correct

実際はもっと複雑なバグ含有で、専門学校の宿題提出時に講評チェックをごまかすかのような表現のようにも。目標は達成するけど途中動作が開発(全部開発したのではなくw)した自分にも分からないという。

<どうでもいい>
誤魔化し方がうまいのは、専門生>大学生>社会人大学院生 という感じがここ2~3年での印象がある。
まず開発どころか設計すらしないのに、UI モデルがうまくできないから開発できないとかいう社会人大学院生は基礎力が絶対的に不足している。
</どうでもいい>

さておき・・・


■ zip ファイルの構成

.
├── [4.1M] IKVM.OpenJDK.Core.dll
├── [6.0M] IKVM.OpenJDK.SwingAWT.dll
├── [804K] IKVM.OpenJDK.Text.dll
├── [1.8M] IKVM.OpenJDK.Util.dll
├── [960K] IKVM.Runtime.dll
├── [4.3M] Text Processing.exe
├── [ 188] Text Processing.exe.config
├── [ 68K] Text Processing.pdb
├── [ 22K] Text Processing.vshost.exe
├── [ 188] Text Processing.vshost.exe.config
├── [3.1K] Text Processing.vshost.exe.manifest
├── [ 856] Text Processing.xml
├── [ 82K] commons-logging.dll
├── [220K] fontbox-1.8.9.dll
├── [3.9M] pdfbox-1.8.9.dll
├── [ 932] readme.txt
└── [ 277] wx.NET.dll.config

0 directories, 17 files


■readme.txt の中身

Text2MP3 Release:1.01

Features:
Browse the web for PDF▒s and save them to you HD.
Load your PDF▒s from HD and strip them down to text.
Manipulate / change the text.
Find specific words and replace them. (useful for manipulating Names and Surnames that are misread by the Voice)
Text Editing: Font, Colour, Bold, Italics, Undo, Redo, Cut, Copy and Paste.
Save the text as Word Doc, Text File, CSV file or RTF file.
Get the text read to you. Male and Female voices available.
Speech Controls: Play, Pause, Resume and Stop. Voice Speed and Volume.
Rough estimate of the length in minutes of the MP3 being exported.
Save as Audio MP3. No need to listen to the whole transcript to be able to export.
Word Count, Character Count and List of all words in the transcript.
Number of occurances list for selected word(s)
Convert Audio MP3 back to text

Known Bugs:

Loading a PDF when no PDF is selected gives an error.

// Sourceforge に書かれていることと若干の相違はあるが、許容範囲でしょう。
// ソース Text2MP3-Source.zip のほうは、、ダウンロードさせてくれないリダイレクト設定になっているので、読まれたくないのかな?

===

■ハンドルエラーはちょいちょい

PDF2MP3_unbundle

まぁ、いいや。

■試してみた (日本語 PDFで)

UI に ミニWebブラウザ(httpクライアント)があるので、おそらくは URL キックさせてそこから MP3, DOC 出力させられると思うが、するならニュースページの見出し項目を定時クロールし、そこから自分の podcast 鯖へ sftp で格納するとか、、自分のアイデアが多数沸いてきたので、評価ポイントは割愛。

最終出力の緩い評価:

MP3 ・・・ PDF Reader 経由による Text-To-Speech とほぼ同等

DOC ・・・ PDF Reader から DOC エンコードとほぼ同等

使い道:

PDF 資料の音声化が必要なとき、PC に詳しいヲタクが身近にいないときに。多少の聞きづらいことがあっても、まぁまぁいいかな。

 

以上