ワープロソフト松ファイル(*.BUN)やPDFファイルのTEXTファイル変換(抽出)フリーソフト

バイナリデータファイルからテキスト文の要素を抽出する方法である。対象はワープロソフト松(管理工学研究所)で作られたファイルやPDFファイルは勿論WORD・EXCEL・一太郎・HTMLなど幅広い。変換にはフリーソフト「xdoc2txt」を使用する。これにより視覚障碍者が、バイナリファイルをテキストデータに変換して、読み上げるのにも使える。なおこのプログラムはレジストリを汚さない。
1:基本的操作方法
①フリーソフト「xdoc2txt」(現在xdoc2txt 2.15 ( xd2tx215.zip ) )をダウンロードし解凍する
②必要なプログラムは「xdoc2txt.exe」で、基本的にはDOS窓から以下のように コマンドを使う
>xdoc2txt -f  sample.BUN  sample.TXT・・・・・・・・例1
>xdoc2txt -f  sample.PDF  sample.TXT・・・・・・・・例2  スイッチfは出力先をファイルに変更するオプション。但しファイルのパス指定が必要で出力位置もデフォルトはDOS窓なのでファイルに保存するには出力先のリダイレクトが必要など結構面倒くさい。その意味で2項目の手順が使いやすい
詳細手順とオプションの一覧は以下参照
http://ebstudio.info/home/xdoc2txt.html#command
なおPDFにパスワードがかかっていてそれを忘れた場合は例えば以下のサイトでパスワードを削除後使用する
http://freemypdf.com/

2:マウスによる簡単操作方法(使いやすいが最初に以下の環境設定が必要)
①例えばCドライブに任意のフォルダを作成しそこに解凍したプログラム「xdoc2txt.exe」を入れる
②そのプログラムxdoc2txt.exeを選択し右クリックメニューから送る→デスクトップにショートカットアイコンを作る。ショートカットアイコンの名前を判りやすい任意の名前例えば「TXT変換」に変更する
③出来たデスクトップのショートカットアイコン「TXT変換」を選択し右クリックでプロパティを出しショートカット(タブ)→リンク先に「C:\TXT変換\xdoc2txt.exe -f 」と-fを半角スペースの後に追加しOKをクリックする
④このショートカットアイコン「TXT変換」を「送る(sendto)」フォルダへ移動する。この操作によりマウスの右クリックのメニューに「TXT変換」が追加される。なおsendtoフォルダを開くには、「ファイル名を指定して実行」のダイアログボックスを開き ファイル名を入力するボックスに、 WindowsXPの場合は「sendto」、 Windows7の場合は「shell:sendto」 と入力して「OK」のボタンを押す。以上で一連の準備が終了する
⑤TEXT変換したい松のファイルまたはPDFファイル(任意のバイナリデータファイルが対象)を選択し右クリック→送る→「TXT変換」をクリックする。DOS窓がちらりとあらわれそのあとTEXT変換されたファイルが原文対象ファイルと同じフォルダ内に作成される。ただし画像要素は捨てられるのでPDFの内容が画像である場合は変換できない
⑥変換対象ファイルは複数選択し一括して変換可能なので結構便利に使用できる
<おまけ>
ブログのTXT変換はブラウザのファイル→名前を付けて保存→WEBぺージ保存ダイアログで「ファイルの種類」をTXTにして保存ボタンをクリックすれば可能

参考URL
http://talk-pc.sakura.ne.jp/anybody_setup_xdoc2txt.html#how_to_use
http://mahoro-ba.net/e421.html
http://talk-pc.sakura.ne.jp/xdoc2txt.html
http://ebstudio.info/home/xdoc2txt.html

ブログ気持玉

クリックして気持ちを伝えよう!

ログインしてクリックすれば、自分のブログへのリンクが付きます。

→ログインへ

なるほど(納得、参考になった、ヘー)
驚いた
面白い
ナイス
ガッツ(がんばれ!)
かわいい

気持玉数 : 0