すべてのカテゴリ » インターネット・パソコン » ソフトウェア » ソフトウェア全般

質問

終了

次のようなことのできるソフトウェアはないでしょうか。

「設定した文字数ずつ自動でコピーして、指定のエディター等に累積して保存していく。」

たとえば、200万文字ほどの情報が入ってるファイルがあるとします。テキスト形式ではなく、文字列をコピーしようとしても、一度には最大100文字までしかコピーできなくなっています。もし101文字以上を選択してコピーしようとするとエラーとなります。

そこで、これの最初の100文字までをコピーしてWord等に貼り付け、さらに次の100文字(101文字目から200文字目)をコピーして貼り付け、さらにまた次の201文字目から300文字目を・・・ということを200万文字の最後までを自動的にやってくれるソフトはないだろうか、ということです。

できれば、1作業ごとに改行されて段落でまとまるとベターですが、それは必須ではありません。
手作業で2万回コピー&ペーストするのも気が遠くなりますので、それを自動的にやってもらえるものがないかなと思い、ご質問いたしました。

フリーでも有料でも問いません。

  • 質問者:おっぺ
  • 質問日時:2009-06-28 06:39:32
  • 0

http://sooda.jp/qa/148475
こちらも読みましたが元ファイルが解らないとなんとも言えないと思います。
たぶんTHMLファイルだと想像しますが、それだとネット上に有りそうとも思います。
それともデータベースなのか?
PDFなのか?
またOSもWindowsかMacなのか、もう少し情報無いと
http://sooda.jp/qa/148475
これ以上のことは書きづらいと思います。
ーーーーーーーーーーーーーーーーーーーーー
さて要するに画面に写る200万文字をテキスト化したいわけですから
画面上の文字をキャブチャー(スクリーンショット)
http://www.forest.impress.co.jp/lib/pic/piccam/capture/
して、その後OCR
http://e-words.jp/w/OCR.html
でテキスト化するとかだと思いますので私なら、これの自動化の方がいままでの情報から現実的だと思います。

===補足===
極窓
http://www.vector.co.jp/soft/win95/util/se085018.html
こちらを試されてみたらいかがでしょう?

  • 回答者:kudou (質問から3時間後)
  • 0
この回答の満足度
  
とても参考になり、非常に満足しました。回答ありがとうございました。
お礼コメント

OSはウインドウズです。
元ファイルは拡張子が失われていて、いろいろ試してみた結果、InDesignで開けました。普通にドラッグしてコピーしようとすると、途中で不可能になっています。単語や文字の検索をしてみると、普通に全文から検索できます。しかし、コピーはドラッグしている途中でそれ以上できなくなるし、100文字が限界なのです。
キャプチャーしてOCRが最後の手段のようであれば、それを実行したいと思います。
ありがとうございます。

追伸です。
すごいものがありますね。残念ながら、このファイルの件には対応してくれませんでしたが、いろいろ役立ちそうです。
ありがとうございました。

並び替え:

工夫次第でどうにでもなりそうな気がします。
思いついた方法をざっと書きます。

1.テキストエディタで強引に開いて保存してみる。
 テキストエディタを起動して、問題のファイルをウィンドウにドラッグ&ドロップします。
 大抵のファイルならこれで開けます。(バイナリデータの場合はNG)
 もし文字化けしていたら、文字コードを適宜変更します。
 XMLタグの様に無駄な情報があった場合は、それらを全て削除します。
 全部終わったら保存して終了です。
 やるときはメモ帳ではなく、TeraPadなどの高機能エディタを使ってください。

2.InDesignで全選択してコピーしてみる。
 コメントなどから、選択時にマウスでドラッグしていると受け取りました。
 InDesignで開くと、文章が100文字単位のオブジェクトになっている。
 ドラッグによる選択だとオブジェクトを飛び越えることができない。
 よって100文字までしかコピーできない。
 という状態かなと。
 では、Ctrl+Aで全オブジェクトを選択したらどうなりますか?
 全選択してコピーできたら、それで問題解決だと思います。

3.PDFに出力してコピーしてみる。
 PDFに印刷できるソフトをインストールします。
 InDesignで問題のファイルを開き、PDFに出力します。
 出力したPDFをAdobeReaderで開き、テキスト選択ツールで文字列を選択&コピーします。
 PDFに出力する方法は、ネットやSooda!を探せば載ってるので割愛します。

  • 回答者:ふぇん (質問から10時間後)
  • 0
この回答の満足度
  
とても参考になり、非常に満足しました。回答ありがとうございました。
お礼コメント

1について
k2editorで開いてみましたが、文字化けしてしまいました。他の高機能エディタで開けそうなのはあるでしょうか?

2について
これは私の書き方がまだ不明瞭だったのですが、100文字以上をドラッグで選択することまではできても、コピーすると100文字までしかできないのです。
しかし、ドラッグが途中でできなくなるのが項目ごとのオブジェクトになっていて飛び越えられないからだというのは、なるほどと思いました。何か別の時に役立ちそうなことを教えていただけたと思います。ありがとうございます。

3について
これはいけるかもと思いましたが、やってみたところ、できあがったPDFはレイアウト等がめちゃめちゃで、文字化けも発生していました。

そもそも、このファイル自体にいろいろ問題がありそうな気がしてきました。
ありがとうございました。

InDesignで開けたと言うことはテキストである可能性がありますね。と、言うことは全編テキストと判断して(言い過ぎか?)、そのファイルの拡張子を「.txt」にしてはダメなのですか?そうすれば簡単にエディタで開くと思いますけど。Wordでも問題なく。
問題あるのであれば、そのファイルのコピーを造り、それで上記の事をやってみるという手もありますよね。ようは考え様です。

この回答の満足度
  
とても参考になり、非常に満足しました。回答ありがとうございました。
お礼コメント

試してみましたが、文字化けしてしまいました。
ありがとうございました。

この質問をまとめると、
 ・あるファイルのデータをコピーしたい
 ・データ量は約200万文字
 ・何らかの理由で、100文字以上コピーできない
 ・手動コピーだと2万回コピペする必要があり、とてもじゃないが無理
 ・100文字毎に自動でコピペするソフトがあれば、簡単にコピーできるはず
ということですよね?

ここで問題になるのが「あるファイル」と「何らかの理由」のところです。
あるファイルとは、具体的にどのようなファイルなのでしょうか?
テキスト形式で無いなら何形式なのか、拡張子は何なのか、等を教えてください。
また「何らかの理由」についても教えてください。
そのファイルを開くには何か専用のソフトが必要で、そのソフトの制限として「コピーは100文字まで」というのがあるのでしょうか?

結局のところ「100文字以上コピーできないこと」が諸悪の根源ですよね?
200万文字を1回でコピーできれば問題にならないはずです。
それなら、そのような制限がある理由を明確にして、その解除方法を模索する方が簡単なのではないでしょうか?
(コピーできないのは著作権の問題で、コピー自体に違法性があるから具体的には言えない?)

  • 回答者:monn (質問から6時間後)
  • 0
この回答の満足度
  
参考になりました。回答ありがとうございました。
お礼コメント

元ファイルは拡張子が失われていて、いろいろ試してみた結果、InDesignで開けたものです。内容は、塾の教材の古い原稿で、今回これを流用・編集して新規に作成したいと考えています。著作権はたぶん関係ないとは思うのですが……(確かにもともと私が作成したものではないので、うーん、と考えてしまいましたが、たぶん違法性はないのでは・・・?)
単語や文字の検索をしてみると、普通に全文から検索できます。しかし、コピーはドラッグしている途中で項目ごとにそれ以上できなくなるし、できた範囲で試してみても、100文字が限界なのです。
まだ不明瞭なところがあるかと思いますので、引き続きご指摘をお願いします。
(もし、「それはやはり著作権侵害なのだ」ということであれば、あきらめます)

関連する質問・相談

Sooda!からのお知らせ

一覧を見る