2021-01-01から1年間の記事一覧
PDF文書によっては、xpdf の pdftotext で以下のようなエラーが出る Permission Error: Copying of text from this document is not allowed.PDF文書のセキュリティの一つとして「内容のコピーと抽出」という項目が許可しないになっていると、テキスト抽出で…
PDFファイルからテキストを抜き出す必要があり、japanese/xpdfをインストールしている。基本的に /usr/local/etc/xpdfrcの textEncoding UTF-8この行だけ、コメントアウトされているのを有効にして、利用できる。ただ、最新のバージョンでは、 % /usr/local/…