PDFの電子書籍を翻訳したり、PDF書籍を参考にemacsでソースコードを書いたりするときに、PDF内のソースコードや文章のコピー&ペーストが面倒でした。PDFからテキストデータだけを一気に抽出できないかな?と探していたら、Mac標準のAutomatorで超簡単にできることが分かりビックリした。ネタ元はこちらの記事。
元記事が文章だけで書かれているので、画面キャプチャで再現すると以下のステップ。
MacでAutomatorを起動する

- 新規ワークフローで『カスタム』を選び『選択』をクリックする
Automatorでアプリケーションを作成

- 『ライブラリ』から『PDF』を選択。
- 『PDFテキストを取り出す』を右側にドラックする。
- 出力形式などの設定項目を指定。
Automatorでアプリケーションとして保存

- メニューの『ファイル』から、『別名で保存』を選択。
- 名前をつけて、『フォーマット』に『アプリケーション』を選択して保存。
PDFをTextファイルに変換する
- デスクトップに保存したAutomatorアプリケーションに、PDFファイルをドラッグ&ドロップする。
- PDFファイル全体が、テキストファイルとして保存される。
テキストファイルとして開く

- テキストファイルをemacsで開いたり、リッチテキストファイルをワードで開いたり。
- emacs で自由に検索や、コピー&ペースト、さらには正規表現を用いた強力なテキスト処理を実行できます。
Posted by
Jun Kaneko at 20:22
個別ページ
|
コメント (0)
|
トラックバック (0)
|

|
作成したプラグインをGitHubにアップしたあとに、ZIPアーカイブをダウンロード可能にする手順をメモ。まずは前提条件として、ローカルのGitとGitHubとの連携が完了していること。
そのうえで、GitHubで管理しているソースコードにタグを打って、GitHubにプッシュすると、"Downloads" から各タグのパッケージをダウンロードできるようになります。以下を、Macのターミナルで実行。
% git commit -a -m "Some Message for this commit"
% git push origin master
% git tag -a 0.1 -m "Some Message for this tag."
% git tag
0.1
% git show 0.1
該当タグのコミットの内容が表示される
% git push --tags
タグがGitHubにPushされる
そうすると、GitHubのレポジトリのダウンロードセクションに、自動でタグ毎のアーカイブファイルが作成されて、ダウンロードできるようになります。
Posted by
Jun Kaneko at 00:17
個別ページ
|
コメント (2)
|
トラックバック (0)
|

|
周囲で評判の高い映画『Inception』を見てきました。まともに感想を書こうとすると、とても長くなりそうなので、受けたインスピレーションだけをさらっと綴ってみます。

非常にシンプルなアルゴリズムで、夢を論理的に定義して、確保した広い余白を、人間的なドラマで彩った作品。SFやファンタジーは、どうしても背景説明が長くなりがち。その世界観に入り込むのにハードルがあるのですが、Inception は世界の定義をわずか数行のロジックにまとめてしまった。そのロジックは、すぐれたアルゴリズムがそうであるように、再帰的に呼び出し可能になっている。個人の夢を多重に継承することで、複雑な多次元世界を展開しつつも、たったひとつの論理演算でエンディングを導きだしている。
『アバター』は3Dゴーグルで視覚的な錯視を引き起こすのに対し、『Inception』はアルゴリズムで直感的な錯覚を閃かせる。その場にいた人同士が、「なんだか世界の秘密が分かったような錯覚」を共有してしまうトリップ感は、創作意欲をかき立てるのも事実で、Inceptionの世界を図式化する、というコンテストも開催されているようです。


Posted by
Jun Kaneko at 23:49
個別ページ
|
コメント (0)
|
トラックバック (0)
|

|