2012年7月30日18:06の@Dennisさんの回答の補足です。彼は確かに難しいケースに対応しています。
Smedley For Commissioner
のように、透かしがシンプルで飾り気のないテキストである最も単純なケースでは、非圧縮PDFの透かしは次のように定義されるかもしれません。
BT
75.96 625 Td
(Smedley For Commissioner)Tj
ET
ここで、75.96
はこの特定の透かしインスタンスの水平オフセット、625
は垂直オフセットです。
以下のような正規表現は、このような透かしの配置のばらつきを無視して、すべての透かしに対して機能します。
^BT\n[0-9.]+ [0-9.]+ Td\n\(Smedley For Commissioner\)Tj\nET\n
ただし、より複雑な書式を持つ透かしに対しては、さまざまな修正 PDF 演算子が作用する可能性があることに注意してください。このような気取りは、読者が連続した、探しやすい文字列であると期待している(期待している)ものを、アルファベットスープの混乱に変えてしまうことがあります。例えば、
E1 = mc² by Smedley™
これの産物かもしれません。
BT
75.96 625 Td
(E)Tj
-5 Ts
(1)Tj
0 Ts
( = mc)Tj
5 Ts
(2)Tj
0 Ts
(by Smedley)Tj
5 Ts
(TM)Tj
0 Ts
ET
……..あるいは、透かしがカラーで強調されている場合は、はるかに悪い!
0x1&
……..あるいは、透かしがカラーで強調されている場合はもっと悪い! 全然お得じゃないですよ!
一方で、そのウェブサイトでは現在、Windows 8
とOS X 10.8 Mountain Lion
を通してO/Sを完全にサポートしていると宣伝しています。そのヴィンテージは4年以上前のものです。PDFtkは時代遅れになっているのでしょうか?そうではないと思いますが、私にはわかりません。