]> _ Git - cubeextranet.git/blob
9f1b0e54d9a3e16d9ef832be29f7c2850c604de1
[cubeextranet.git] /
1 # Licensed to the Apache Software Foundation (ASF) under one or more\r
2 # contributor license agreements.  See the NOTICE file distributed with\r
3 # this work for additional information regarding copyright ownership.\r
4 # The ASF licenses this file to You under the Apache License, Version 2.0\r
5 # (the "License"); you may not use this file except in compliance with\r
6 # the License.  You may obtain a copy of the License at\r
7 #\r
8 #      http://www.apache.org/licenses/LICENSE-2.0\r
9 #\r
10 # Unless required by applicable law or agreed to in writing, software\r
11 # distributed under the License is distributed on an "AS IS" BASIS,\r
12 # WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied.\r
13 # See the License for the specific language governing permissions and\r
14 # limitations under the License.\r
15 \r
16 # This table is maps PDF stream operators to concrete OperatorProcessor\r
17 # subclasses that are used by the PDFStreamEngine class to interpret the\r
18 # PDF document. The classes configured here allow the PDFTextStripper\r
19 # subclass of PDFStreamEngine to extract text content of the document.\r
20 \r
21 BT = org.apache.pdfbox.util.operator.BeginText\r
22 cm = org.apache.pdfbox.util.operator.Concatenate\r
23 Do = org.apache.pdfbox.util.operator.Invoke\r
24 ET = org.apache.pdfbox.util.operator.EndText\r
25 gs = org.apache.pdfbox.util.operator.SetGraphicsStateParameters\r
26 q  = org.apache.pdfbox.util.operator.GSave\r
27 Q  = org.apache.pdfbox.util.operator.GRestore\r
28 T* = org.apache.pdfbox.util.operator.NextLine\r
29 Tc = org.apache.pdfbox.util.operator.SetCharSpacing\r
30 Td = org.apache.pdfbox.util.operator.MoveText\r
31 TD = org.apache.pdfbox.util.operator.MoveTextSetLeading\r
32 Tf = org.apache.pdfbox.util.operator.SetTextFont\r
33 Tj = org.apache.pdfbox.util.operator.ShowText\r
34 TJ = org.apache.pdfbox.util.operator.ShowTextGlyph\r
35 TL = org.apache.pdfbox.util.operator.SetTextLeading\r
36 Tm = org.apache.pdfbox.util.operator.SetMatrix\r
37 Tr = org.apache.pdfbox.util.operator.SetTextRenderingMode\r
38 Ts = org.apache.pdfbox.util.operator.SetTextRise\r
39 Tw = org.apache.pdfbox.util.operator.SetWordSpacing\r
40 Tz = org.apache.pdfbox.util.operator.SetHorizontalTextScaling\r
41 w  = org.apache.pdfbox.util.operator.SetLineWidth\r
42 \' = org.apache.pdfbox.util.operator.MoveAndShow\r
43 \" = org.apache.pdfbox.util.operator.SetMoveAndShow\r
44 \r
45 # The following operators are not relevant to text extraction,\r
46 # so we can silently ignore them.\r
47 \r
48 b\r
49 B\r
50 b*\r
51 B*\r
52 BDC\r
53 BI\r
54 BMC\r
55 BX\r
56 c\r
57 CS\r
58 cs\r
59 d\r
60 d0\r
61 d1\r
62 DP\r
63 El\r
64 EMC\r
65 EX\r
66 f\r
67 F\r
68 f*\r
69 G\r
70 g\r
71 h\r
72 i\r
73 ID\r
74 j\r
75 J\r
76 K\r
77 k\r
78 l\r
79 m\r
80 M\r
81 MP\r
82 n\r
83 re\r
84 RG\r
85 rg\r
86 ri\r
87 s\r
88 S\r
89 SC\r
90 sc\r
91 SCN\r
92 scn\r
93 sh\r
94 v\r
95 W\r
96 W*\r
97 y\r