Browse Source

FileConverting Anpassung RegEx fuer Suche/Ersetzen, Testdaten

master
Meikel Bisping 9 months ago
parent
commit
3b31e2e25d
  1. BIN
      dist/memtextfc_libs/memtextfc.jar
  2. 4
      doc/memtext_fileconverting.adoc
  3. 172
      doc/memtext_fileconverting.pdf
  4. BIN
      examplefiles/zp.tgz
  5. 12
      src/de/memtext/fileConverting/FileChecker.java

BIN
dist/memtextfc_libs/memtextfc.jar vendored

Binary file not shown.

4
doc/memtext_fileconverting.adoc

@ -1,5 +1,5 @@ @@ -1,5 +1,5 @@
= Memtext FileConverter
0.9 13.6.2023
0.9.1 7.5.2024
:toc:
@ -128,7 +128,7 @@ memtextfileconverting.x -f /pfad/zur/Datei -oe Windows-1252 @@ -128,7 +128,7 @@ memtextfileconverting.x -f /pfad/zur/Datei -oe Windows-1252
oder
----
memtextfileconverting.x -f /pfad/zur/Datei --ouput-encoding Windows-1252
memtextfileconverting.x -f /pfad/zur/Datei --output-encoding Windows-1252
----
== Logging

172
doc/memtext_fileconverting.pdf

@ -2,11 +2,11 @@ @@ -2,11 +2,11 @@
%ÿÿÿÿ
1 0 obj
<< /Title (Memtext FileConverter)
/Author (0.9 13.6.2023)
/Author (0.9.1 7.5.2024)
/Creator (Asciidoctor PDF 2.3.7, based on Prawn 2.4.0)
/Producer (0.9 13.6.2023)
/ModDate (D:20231204114315+01'00')
/CreationDate (D:20231204115112+01'00')
/Producer (0.9.1 7.5.2024)
/ModDate (D:20240507160933+02'00')
/CreationDate (D:20240507161005+02'00')
>>
endobj
2 0 obj
@ -1995,7 +1995,7 @@ endobj @@ -1995,7 +1995,7 @@ endobj
[25 0 R /XYZ 0 278.61 null]
endobj
29 0 obj
<< /Length 8804
<< /Length 8806
>>
stream
q
@ -2149,7 +2149,7 @@ Q @@ -2149,7 +2149,7 @@ Q
BT
59.24 614.245 Td
/F3.0 11 Tf
<6d656d7465787466696c65636f6e76657274696e672e78202d66202f706661642f7a75722f4461746569202d2d6f757075742d656e636f64696e672057696e646f77732d31323532> Tj
<6d656d7465787466696c65636f6e76657274696e672e78202d66202f706661642f7a75722f4461746569202d2d6f75747075742d656e636f64696e672057696e646f77732d31323532> Tj
ET
0.0 0.0 0.0 SCN
@ -3032,90 +3032,90 @@ xref @@ -3032,90 +3032,90 @@ xref
0 81
0000000000 65535 f
0000000015 00000 n
0000000247 00000 n
0000000449 00000 n
0000000527 00000 n
0000000578 00000 n
0000000850 00000 n
0000014935 00000 n
0000015451 00000 n
0000015620 00000 n
0000015662 00000 n
0000015711 00000 n
0000016033 00000 n
0000016076 00000 n
0000016241 00000 n
0000016448 00000 n
0000016634 00000 n
0000016677 00000 n
0000016849 00000 n
0000026290 00000 n
0000026644 00000 n
0000026688 00000 n
0000026732 00000 n
0000026776 00000 n
0000026820 00000 n
0000036096 00000 n
0000036450 00000 n
0000036494 00000 n
0000036538 00000 n
0000036582 00000 n
0000045439 00000 n
0000045793 00000 n
0000045837 00000 n
0000045972 00000 n
0000046109 00000 n
0000046236 00000 n
0000046363 00000 n
0000046486 00000 n
0000046610 00000 n
0000046739 00000 n
0000046870 00000 n
0000047006 00000 n
0000047142 00000 n
0000047261 00000 n
0000047382 00000 n
0000047504 00000 n
0000047627 00000 n
0000047755 00000 n
0000047883 00000 n
0000048022 00000 n
0000048161 00000 n
0000048279 00000 n
0000048400 00000 n
0000048475 00000 n
0000048665 00000 n
0000048852 00000 n
0000049007 00000 n
0000049178 00000 n
0000049338 00000 n
0000049553 00000 n
0000049748 00000 n
0000049896 00000 n
0000050052 00000 n
0000050228 00000 n
0000050439 00000 n
0000050574 00000 n
0000050664 00000 n
0000050707 00000 n
0000050980 00000 n
0000051253 00000 n
0000058899 00000 n
0000059116 00000 n
0000060470 00000 n
0000061384 00000 n
0000071882 00000 n
0000072094 00000 n
0000073448 00000 n
0000074363 00000 n
0000078995 00000 n
0000079206 00000 n
0000080560 00000 n
0000000249 00000 n
0000000451 00000 n
0000000529 00000 n
0000000580 00000 n
0000000852 00000 n
0000014937 00000 n
0000015453 00000 n
0000015622 00000 n
0000015664 00000 n
0000015713 00000 n
0000016035 00000 n
0000016078 00000 n
0000016243 00000 n
0000016450 00000 n
0000016636 00000 n
0000016679 00000 n
0000016851 00000 n
0000026292 00000 n
0000026646 00000 n
0000026690 00000 n
0000026734 00000 n
0000026778 00000 n
0000026822 00000 n
0000036098 00000 n
0000036452 00000 n
0000036496 00000 n
0000036540 00000 n
0000036584 00000 n
0000045443 00000 n
0000045797 00000 n
0000045841 00000 n
0000045976 00000 n
0000046113 00000 n
0000046240 00000 n
0000046367 00000 n
0000046490 00000 n
0000046614 00000 n
0000046743 00000 n
0000046874 00000 n
0000047010 00000 n
0000047146 00000 n
0000047265 00000 n
0000047386 00000 n
0000047508 00000 n
0000047631 00000 n
0000047759 00000 n
0000047887 00000 n
0000048026 00000 n
0000048165 00000 n
0000048283 00000 n
0000048404 00000 n
0000048479 00000 n
0000048669 00000 n
0000048856 00000 n
0000049011 00000 n
0000049182 00000 n
0000049342 00000 n
0000049557 00000 n
0000049752 00000 n
0000049900 00000 n
0000050056 00000 n
0000050232 00000 n
0000050443 00000 n
0000050578 00000 n
0000050668 00000 n
0000050711 00000 n
0000050984 00000 n
0000051257 00000 n
0000058903 00000 n
0000059120 00000 n
0000060474 00000 n
0000061388 00000 n
0000071886 00000 n
0000072098 00000 n
0000073452 00000 n
0000074367 00000 n
0000078999 00000 n
0000079210 00000 n
0000080564 00000 n
trailer
<< /Size 81
/Root 2 0 R
/Info 1 0 R
>>
startxref
81474
81478
%%EOF

BIN
examplefiles/zp.tgz

Binary file not shown.

12
src/de/memtext/fileConverting/FileChecker.java

@ -34,9 +34,11 @@ import java.util.*; @@ -34,9 +34,11 @@ import java.util.*;
public class FileChecker {
// kann für JUnitTest abgeschaltet werden
public static boolean isSystemExitWanted = true;
private static final String CONTROLREGEX = "[^\\n\\r\\t]]&&\\p{C}]";
// private static final String CONTROLREGEX = "[[^\\n\\r\\t]]&&[\\u0000-\\u001F]]";
private static final String CONTROLREGEX = "[\\p{C}&&[^\\n\\r\\t]]";
// private static final Pattern CONTROLPATTERN = Pattern.compile(CONTROLREGEX);
private static Pattern CONTROLPATTERN = Pattern.compile("[[^\\n\\r\\t]&&\\p{C}]");
private static Pattern CONTROLPATTERN = Pattern.compile("[\\p{C}&&[^\\n\\r\\t]]");
private static final Options options = new Options();
private boolean isDryRun = false;
@ -79,7 +81,7 @@ public class FileChecker { @@ -79,7 +81,7 @@ public class FileChecker {
private static void initOptions() {
options.addOption("ie", "input-encoding", true, "Encoding der Eingabedatei/en (default ISO-8859-15)");
options.addOption("oe", "ouput-encoding", true, "ZielEncoding (default UTF8)");
options.addOption("oe", "output-encoding", true, "ZielEncoding (default UTF8)");
options.addOption("l", "log", true, "debug|info (default)|severe");
options.addOption("n", "dry-run", false, "Ausführung ohne Änderungen");
options.addOption("s", "safe-run", false, "Bei Fehlern Originaldateien als .orig behalten");
@ -249,7 +251,7 @@ public class FileChecker { @@ -249,7 +251,7 @@ public class FileChecker {
System.out.println("Ungültiges outputEncoding: " + outputEncoding);
exitIfWanted();
}
if (outputEncoding.equalsIgnoreCase("UTF-8")) {
if (!outputEncoding.equalsIgnoreCase("UTF-8")) {
isOutputEncodingUTF8 = false;
}
@ -318,6 +320,8 @@ public class FileChecker { @@ -318,6 +320,8 @@ public class FileChecker {
if (outwriter != null) {
if (hasControlChar) {
line = line.replaceAll(CONTROLREGEX, "");
// Ersetzt alle Steuerzeichen von 0 bis 31 durch einen leeren String
// line=line.replaceAll("[\\u0000-\\u001F]", "");
}
if (isReplaceTabsWanted) {
line = line.replace('\t', ' ');

Loading…
Cancel
Save