001 /*
002 * Copyright (c) 2009 The openGion Project.
003 *
004 * Licensed under the Apache License, Version 2.0 (the "License");
005 * you may not use this file except in compliance with the License.
006 * You may obtain a copy of the License at
007 *
008 * http://www.apache.org/licenses/LICENSE-2.0
009 *
010 * Unless required by applicable law or agreed to in writing, software
011 * distributed under the License is distributed on an "AS IS" BASIS,
012 * WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND,
013 * either express or implied. See the License for the specific language
014 * governing permissions and limitations under the License.
015 */
016 package org.opengion.fukurou.process;
017
018 import org.opengion.fukurou.util.Argument;
019 import org.opengion.fukurou.util.StringUtil;
020 import org.opengion.fukurou.util.FileUtil;
021 import org.opengion.fukurou.util.Closer ;
022 import org.opengion.fukurou.util.LogWriter;
023
024 import java.util.Map ;
025 import java.util.HashMap ;
026 import java.util.LinkedHashMap ;
027
028 import java.io.File;
029 import java.io.BufferedReader;
030 import java.io.IOException;
031
032 /**
033 * Process_TableDiffは、ファイルから読み取った?容を?LineModel に設定後?
034 * 下流に渡す?FirstProcess インターフェースの実?ラスです?
035 *
036 * DBTableModel 形式?ファイルを読み取って、各行を LineModel にセ?して?
037 * 下?プロセスチェインの??タは上流から下流に渡されます?)に渡します?
038 *
039 * 引数??中にスペ?スを含??合?、ダブルコー??ション("") で括って下さ??
040 * 引数??の ?』?前後には、スペ?スは挟めません。??key=value の様に
041 * 繋げてください?
042 *
043 * @og.formSample
044 * Process_TableDiff -infile1=INFILE -infile2=INFILE2 -action=DIFF1 -encode=UTF-8 -columns=AA,BB,CC
045 *
046 * -infile1=入力ファイル? ??力ファイル?
047 * -infile2=入力ファイル? ??力ファイル?
048 * -action=比?果の方? ?ONLY,DIFF,INTERSEC
049 * [-sep1=セパレータ?? ] ?区???(初期値:タ?
050 * [-sep2=セパレータ?? ] ?区???(初期値:タ?
051 * [-encode1=?エンコー? ] ??力ファイルのエンコードタイ?
052 * [-encode2=?エンコー? ] ??力ファイルのエンコードタイ?
053 * [-columns=読み取りカラ? ] ??力カラ?(カンマ区?)
054 * [-keyClms=比?るカラ? ] ?比?る?の基準カラ?(カンマ区?)
055 * [-diffClms=比?るカラ?] ?比?るカラ?(カンマ区?)
056 * [-display=[false/true] ] ?結果を標準?力に表示する(true)かしな?false)?初期値:false[表示しない])
057 * [-debug=[false/true] ] ?デバッグ??を標準?力に表示する(true)かしな?false)?初期値:false[表示しない])
058 *
059 * @og.rev 4.2.3.0 (2008/05/26) 新規作?
060 *
061 * @version 4.0
062 * @author Kazuhiko Hasegawa
063 * @since JDK5.0,
064 */
065 public class Process_TableDiff extends AbstractProcess implements FirstProcess {
066 private static final String ENCODE = System.getProperty("file.encoding");
067
068 private String separator1 = TAB; // ?区???
069 private String separator2 = TAB; // ?区???
070 private String infile1 = null;
071 private String infile2 = null;
072 private BufferedReader reader1 = null;
073 // private BufferedReader reader2 = null;
074 private LineModel model = null;
075 private String line = null;
076 private int[] clmNos = null; // ファイルのヘッ??のカラ?号
077 private int[] keyClmNos = null; // 比?る?の基準カラ?のカラ?号
078 private int[] diffClmNos = null; // 比?るカラ?のカラ?号
079 // private String action = null;
080 private String actCmnd = null; // action から名称変更
081 private boolean display = false; // 表示しな?
082 private boolean debug = false; // 表示しな?
083 private boolean nameNull = false; // ?件??タ?true
084
085 private final Map<String,String> file2Map = new HashMap<String,String>(); // 4.3.1.1 (2008/08/23) final?
086
087 private int inCount1 = 0;
088 private int inCount2 = 0;
089 private int outCount = 0;
090
091 private static final Map<String,String> mustProparty ; // ?プロパティ???チェ?用 Map
092 private static final Map<String,String> usableProparty ; // ?プロパティ?整合?チェ? Map
093
094 static {
095 mustProparty = new LinkedHashMap<String,String>();
096 mustProparty.put( "infile1", "入力ファイル? (??)" );
097 mustProparty.put( "infile2", "入力ファイル? (??)" );
098 mustProparty.put( "action", "(??)ONLY,DIFF,INTERSEC" );
099 mustProparty.put( "keyClms", "比?る?の基準カラ?(??)(カンマ区?)" );
100 mustProparty.put( "diffClms", "比?るカラ?(??)(カンマ区?)" );
101
102 usableProparty = new LinkedHashMap<String,String>();
103 usableProparty.put( "sep1", "区??? (初期値:タ?" );
104 usableProparty.put( "sep2", "区??? (初期値:タ?" );
105 usableProparty.put( "encode1", "入力ファイルのエンコードタイ?" );
106 usableProparty.put( "encode2", "入力ファイルのエンコードタイ?" );
107 usableProparty.put( "columns", "入力カラ?(カンマ区?)" );
108 usableProparty.put( "display", "結果を標準?力に表示する(true)かしな?false)? +
109 CR + " (初期値:false:表示しな?" );
110 usableProparty.put( "debug", "????を標準?力に表示する(true)かしな?false)? +
111 CR + " (初期値:false:表示しな?" );
112 }
113
114 /**
115 * ?ォルトコンストラクター?
116 * こ?クラスは、動??されます??ォルトコンストラクターで?
117 * super クラスに対して、?な初期化を行っておきます?
118 *
119 */
120 public Process_TableDiff() {
121 super( "org.opengion.fukurou.process.Process_TableDiff",mustProparty,usableProparty );
122 }
123
124 /**
125 * プロセスの初期化を行います?初めに??、呼び出されます?
126 * 初期処?ファイルオープン??オープン?に使用します?
127 *
128 * @param paramProcess ??タベ?スの接続???などを持って?オブジェク?
129 */
130 public void init( final ParamProcess paramProcess ) {
131 Argument arg = getArgument();
132
133 infile1 = arg.getProparty( "infile1" );
134 infile2 = arg.getProparty( "infile2" );
135 actCmnd = arg.getProparty( "action" );
136 String encode1 = arg.getProparty( "encode1",ENCODE );
137 String encode2 = arg.getProparty( "encode2",ENCODE );
138 separator1 = arg.getProparty( "sep1",separator1 );
139 separator2 = arg.getProparty( "sep2",separator2 );
140 String clms = arg.getProparty( "columns" );
141 String keyClms = arg.getProparty( "keyClms" );
142 String diffClms = arg.getProparty( "diffClms" );
143 display = arg.getProparty( "display",display );
144 debug = arg.getProparty( "debug" ,debug );
145 // if( debug ) { println( arg.toString() ); } // 5.7.3.0 (2014/02/07) ????
146
147 if( infile1 == null || infile2 == null ) {
148 String errMsg = "ファイル名が?されて?せん?
149 + "File1=[" + infile1 + "] , File2=[" + infile2 + "]" ;
150 throw new RuntimeException( errMsg );
151 }
152
153 File file1 = new File( infile1 );
154 File file2 = new File( infile2 );
155
156 if( ! file1.exists() || ! file2.exists() ) {
157 // 4.3.1.1 (2008/08/23) Avoid if (x != y) ..; else ..;
158 String errMsg = "ファイルが存在しません?
159 + ((file1.exists()) ? "" : "File1=[" + file1 + "] " )
160 + ((file2.exists()) ? "" : "File2=[" + file2 + "]" );
161 throw new RuntimeException( errMsg );
162 }
163
164 if( ! file1.isFile() || ! file2.isFile() ) {
165 // 4.3.1.1 (2008/08/23) Avoid if (x != y) ..; else ..;
166 String errMsg = "フォル???できません。ファイル名を?してください?
167 + ((file1.isFile()) ? "" : "File1=[" + file1 + "] " )
168 + ((file2.isFile()) ? "" : "File2=[" + file2 + "]" );
169 throw new RuntimeException( errMsg );
170 }
171
172 reader1 = FileUtil.getBufferedReader( file1,encode1 );
173 // reader2 = FileUtil.getBufferedReader( file2,encode2 );
174
175 final String[] names ;
176 if( clms != null ) {
177 names = StringUtil.csv2Array( clms ); // ??カラ?配?
178 }
179 else {
180 String[] clmNames = readName( reader1 ); // ファイルのカラ?配?
181 if( clmNames == null || clmNames.length == 0 ) { nameNull = true; return ; }
182 names = clmNames;
183 }
184
185 model = new LineModel();
186 model.init( names );
187
188 if( display ) { println( model.nameLine() ); }
189
190 // 入力カラ?のカラ?号
191 clmNos = new int[names.length];
192 for( int i=0; i<names.length; i++ ) {
193 clmNos[i] = i+1; // 行番号??1しておく?
194 // int no = model.getColumnNo( names[i] );
195 // if( no >= 0 ) { clmNos[no] = i+1; } // 行番号??1しておく?
196 }
197
198 // 比?る?の基準カラ?
199 if( debug ) { println( "DEBUG:\tkeyClms=" + keyClms ); }
200 final String[] keyClmNms = StringUtil.csv2Array( keyClms );
201 keyClmNos = new int[keyClmNms.length];
202 for( int i=0; i<keyClmNms.length; i++ ) {
203 keyClmNos[i] = model.getColumnNo( keyClmNms[i] );
204 // if( debug ) { println( "DEBUG:" + keyClmNms[i] + ":[" + keyClmNos[i] + "]" ); }
205 // int no = model.getColumnNo( keyClmNms[i] );
206 // if( no >= 0 ) { keyClmNos[no] = i+1; } // 行番号??1しておく?
207 }
208
209 // 比?るカラ?
210 if( debug ) { println( "DEBUG:\tdiffClms=" + diffClms ); }
211 final String[] diffClmNms = StringUtil.csv2Array( diffClms );
212 diffClmNos = new int[diffClmNms.length];
213 for( int i=0; i<diffClmNms.length; i++ ) {
214 diffClmNos[i] = model.getColumnNo( diffClmNms[i] );
215 // if( debug ) { println( "DEBUG:" + diffClmNms[i] + ":[" + diffClmNos[i] + "]" ); }
216 // int no = model.getColumnNo( diffClmNms[i] );
217 // if( no >= 0 ) { diffClmNos[no] = i+1; } // 行番号??1しておく?
218 }
219
220 readF2Data( file2,encode2 );
221 }
222
223 /**
224 * プロセスの終?行います??に??、呼び出されます?
225 * 終???ファイルクローズ??クローズ?に使用します?
226 *
227 * @param isOK ト?タルで、OK?たかど?[true:成功/false:失敗]
228 */
229 public void end( final boolean isOK ) {
230 Closer.ioClose( reader1 );
231 reader1 = null;
232 }
233
234 /**
235 * こ???タの処?おいて、次の処?出来るかど?を問?わせます?
236 * こ?呼び出し1回毎に、次の??タを取得する準備を行います?
237 *
238 * @return 処?きる:true / 処?きな?false
239 */
240 public boolean next() {
241 if( nameNull ) { return false; }
242
243 boolean flag = false;
244 try {
245 while((line = reader1.readLine()) != null) {
246 inCount1++ ;
247 if( line.length() == 0 || line.charAt( 0 ) == '#' ) { continue; }
248 else {
249 flag = true;
250 break;
251 }
252 }
253 }
254 catch (IOException ex) {
255 String errMsg = "ファイル読込みエラー[" + infile1 + "]:(" + inCount1 + ")" ;
256 throw new RuntimeException( errMsg,ex );
257 }
258 return flag;
259 }
260
261 /**
262 * ??に?行データである LineModel を作?しま?
263 * FirstProcess は、次?処?チェインして???の行データ?
264 * 作?して、後続? ChainProcess クラスに処?ータを渡します?
265 *
266 * ファイルより読み込んだ?行???タ???ブルモ?に
267 * セ?するように?しま?
268 * なお?読込みは?NAME??読み込みます???タ件数が少な??合??
269 * "" をセ?しておきます?
270 *
271 * @param rowNo 処?の行番号
272 *
273 * @return 処?換後?LineModel
274 */
275 public LineModel makeLineModel( final int rowNo ) {
276 outCount++ ;
277 String[] vals = StringUtil.csv2Array( line ,separator1.charAt(0) );
278
279 int len = vals.length;
280 for( int clmNo=0; clmNo<model.size(); clmNo++ ) {
281 int no = clmNos[clmNo];
282 if( len > no ) {
283 model.setValue( clmNo,vals[no] );
284 }
285 else {
286 // EXCEL が?終端TABを削除してしま?め?少な??合?埋める?
287 model.setValue( clmNo,"" );
288 }
289 }
290 model.setRowNo( rowNo ) ;
291
292 // if( display ) { println( model.dataLine() ); } // 5.1.2.0 (2010/01/01) display の条件変更
293
294 return action( model );
295 }
296
297 /**
298 * キーと、DIFF設定?を比?、action に応じ?LineModel を返します?
299 * action には、ONLY,DIFF,INTERSEC が指定できます?
300 * ONLY inFile1 のみに存在する行?場合?inFile1 のレコードを返します?
301 * DIFF inFile1 と inFile2 に存在し?かつ、DIFF値が異なる?inFile1 のレコードを返します?
302 * INTERSEC inFile1 と inFile2 に存在し?かつ、DIFF値も同じ?inFile1 のレコードを返します?
303 * inFile2 側をキャ?ュします?で、inFile2 側の??タ量が少な?に選んでください?
304 *
305 * @param model LineModelオブジェク?
306 *
307 * @return 実行後?LineModel
308 */
309 private LineModel action( final LineModel model ) {
310 LineModel rtn = null;
311 Object[] obj = model.getValues();
312
313 // キーのカラ?合?します?
314 StringBuilder keys = new StringBuilder();
315 for( int i=0; i<keyClmNos.length; i++ ) {
316 keys.append( obj[keyClmNos[i]] ).append( "," );
317 }
318
319 String data = file2Map.get( keys.toString() );
320 // if( debug ) { println( "DEBUG:" + keys.toString() + ":" + data ); }
321
322 if( "ONLY".equalsIgnoreCase( actCmnd ) && data == null ) {
323 if( debug ) { println( "DEBUG:ONLY\t" + keys.toString() ); }
324 rtn = model;
325 }
326 else {
327 // DIFF値のカラ?合?します?
328 StringBuilder vals = new StringBuilder();
329 for( int i=0; i<diffClmNos.length; i++ ) {
330 vals.append( obj[diffClmNos[i]] ).append( "," );
331 }
332
333 boolean eq = ( vals.toString() ).equals( data );
334
335 if( "DIFF".equalsIgnoreCase( actCmnd ) && ! eq ) {
336 if( debug ) { println( "DEBUG:DIFF\t" + keys.toString() + "\t" + data + "\t" + vals.toString() ); }
337 rtn = model;
338 }
339 else if( "INTERSEC".equalsIgnoreCase( actCmnd ) && eq ) {
340 if( debug ) { println( "DEBUG:INTERSEC\t" + keys.toString() + "\t" + data ); }
341 rtn = model;
342 }
343 }
344 if( display && rtn != null ) { println( rtn.dataLine() ); }
345 return rtn;
346 }
347
348 /**
349 * BufferedReader より?NAME 行??名情報を読み取ります?
350 * ??タカラ?り前に??目名情報を示?"#Name" が存在する仮定で取り込みます?
351 * こ?行?、ファイルの形式に無関係に、TAB で区?れて?す?
352 *
353 * @param reader PrintWriterオブジェク?
354 *
355 * @return カラ?配?(存在しな??合?、サイズ??配?)
356 */
357 private String[] readName( final BufferedReader reader ) {
358 try {
359 // 4.0.0 (2005/01/31) line 変数名変更
360 String line1;
361 while((line1 = reader.readLine()) != null) {
362 inCount1++ ;
363 if( line1.length() == 0 ) { continue; }
364 if( line1.charAt(0) == '#' ) {
365 String key = line1.substring( 0,5 );
366 if( key.equalsIgnoreCase( "#NAME" ) ) {
367 // ?レギュラー処???の TAB 以前???無視する?
368 String line2 = line1.substring( line1.indexOf( TAB )+1 );
369 return StringUtil.csv2Array( line2 ,TAB.charAt(0) );
370 }
371 else { continue; }
372 }
373 else {
374 String errMsg = "#NAME が見つかる前に??タが見つかりました?;
375 throw new RuntimeException( errMsg );
376 }
377 }
378 }
379 catch (IOException ex) {
380 String errMsg = "ファイル読込みエラー[" + infile1 + "]:(" + inCount1 + ")" ;
381 throw new RuntimeException( errMsg,ex );
382 }
383 return new String[0];
384 }
385
386 /**
387 * ファイル属?を読取り、キー??を作?し??メモリマップにキャ?ュします?
388 * こ?マップをもとに、inFile1 の??タを?次読み取って、??進めます?
389 *
390 * @param file2 読取り??ファイル
391 * @param encode2 ファイルのエンコー?
392 */
393 private void readF2Data( final File file2, final String encode2 ) {
394 BufferedReader reader2 = null;
395 try {
396 if( debug ) { println( "DEBUG:\tFile2="+ file2 + " 初期処? ); }
397 reader2 = FileUtil.getBufferedReader( file2,encode2 );
398 // 4.0.0 (2005/01/31) line 変数名変更
399 String line1;
400 char sep2 = separator2.charAt(0);
401 while((line1 = reader2.readLine()) != null) {
402 inCount2++ ;
403 if( line1.length() == 0 ) { continue; }
404 if( line1.charAt(0) == '#' ) { continue; }
405 else {
406 // ?レギュラー処???の TAB 以前???無視する?
407 String line2 = line1.substring( line1.indexOf( separator2 )+1 );
408 Object[] obj = StringUtil.csv2Array( line2 , sep2 );
409
410 // キーのカラ?合?します?
411 StringBuilder keys = new StringBuilder();
412 for( int i=0; i<keyClmNos.length; i++ ) {
413 keys.append( obj[keyClmNos[i]] ).append( "," );
414 }
415
416 // DIFF値のカラ?合?します?
417 StringBuilder vals = new StringBuilder();
418 for( int i=0; i<diffClmNos.length; i++ ) {
419 vals.append( obj[diffClmNos[i]] ).append( "," );
420 }
421
422 if( debug ) { println( "DEBUG:\t" + keys.toString() + "\t" + vals.toString() ); }
423
424 file2Map.put( keys.toString(), vals.toString() );
425 }
426 }
427 if( debug ) { println( "DEBUG:\t======初期処??=====" ); }
428 }
429 catch (IOException ex) {
430 String errMsg = "ファイル読込みエラー[" + infile2 + "]:(" + inCount2 + ")" ;
431 throw new RuntimeException( errMsg,ex );
432 }
433 finally {
434 Closer.ioClose( reader2 );
435 }
436 }
437
438 /**
439 * プロセスの処?果のレポ?ト表現を返します?
440 * 処??ログラ?、?力件数、?力件数などの??です?
441 * こ???をそのまま、標準?力に出すことで、結果レポ?トと出来るよ?
442 * 形式で出してください?
443 *
444 * @return 処?果のレポ??
445 */
446 public String report() {
447 String report = "[" + getClass().getName() + "]" + CR
448 + TAB + "Input File1 : " + infile1 + CR
449 + TAB + "Input File2 : " + infile2 + CR
450 + TAB + "Input Count1 : " + inCount1 + CR
451 + TAB + "Input Count2 : " + inCount2 + CR
452 + TAB + "Output Count : " + outCount ;
453
454 return report ;
455 }
456
457 /**
458 * こ?クラスの使用方法を返します?
459 *
460 * @return こ?クラスの使用方?
461 */
462 public String usage() {
463 StringBuilder buf = new StringBuilder();
464
465 buf.append( "Process_TableDiffは、ファイルから読み取った?容を?LineModel に設定後?" ).append( CR );
466 buf.append( "下流に渡す?FirstProcess インターフェースの実?ラスです?" ).append( CR );
467 buf.append( CR );
468 buf.append( "DBTableModel 形式?ファイルを読み取って、各行を LineModel にセ?して? ).append( CR );
469 buf.append( "下?プロセスチェインの??タは上流から下流に渡されます?)に渡します?" ).append( CR );
470 buf.append( CR );
471 buf.append( "引数??中に空白を含??合?、ダブルコー??ション(\"\") で括って下さ??" ).append( CR );
472 buf.append( "引数??の ?』?前後には、空白は挟めません。??key=value の様に" ).append( CR );
473 buf.append( "繋げてください? ).append( CR );
474 buf.append( CR ).append( CR );
475
476 buf.append( getArgument().usage() ).append( CR );
477
478 return buf.toString();
479 }
480
481 /**
482 * こ?クラスは、main メソ?から実行できません?
483 *
484 * @param args コマンド引数配?
485 */
486 public static void main( final String[] args ) {
487 LogWriter.log( new Process_TableDiff().usage() );
488 }
489 }