File size: 315 Bytes
6fc683c
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
set -ex

input_dir=$1
output_dir=$2
dict_file=$3

python preprocess.py  \
    --trainpref $input_dir/train \
    --validpref $input_dir/valid \
    --testpref $input_dir/test \
    --source-lang de --target-lang en \
    --destdir $output_dir \
    --srcdict $dict_file \
    --tgtdict $dict_file \
    --workers 40