#!/bin/sh
# fonevek 0.1
# nouns
#
# $1: a Magyar Ispell gykrknyvtra / Magyar Ispell root directory
# $2: spellchecker

if [ "$1" = "" ]; then
	echo "usage: $0 magyar_ispell_root_directory [spellchecker]"
	exit 1
fi

ROOT=${1:-'.'}
SPELL=${2:-"ISPELL"}

. $ROOT/config

cd $WRKDIR || exit 1

# fnevek ragozsi osztlyokba sorolsa

$AWK -f $AWKDIR/fonev_gen.awk <fonev.1 | sed -e 's/$/\/D/' >>$DICT

# mellknevek -sg/-sg kpzs alakjainak ellltsa,
# s ragozsi osztlyokba val sorolsa

$AWK -f $AWKDIR/mellek_sag.awk <melleknev.1 |
    sed 's#$#/g3#' >>$DICT
    
$AWK -f $AWKDIR/mellek_sag.awk <melleknev.1 | \
    $AWK -f $AWKDIR/fonev_gen.awk >>$DICT

echo_n .

# tulajdonnv llomny feldolgozsa

# tvek kinyerse
cat tulajdonnev*.2 | $AWK -f $AWKDIR/tovek4.awk >>$DICT

cat tulajdonnev*.2 | grep "^	" | tr -d "\t" >>$DICT
cat tulajdonnev*.2 | grep -v "^	" | cut -f 1 >magyar.fonev.1
echo_n .

$AWK -f $AWKDIR/fonev_gen.awk -v tulaj_e=1 <magyar.fonev.1 >>$DICT
echo_n .

# tulajdonnevekbl kpzett mellknvkpzs alakok feldolgozsa
# szably: a sz vgi -i kpzs alakok hangrendjt az azt megelz
# sztag hangrendje dnti el.

cat tulajdonnev*.2 | grep '[aou][bcdfghjklmnprstvxyz]*[	].*i$' | \
    cut -sf 2 >>melleknev_mely.1
cat tulajdonnev*.2 | grep -v "^	" | cut -s -f 2 >>melleknev.1
echo_n .

# fonev_oe zrt tosztly -en/-hez kpzs alakjainak letiltsa
# pl. knyvt, knyven, knyvhez rossz; helyette knyvet, knyvn, knyvhz
# kivtel a knnyen alak, mivel ez ms tbl szrmaz helyes alak

cat fonev_oe.1 | sed 's/$/en\/w/' | egrep -v '(knnyen|csppen|szrnyen)' >>$DICT
cat fonev_oe.1 melleknev_oe.1 melleknev_e.1 | sed 's/$/hez\/w/' >>$DICT
echo_n .


# idegen kiejts, s mozaikszavak feldolgozsa

ragoz() {
	cut -f 1 $1 >> $DICT
	cut -f 1 $1 | sed 's/\(.\)o$/\1/
s/\(.\)$/\1/
s#$#-/0g1'$2'#' >>$DICT
	cut -s -f 2 $1 | $AWK -f $AWKDIR/kotojel.awk >>$DICT
	cut -s -f 3 $1 | $AWK -f $AWKDIR/kotojel.awk >>$DICT
	cut -s -f 4 $1 | $AWK -f $AWKDIR/kotojel.awk | sed 's#$#'$2$3'#' >>$DICT
	cut -s -f 5 $1 | $AWK -f $AWKDIR/kotojel.awk | sed 's#$#'$2$4'#' >>$DICT
	cut -s -f 6 $1 | $AWK -f $AWKDIR/kotojel.awk >>$DICT
	cut -s -f 7 $1 | tr '\t' '\n' >>$DICT
}

ragoz kotojeles_mely.7 /A/U/K/Q/S/s/c/i /A/D/F/U/K /Q/F /S/s/F # /Q/S ideiglenesen
ragoz kotojeles_magas.7 /B/V/L/R/T/t/c/j /B/D/G/V/L /R/G /T/t/G # /R/T ideiglenesen
ragoz kotojeles_magas2.7 /C/W/M/R/T/t/c/j /C/D/H/W/M /R/H /T/t/H # /R/T ideiglenesen
echo_n .

# kthangz nlkli alakok jellse a Z kapcsolval (URH -> URH-/Z)
cat kotojeles_hangzo.1 | sed 's/$/-\/Z/' >>$DICT
echo_n .


# morfonetikus alternns igkbl folyamatos mellknvi igenevek s fnevek
# ellltsa

cat ige_morfo.1 | \
sed 's/\(.*\)[ao]\(.\)$/\1\2\/A\/D\/F\/U\/K\/k\/i\/Q\/X\/Y\
\1\2s\/A\/U\/K\/k\/i\/S\/s\/X\/Y/
s/\(.*\)[ie]\(.\)$/\1\2\/C\/D\/H\/M\/m\/j\/W\/X\/R\/Y\
\1\2s\/B\/V\/L\/l\/j\/T\/t\/X\/Y/' >> $DICT
echo_n .

cat ige_eas.1  > magyar.fonev.1
cat ige_hatosag.1 >> magyar.fonev.1
echo_n .

$AWK -f $AWKDIR/fonev_gen.awk <magyar.fonev.1 | \
    $AWK -f $AWKDIR/igekoto_filter.awk | \
    sed -e 's/$/\/D/' >>$DICT
echo ok.
