Χρήστης:AtouBot/ξεν και PAGENAME στα ξένα λήμματα/ξένα λήμματα 10

Un/Le/La/Une σε {{ξεν|nn|{{PAGENAME}}}}

  1. ενημέρωση του αρχείου σελίδων
    εντολή: mv updated.xml.bz2 updated.xml.bz2.sav5; ./updatefromtitles.sh λείπουν-ξεν-PAGENAME-4.xml do_next_titles.txt
  2. αφαίρεση των σελίδων που δεν χρειάζονται επεξεργασία πια
    εντολή: bzcat updated.xml.bz2 | ./parsexml.pl --page > λείπουν-ξεν-PAGENAME-5.xml
  3. ποιες περιπτώσεις έχουμε ακόμη;
    εντολή:cat λείπουν-ξεν-PAGENAME-5.xml | ./parsexml.pl | egrep -v '(als|διεθ|μτγ|μσν|grc)' > FIX
    egrep ':(Un|Une|La|Le) ' FIX > do_next1.txt
  4. αφαίρεση με το χέρι των προβληματικών λημμάτων (όπου έχουμε πχ μια γραμμή σαν "Le -")
    cat do_next1.txt | awk -F':' '{ print $1 }' | sed -e 's/^/[[/g; s/$/]]/g;' > do_next1_titles.txt
  5. fixes.py για μετατροπή σε {{ξεν|nn|{{PAGENAME}}}}
    έντολή: python ./replace.py -fix:ksena_lhmmata_10 -file:do_next1_titles.txt
    κώδικας: εδώ
    λέξεις: εδώ