Χρήστης:AtouBot/ξεν και PAGENAME στα ξένα λήμματα/ξένα λήμματα 2

  1. λήψη των τίτλων που τροποποιήθηκαν από το μποτ
    εντολή: ./getchangesbyuser.sh today today-1 AtouBot
    cat titles.04-19-2008.txt | awk -F' 2008' '{ print $1 }' > titles-from-bot.txt
    κώδικας εδώ
  2. αφαίρεση αυτών των τίτλων από τον κατάλογο λέξεων που δεν περιέχουν {{ξεν|xx|{{PAGENAME}}}} στο αρχείο χωρίς-ξεν-PAGENAME.xml
    εντολή: cat χωρίς-ξεν-PAGENAME.xml | ./remove-titles.pl titles-from-bot.txt > χωρίς-ξεν-PAGENAME-2.xml
    κώδικας εδώ
  3. κατάλογος λημμάτων με {{ξεν|nn|λήμμα}}, πχ
    {{=fr=}}
    {{-ουσ-|fr|bebe}}
    {{ξεν|fr|bébé}} {{α}} ({{πλ}}: '''bébés''')
    εντολή: cat χωρίς-ξεν-PAGENAME-2.xml | ./parsexml.pl --page > με-ξεν-και-λήμμα.xml
    ενημερωμένος κώδικας του parsexml.pl εδώ
  4. τίτλοι για το replace.py
    grep 'title' με-ξεν-και-λήμμα.xml | sed -e 's/\s*<title>/[[/; s/<\/title>/]]/;' > με-ξεν-και-λήμμα-titles.xml
  5. fixes.py για την μετατροπή {{ξεν|xx|λήμμα}} σε {{ξεν|xx|{{PAGENAME}}}}
    εντολή: python ./replace.py -fix:ksena_lhmmata_2 -file:με-ξεν-και-λήμμα-titles.xml
    κώδικας εδώ
    κατάλογος τίτλων: με-ξεν-και-λήμμα-titles.xml