επιστροφή στο Lou bot

ΑλλαγέςΕπεξεργασία

===Παράγωγες μορφές===                                       ok
===Συνώνυμες===, ===Συνόνυμες=== χωρίς τίποτα μετά           ok
==Ελληνικά==                                                 ok
===Ουσιαστικό===                                             ok
===Συγγενικά=== χωρίς να ακολουθεί τίποτα                    ok
{{-βλεπ-}} χωρίς να ακολουθεί τίποτα                         ok


Αρχείο fixes.py για τα πρότυπα pagename ξένων γλωσσώνΕπεξεργασία

# -*- coding: utf-8  -*-
help = """
  * HTML  - Convert HTML tags to wiki syntax, and fix XHTML.
"""  
import codecs
import sys, re


fixes = {
    'xen': {
        'regex' : True,
        'msg': {
            'el':u'Bot: μορφοποίηση',                                                                            
        },
        'replacements': [
            # Αφαίρεση των εισαγωγικών πριν το {{ξεν|xx|XXX}}
            (u'\n\'\'\'\{\{ξεν\|([a-z\-]+)\|\{\{PAGENAME\}\}\}\}\'\'\'( *)\r', u'\n{{ξεν|\\1|{{PAGENAME}}}}\r'),
      ],
   },
}


Συντομομορφές κλπΕπεξεργασία

Πρόκειται για ένα πακέτο διορθώσεων.

  1. Βγαίνει το πρότυπο -ουσ- και μπαίνει το καινούργιο -σμμ- (συντομομορφή).   Έγινε
  2. Διορθώνεται το πρότυπο «αρκτ» ώστε να κατηγοριοποιεί αυτόματα το άρθρο στα «Αρκτικόλεξα (ελληνικά)», υποκατηγορία του «Συντομομορφές (ελληνικά)».   Έγινε
    Σημείωση: εάν η λέξη δεν είναι ελληνική, πρέπει να μπει ο κωδικός γλώσσας (πχ. αρκτ|fr).
  3. Αφαιρείται η κατηγορία «Ελληνικά αρκτικόλεξα».   Έγινε

Αρχείο fixes.pyΕπεξεργασία

# -*- coding: utf-8  -*-
help = """
  * HTML  - Convert HTML tags to wiki syntax, and fix XHTML.
"""  
import codecs
import sys, re


fixes = {
    'smm': {
        'regex' : True,
        'msg': {
            'el':u'Ανταλλαγή προτύπου -ουσ- προς -σμμ-',                                                                            
        },
        'replacements': [
            # α' φάση (αλλαγή -ουσ- σε -σμμ- στην κατηγορία αρκτικόλεξα)
            (u'\n\{\{-ουσ-\|el\}\}( *)\r', u'\n{{-σμμ-|el}}\r'),
            # γ' φάση (αφαίρεση της κατηγορίας, τώρα πια το πρότυπο αρκτ κάνει τη δουλειά!)
            (u'\[\[Κατηγορία:Ελληνικά αρκτικόλεξα\]\]( *)', u''),
      ],
   },
}

ΕντολήΕπεξεργασία

replace_EL.py -fix:smm -log -cat:Ελληνικά_αρκτικόλεξα

Πρότυπο «αρκτ»Επεξεργασία

...στη σημερινή του μορφή

<span title="Συντομογραφία από τα αρχικά λέξεων που διαβάζεται σαν μια λέξη.">''αρκτικόλεξο''</span>

...και στην προτεινόμενη μέλλουσα μορφή του

<span title="Συντομογραφή από τα αρχικά λέξεων που διαβάζονται ένα ένα."><font color="#002000">''αρκτικόλεξο''</font></span><includeonly>{{#if: {{{nocat|}}} | | [[Κατηγορία:Αρκτικόλεξα {{{{{1|el}}}}}]] }}</includeonly><noinclude>
{{αρκτικόλεξο/Οδηγίες}}
[[Κατηγορία:Πρότυπα του Βικιλεξικού|αρκτικολεξο]]
</noinclude>

Διόρθωση του προτύπου {{θηλ_του}}Επεξεργασία

...ώστε να δέχεται παράμετρο. Σκοπός: η διευκόλυνση της συντήρησης του ΒΛ (και η εξομοίωση όλων των προτύπων).

Σε πρώτη φάση, διορθώθηκανε «με το χέρι» τα ξένα άρθρα (μόνο γαλλικά), καθώς και μερικά λάθη.

Σε δεύτερη φάση, αρχίζει το μποτ. Πρώτα τα θηλυκά σε «-ες» (ΟΑΚ πληθυντικού).

Αρχείο fixes.pyΕπεξεργασία

# -*- coding: utf-8  -*-
help = """
  * HTML  - Convert HTML tags to wiki syntax, and fix XHTML.
"""  

import codecs
import sys, re

fixes = {
    'prot': {
        'regex' : True,
        'msg': {
            'el':u'Διόρθωση προτύπου',                                                                            
        },

        'replacements': [
            (u'\n\{\{-μορφ-επιθ-\|el\}\}\r', u'\n\r\n{{-μορφ-επιθ-|el}}\r'),
            (u'\n\'\'\'(.*)\'\'\'\r', u"\n'''{{PAGENAME}}'''\r"),
            (u'\n\* \{\{θηλ_του\}\} \'\'\[\[(.*)\]\]\'\',( *)\{\{πτώσειςΟΑΚπλ\}\}', u'\n* {{θηλ_του|\\1}}, {{πτώσειςΟΑΚπλ}}'),
      ],
   },
}

ΕντολήΕπεξεργασία

python replace_EL.py -fix:prot -log -file:fem-tou

Εδώ βρίσκονται τα αρχεία fem-tou, θηλ03, θηλ04.

Διάφορα σχετικά με τις μεταφράσειςΕπεξεργασία

Αρχείο fixes.pyΕπεξεργασία

# -*- coding: utf-8  -*-
help = """
  * HTML  - Convert HTML tags to wiki syntax, and fix XHTML.
"""
import codecs
import sys, re


fixes = {
    'diafora': {
        'regex' : True,
        'msg': {
            'el':u'Πρότυπα στις κλιτές μορφές ουσιαστικών',
        },
        'replacements': [
                        (u"<!-- Γράψτε κάθε λέξη μέσα στις αγκύλες \[\[ \]\] \r\n( *)για να δημιουργηθεί σύνδεσμος. -->\r\n<!-- Μετά, βγάλτε τα βελάκια για να εμφανιστεί κάθε γλώσσα. -->", u''),
       ],
   },
}

Λέξεις της καθαρεύουσαςΕπεξεργασία

Υπάρχουν πολλές και διάφορες «εκδόσεις» των άρθρων που περιέχουν λέξεις της καθαρεύουσας. Αυτό το μποτ στοχεύει την ομοιομορφία αυτών των άρθρων.

Αρχείο fixes.pyΕπεξεργασία

# -*- coding: utf-8  -*-
help = """
  * HTML  - Convert HTML tags to wiki syntax, and fix XHTML.
"""
import codecs
import sys, re


fixes = {
    'katharevousa': {
        'regex' : True,
        'msg': {
            'el':u'Πρότυπα στις λέξεις της καθαρεύουσας',
        },
        'replacements': [
                        # 1: μέρος του λόγου       2: λέξη της δημοτικής
                        # (u"\{\{-(.*)-\|el\}\}\r\n\'\'\'\{\{PAGENAME\}\}\'\'\' \{\{καθ\}\}\r\n\{\{-κοιτ-\}\} \[\[(.*)\]\]", u"{{-\\1-|el}}\r\n'''{{PAGENAME}}'''\r\n* {{καθ}} [[\\2]]"),
                        # 1: μέρος του λόγου       2: γένος       3: λέξη της δημοτικής
			# (u"\{\{-(.*)-\|el\}\}\r\n\'\'\'\{\{PAGENAME\}\}\'\'\' \{\{(.*)\}\}\r\n\r\n\{\{καθ\}\}\r\n\{\{-κοιτ-\}\}\r\n\* \[\[(.*)\]\]", u"{{-\\1-|el}}\r\n'''{{PAGENAME}}''' {{\\2}}\r\n* {{καθ}} [[\\3]]"),
			# 1: μέρος του λόγου       2: -η -ο   3: λέξη της δημοτικής
			(u"\{\{-(.*)-\|el\}\}\r\n\'\'\'\{\{PAGENAME\}\}(.*)\'\'\'\r\n\r\n\{\{καθ\}\}\r\n\{\{-κοιτ-\}\}\r\n\* \[\[(.*)\]\]", u"{{-\\1-|el}}\r\n'''{{PAGENAME}}\\2'''\r\n* {{καθ}} [[\\3]]"),
			# 1: μέρος του λόγου	   2: -η -ο	   3: γένος	  4: λέξη της δημοτικής
			(u"\{\{-(.*)-\|el\}\}\r\n\'\'\'\{\{PAGENAME\}\}(.*)\'\'\' \{\{(.*)\}\} \{\{καθ\}\}\r\n\{\{-κοιτ-\}\} \[\[(.*)\]\]", u"{{-\\1-|el}}\r\n'''{{PAGENAME}}\\2''' {{\\3}}\r\n* {{καθ}} [[\\4]]"),
			# 1: μέρος του λόγου		2: γένος		3: λέξη της δημοτικής
			(u"\{\{-(.*)-\|el\}\}\r\n\'\'\'\{\{PAGENAME\}\}\'\'\' \{\{(.*)\}\}\r\n\r\n\{\{καθ\}\}\r\n\* \[\[(.*)\]\]", u"{{-\\1-|el}}\r\n'''{{PAGENAME}}''' {{\\2}}\r\n* {{καθ}} [[\\3]]"),
       ],
   },
}

ΕντολήΕπεξεργασία

python replace.py -fix:katharevousa -log -ref:Πρότυπο:καθ

Παράμετρος στο πρότυπο «καθ»Επεξεργασία

# -*- coding: utf-8  -*-
help = """
  * HTML  - Convert HTML tags to wiki syntax, and fix XHTML.
"""
import codecs
import sys, re


fixes = {
    'param': {
        'regex' : True,
        'msg': {
            'el':u'Παράμετρος στο πρότυπο της καθαρεύουσας',
        },
        'replacements': [
                        # 1: λέξη της δημοτικής
			(u"\* \{\{καθ\}\} \[\[(.*)\]\]", u"* {{καθ|\\1}}"),
       ],
   },
}

Προσθήκη στην κατηγορία « Λέξεις της καθαρεύουσας »Επεξεργασία

# -*- coding: utf-8  -*-
help = """
  * HTML  - Convert HTML tags to wiki syntax, and fix XHTML.
"""
import codecs
import sys, re


fixes = {
    'diafora': {
        'regex' : True,
        'msg': {
            'el':u'Προσθήκη κατηγορίας',
        },
        'replacements': [
                        # Προσθήκη κατηγορίας: λέξεις της καθαρεύουσας
			(u"\[\[Κατηγορία\:Επίθετα της καθαρεύουσας\]\]", u"[[Κατηγορία:Επίθετα της καθαρεύουσας]]\r\n[[Κατηγορία:Λέξεις της καθαρεύουσας]]"),
			(u"\[\[Κατηγορία\:Επιρρήματα της καθαρεύουσας\]\]", u"[[Κατηγορία:Επιρρήματα της καθαρεύουσας]]\r\n[[Κατηγορία:Λέξεις της καθαρεύουσας]]"),
			(u"\[\[Κατηγορία\:Κύρια ονόματα της καθαρεύουσας\]\]", u"[[Κατηγορία:Κύρια ονόματα της καθαρεύουσας]]\r\n[[Κατηγορία:Λέξεις της καθαρεύουσας]]"),
			(u"\[\[Κατηγορία\:Μετοχές της καθαρεύουσας\]\]", u"[[Κατηγορία:Μετοχές της καθαρεύουσας]]\r\n[[Κατηγορία:Λέξεις της καθαρεύουσας]]"),
			(u"\[\[Κατηγορία\:Ουσιαστικά της καθαρεύουσας\]\]", u"[[Κατηγορία:Ουσιαστικά της καθαρεύουσας]]\r\n[[Κατηγορία:Λέξεις της καθαρεύουσας]]"),
			(u"\[\[Κατηγορία\:Ρήματα της καθαρεύουσας\]\]", u"[[Κατηγορία:Ρήματα της καθαρεύουσας]]\r\n[[Κατηγορία:Λέξεις της καθαρεύουσας]]"),
       ],
   },
}

ΕντολήΕπεξεργασία

replace.py -fix:diafora -log -cat:ΟλεςΤιςΚατηγορίεςΜίαΜία