Διόρθωση κειμένου
Σκοπεύουμε να δημιουργήσουμε ένα πακέτο (συναρτήσεων) με τις οποίες θα κάνουμε ανάλυση και διόρθωση ενός κειμένου.
Αυτό μπορεί να χρησιμεύσει για την μεταφορά κειμένων που γράφονται βιαστικά (π.χ., στο WhatsApp) σε κανονική γλώσσα, ώστε να είναι κατανοητά σε όλους, ή να περαστούν σε επίσημα έγγραφα.
Οι κύριες λειτουργίες του προγράμματος θα είναι οι εξής.
- Διόρθωση λαθών στα σημεία στίξης. Π.χ., το "κάτι ,κάτι άλλο" πρέπει να γίνει "κάτι, κάτι άλλο", το "τελειώσα.Μετά ξεκίνησα" πρέπει να γίνει "τελείωσα. Μετά ξεκίνησα" κλπ.
- Αντί για συντομογραφίες θα πρέπει να γραφεί η πλήρης λέξη. Π.χ, αντί το "τπτ" γίνεται "τίποτα" κλπ.
Για να ξεκινήσετε, είναι καλό να γράψετε μερικές συναρτήσεις όπως περιγράφονται στις επόμενες ασκήσεις.
Αφού τις γράψετε, θα τις βάλετε όλες στο ίδιο αρχείο το οποίο θα αποτελέσει ένα πακέτο.
Τέλος θα γράψετε έναν κώδικα ως κύριο πρόγραμμα το οποίο θα αναλάβει την επικοινωνία με τον χρήστη, θα χρησιμοποιεί τις συναρτήσεις και θα παράγει ένα διορθωμένο κείμενο.
Ασκήσεις
Άσκηση.
Γράψτε μία συνάρτηση που θα εντοπίζει σε ένα κείμενο συνήθη λάθη σε σημεία στίξης. Π.χ., αν ένα σημείο στίξης είναι κολλημένο στην προηγούμενη ή στην επόμενη λέξη.
Άσκηση.
Ένας εγγονός στέλνει μήνυματα στο whatsApp στον παππού του.
Για παράδειγμα, ένα μήνυμα μπορεί να είναι το εξής:
<<Δ ήξερα τπτ για την γιορτή κ μπορεί να μην έρθω.>>
Ο παππούς δεν καταλαβαίνει αυτήν την γλώσσα.
Γράψτε μία συνάρτηση η οποία θα εντοπίζει συνήθεις συντομογραφίες και θα δίνει την αντίστοιχη λέξη.
Ο εντοπισμός συντομογραφιών θα μπορούσε να γίνει με τους εξής τρόπους:
- Θα έχουμε ένα λεξικό στο οποίο θα έχουμε ήδη καταχωρημένες τις συντομογραφίες και τις αντίστοιχες λέξεις.
- Οι συντομογραφίες θα εντοπίζονται χρησιμποιώντας κάποιους κανόνες (π.χ. λέξεις με ένα μόνο γράμμα είτε λέξεις με τρία συνεχόμενα σύμφωνα είναι πιθανότατα συντομογραφίες).
- Μπορείτε να σκεφτείτε κάποιον αλγόριθμο τεχνητής νοημοσύνης για να εντοπίζετε συντομογραφίες;