Γεια χαρά και πάλι soulto. Επίτρεψέ μου να πω δυο λόγια, απευθυνόμενος τόσο σε εσένα όσο και σε όσους άλλους διαβάζουν αυτές τις γραμμές.
Οι ετικέτες είναι ένα χρήσιμο εργαλείο διαχείρισης και εκμετάλλευσης μιας βάσης δεδομένων με πολλές εγγραφές, όπως είναι το SLANG.gr άλλωστε. Είναι η σύνδεση κάποιων εγγραφών με ένα χαρακτηριστικό, με μη αποκλειστικό τρόπο. Με άλλα λόγια, αφ' ενός μεν ένας "λημματοορισμός" μπορεί να έχει περισσότερες της μιας ετικέτες, αφ' ετέρου δε δεν υπάρχουν αλληλοαποκλειόμενες ετικέτες. Οι παλιές κατηγορίες ήταν στην ουσία και αυτές ετικέτες.
Μια από τις χρησιμότητες των ετικετών είναι η πολύ αποτελεσματικότερη αναζήτηση αυτού που ψάχνουμε. Π.χ. δεν θέλουμε απλώς να βρούμε λήμματα (και ορισμούς) που αφορούν το σεξ, αλλά θέλουμε να βρούμε τέτοια που αφορούν ΚΑΙ το σεξ ΚΑΙ την πορνεία ΚΑΙ αρκτικόλεξα. Αυτό πλέον γίνεται ως εξής:
Πρώτο βήμα: ετικέτα σεξουαλικό (σημ: σήμερα επιστρέφει 4027 ορισμούς)
Δεύτερο βήμα: Από τις "επιπλέον ετικέτες" επιλέγουμε πορνεία (σημ: σήμερα ο συνδυασμός επιστρέφει 80 ορισμούς)
Τρίτο βήμα: Από τις "επιπλέον ετικέτες" επιλέγουμε αρκτικόλεξο (σημ: σήμερα ο συνδυασμός επιστρέφει 5 ορισμούς).
Βρήκαμε αυτό που ψάχναμε λοιπόν και, μάλιστα, χωρίς αυτές οι λέξεις να πρέπει να συμπεριλαμβάνονται, καθ' οιονδήποτε τρόπο, στο λήμμα. Επειδή από άλλες σου συνεισφορές φαίνεται να ξέρεις από twitter, σκέψου τις ετικέτες σαν #tags, όπου μπορείς να ψάξεις π.χ. για #sex #greece ή, ακόμα πιο συγκεκριμένα, #sex #greece #lesbian, περιορίζοντας σημαντικά τον όγκο των αποτελεσμάτων και, κατ' αυτόν τον τρόπο, αυξάνοντας την αποδοτικότητα της αναζήτησής σου.
Στο μέλλον, θα μπορούσαν να υπάρχουν και άλλοι λογικοί τελεστές, π.χ. αντί για ΚΑΙ-ΚΑΙ να υπάρχει ΚΑΙ-ΟΧΙ, π.χ. σεξ ΚΑΙ πορνεία ΟΧΙ αρκτικόλεξα.
Αυτά φυσικά, δεν χρειάζεται να ενδιαφέρουν τους πάντες. Οπότε, ελπίζοντας να φώτισα λίγο το ζήτημα, σημειώνω ότι η πρότασή μου και οι ερωτήσεις μου παραμένουν, για όσους τυχόν έχουν κάτι επ' αυτών.
Θα ξαναπώ αυτό που είπα και πρίν: άς μπαίνουνε οι ετικέτες χωρίς πολλή περίσκεψη. Άς τους δώσουμε κάποιο καιρό μέχρι να κάτσουν. Θα φανεί με τον καιρό ποιές στέκουνε και ποιές όχι. Στο προκείμενο, αγγλικά; αγγλικά, τούρκικα; τούρκικα, και λοιπά, κι' ας μήν είμαστε σε θέση (καθότι αν μή τι άλλο μή γλωσσολόγοι) να εντοπίσουμε με βεβαιότητα κάθε προέλευση. Και, επίσης, άς συνυπάρχουν αυτές οι ετικέτες φυσικά με την ετικέτα για τα ξενικά ενγένει.
Στο πρακτέο: κάθε χρήστης, άς λέει (με αναφορά) ποιά νέα ετικέτα θα ήθελε να δεί κάτω απο έναν ορισμό (δικό του η άλλου). Και άς δώσουμε στο πράμα χρόνο. Οι ετικέτες και το πώς θα διαμορφωθούν, είν' απ' τα πιό μακρόπνοα πράματα σ' ένα τέτοιο σάιτ, απο τη φύση του. Λέω.
Προτείνω είτε το ξενικά να σπάσει σε:
είτε να κρατήσουν όλοι ορισμοί το ξενικά ως έχουν και να προστεθούν τα αγγλικά, γαλλικά κτλ. Ώστε να μπορούμε να βρούμε και μόνο τα αγγλικά, αλλά και όλα τα ξενικά, στην πρώτη περίπτωση αναζητώντας στις ετικέτες το ξενικά (όπως εδώ μπορούμε να βρούμε όλες τις καταλήξεις) και στη δεύτερη απλά επιλέγοντας την ετικέτα.
Ξεκινώ με
Έχει ήδη χρησιμοποιηθεί (τώρα που γράφω εδώ 2 μόνο φορές) η ετικέτα αγγλισμός. Μια χαρά είναι, αλλά τα εις -ισμός έχουν κάτι από ιδεολογία, ιδίως ο "τουρκισμός", οπότε δεν νομίζω ότι είναι προτιμότερα.
Edit:
1. Εγώ προσωπικά πιστεύω ότι δεν είναι σκόπιμο να συμπεριλαμβάνουμε στα "ξενικά" και λήμματα που είναι μεταφράσεις διαδεδομένων ξενικών όρων, π.χ. προσοχοπόρνη, προσοχοπουτάνα, προσοχοπούτανος, διαβολοβδομάδα.
2. Σαν γλώσσα νομίζω πως είναι καλύτερο να βάζουμε τη γλώσσα άμεσης και όχι απώτερης προέλευσης, π.χ. "ξενικό: τουρκικά", αντί για το (συχνό φαινόμενο) "ξενικό: αραβικά" ή "ξενικό: περσικά".
είτε να κρατήσουν όλοι ορισμοί το ξενικά ως έχουν και να προστεθούν τα αγγλικά, γαλλικά κτλ.
Αυτό.
Οκ. Διορθώνω το "ξενικό: αγγλικά" και το "αγγλισμοί" σε "αγγλικά". Ας μου επιτραπεί να ξανασημειώσω ότι δεν βρίσκω σκόπιμο να πάρουν αυτές τις ετικέτες μεταφρασμένα λήμματα που απλώς έχουν ξενική προέλευση (σαν έννοιες ίσως, π.χ. γαμώμανος, διαβολοβδομάδα), αλλά μόνο λήμματα που διατηρούν κάτι το αλλόγλωσσο. Οριακές περιπτώσεις είναι λήμματα όπως το δώδεκα που έχουν νόημα μόνο μέσω του ξενικού αντιστοίχου.
και αν δεν είμαστε σίγουροι για το αν ένα λήμμα είναι τουρκικής ή περσικής προέλευσης, βουλγάρικης ή ρωσικής κλπ;
ή, το χειρότερο, αν είμαστε και καλά σίγουροι και τελικά έχουμε πέσει έξω;...
επίσης τα τουρκικής προέλευσης τ. χαΐρι, μπαξίσι κλπκλπ, δεν μπορείς να τα πεις και ξενικά (αυτή την αντίρρηση την είχα πάντα), είναι ελληνικά ξενικής προέλευσης. άλλα όμως όπως το lol είναι καθαρά ξενικά.
άρα;;;;;;
Καλά, τα πρώτα 2 ισχύουν για ό,τι κάνουμε εδώ μέσα! Αν δεν είμαστε σίγουροι, δεν βάζουμε τίποτα, κι αν κάνουμε λάθος, κάναμε λάθος και το διορθώνουμε όταν μας επισημανθεί, ή όταν γίνουμε σοφότεροι.
Για το 3ο, νομίζω σχεδόν έχουμε καταλήξει οι συγκεκριμένες ετικέτες να είναι του τύπου ΞΕΝΕΣ ΕΠΙΡΡΟΕΣ: τούρκικα
, οπότε καλυπτόμαστε.
οκ, θξ.
γίνεται να υπάρχουν κάπου όλες οι ετικέτες σε λίστα για να μην αυτοσχεδιάζουμε; νάχουμε δηλ. έναν πίνακα, ένα δέντρο, κάτι τέτοιο να το συμβουλευόμαστε;
πχ: αν ο ετικετάς δεν ξέρει ή δεν θυμάται ότι υπάρχει το ΞΕΝΕΣ ΕΠΙΡΡΟΕΣ: + γλώσσα και δακτυλογραφήσει μια δικής του έμπνευσης ετικέτα (πχ. ΓΛΩΣΣΙΚΟ ΔΑΝΕΙΟ ή ΠΡΟΕΛΕΥΣΗ), τότε το σύστημα δεν θα του βγάλει αυτόματα κάτι (όπως πχ. όταν αρχίσεις να γράφεις έκφρ σου βγάζει έτοιμο το ΕΚΦΡΑΣΗ) και θα έχει προσθέσει μια πλεονάζουσα ετικέτα. Ενώ αν, κάθε φορά που θέλει να ασχοληθεί με τις ετικέτες, τις έχει ανοιγμένες σε μια στάνταρ σελίδα όλες μαζί, θα ψάχνει κ θα διαλέγει τη σωστή. Γίνεται αυτό;
(πώς σε είπαν, άη βασίλη;;;)
θξ, το ξέρω αυτό, εννοούσα κάτι ακόμα πιο εύχρηστο, δηλ. αφού πια κατασταλάξουμε στη δομή κλπ των ετικετών, να γίνουν σε σχεδιάγραμμα, δέντρο ή κάτι παρόμοιο.
Ακριβώς για αυτό το θέμα πρότεινα πριν λίγο καιρό να υπάρχει ένα scroll down βελάκι όπου να φαίνονται αλφαβητικά όλες οι ετικέτες και να επιλέγεις εύκολα ποιαν θέλεις. Η λίστα είναι δύσχρηστη, όντως.
patsis
Πιστεύω πως χρήσιμες είναι οι ετικέτες που θα ταξινομούν τα λήμματα ανάλογα με τις γλώσσες ετυμολογικής κλπ προέλευσης. Δηλαδή μια περαιτέρω ανάλυση της ετικέτας "ξενικό": τουρκικά, αγγλικά, γαλλικά, αραβικά, σλαβικά κ.ά.
Παρατηρήσεις - ερωτήσεις: