• Welcome to Simple Machines Community Forum. Please login or sign up.
September 19, 2021, 06:31:21 AM

News:

Check out the SMF Function DB!


UTF-8 vs ISO

Started by sem27gr, October 02, 2006, 02:18:33 PM

Previous topic - Next topic

sem27gr

October 02, 2006, 02:18:33 PM Last Edit: October 02, 2006, 02:21:25 PM by sem27gr
Δημιουργώ αυτό το τόπικ για να κάνω μια ερώτηση που δεν έχω καταλάβει πλήρως από ότι φαίνεται!

Όταν ξεκίνησα να φτιάχνω το forum μου (της σχολής μου), είχα πάει σε proboards φόρουμ. Εν τέλη μισθώσαμε κάποιο site (www.agrobioaua.com) και βάλαμε εκεί το forum. Ήξερα λοιπόν ότι με utf-8 κωδικοποίηση θα έχω σίγουρα όλεα τα είδη γλωσσών (μπορεί κ να κάνω λάθος). Δημιουργώντας λοιπόν την database μου, την έφτιαξα εξ αρχής σε UTF-8. Έβαλα το 1.1RC3 και κατέβασα τα ελληνικά τα οποία ήταν και αυτά UTF-8 και επιβεβαιώθηκε η θεωρία μου.

Στην πορεία και ψάχνωντας το θέμα περισσότερο κατάλαβα ότι και με ISO λειτουργούν τα Ελληνικά...
Τα email που στέλνουμε συνήθως έχουν κωδικοποίηση iso. Και έχω την εξής ερώτηση:

Γιατί να κάνω το forum μου iso, και όχι uft8 αφού το με το utf8 θα έχω μεγαλύτερη συμβατότητα;

Αν τελικά πρέπει να αλλάξω την κωδικοποίηση μου σε iso, γίνεται ή την πάτησα και πρέπει να συνεχίσω με utf8?

Τέλος παρατήρησα ότι όταν στον explorer έχεις επιλέξει utf8, δεν βλέπει τα iso και αντίστροφα. Αντιμετωπίζοντας έτσι το πρόβλημα ότι πρέπει κάποιος να παίζει συνέχεια με τα encodings, πράγμα εκνευριστικό!

Ευχαριστώ εκ των προτέρων.....
Σταμάτης

GoofyX

Το utf-8 ως encoding είναι το μέλλον, διότι χωρά όλες τις γλώσσες του κόσμου (ή σχεδόν όλες, δεν μπορώ να είμαι σίγουρος), λόγω των 65.536 εν δυνάμει χαρακτήρων που μπορεί να αποθηκεύσει. Αυτό πρακτικά τι σημαίνει; Ότι σε ένα site (πχ. php/MySQL) για παράδειγμα έχεις ένα σύνολο αρχείων για όλες τις γλώσσες που θα ήθελες να απεικονίσεις, αν και αυτό που αναφέρω ως πρακτική δεν χρησιμοποιείται, δεν μπλέκεις ποτέ τη λογική μιας εφαρμογής (η δυναμική σελίδα) με το output (τα μηνύματα στο html) που θα εμφανίσει, άρα απλά συντηρείς πολλά αρχεία μηνυμάτων για ένα αρχείο της λογικής (ελπίζω να γίνομαι κατανοητός). Βασικά το πλεονέκτημα είναι ότι υποστηρίζεις όλες τις γλώσσες με τη μία.

Το μειονέκτημα είναι ότι θα σου πιάνει (σχεδόν) διπλάσιο χώρο, γιατί η κωδικοποίηση ενός όχι λατινικού χαρακτήρα (πχ. ελληνικά, κινέζικα, κτλ.) θα πιάνει 2 bytes, αντί για 1 στην περίπτωση του ISO-8859-7. Διπλάσιος χώρος και στο αρχείο μηνυμάτων και στη βάση και στο output (άρα περισσότερο bandwidth).

Πού καταλήγουμε; Αν θες ελληνικά και αγγλικά, πάνε σε ISO-8859-7, αν θες πολλές γλώσσες, σε utf-8. Απλά επειδή τίνουμε να καταλήξουμε σε ένα στάνταρ (με τη μορφή του ενός, όχι του προτύπου) τύπο, αυτό θα είναι κάτι σε unicode, utf-8 προς το παρόν.

Αυτά. :)
... Morpheus: What is "real"? How do you define "real"? If you 're talking about what you can feel, what you can smell, what you can taste and see, then "real" is simply electrical signals interpreted by your brain...

sem27gr

Κατάλαβα ωραία....όπως εξελίσσονται τα πράγματα, όλοι πλέον έχουν dsl και όλα φορτώνουν γρήγορα. Όσον αφορά τον χώρο, έχω μπόλικο στο site. Οπότε προς το παρόν το αφήνω σε utf8

Από ότι κατάλαβα, θα μπορέσω αν κάποια στιγμή το θελήσω να το μετατρέψω σε iso πολύ απλά έτσι;

GoofyX

Quote from: sem27gr on October 03, 2006, 04:46:56 PM
Από ότι κατάλαβα, θα μπορέσω αν κάποια στιγμή το θελήσω να το μετατρέψω σε iso πολύ απλά έτσι;

Χμ... Όχι ακριβώς. Σκέψου ότι για ένα χαρακτήρα πρέπει να στριμώξεις 2 bytes σε 1. Δεν είναι και τόσο απλό ε; Ενώ το αντίθετο είναι. Εύκολα μετατρέπεις 1-byte encoding σε multi-byte. Φυσικά και γίνεται η μετατροπή που θέλεις, απλά είναι λίγο παίδεμα παραπάνω. Προτείνω να το αφήσεις ως έχει.
... Morpheus: What is "real"? How do you define "real"? If you 're talking about what you can feel, what you can smell, what you can taste and see, then "real" is simply electrical signals interpreted by your brain...

leftezi

Μόνο και μόνο σαν στάνταρ το UTF8 λέει πολλά.
Μακάρι να καθιερωθεί. Αν τα προγράμματα ήταν εξαρχής φτιαγμένα για UTF8 δε θα είχαμε όλα αυτά τα μηνύματα και τα ψαξίματα με τα προβλήματα ελληνικών. Μακάρι να το ακολουθήσουν και άλλες συσκευές (Mp3 players - TV Teletext κτλ.) να ξεμπερδεύουμε μια και καλή αποφεύγοντας ειδικές ρυθμίσεις και ειδικές εκδόσεις σε κάθε πρόγραμμα και συσκευή.
Κράτα το, έτσι για να γίνουμε πολλοί. ;D

sem27gr


agridoc

Δεν νομίζω οτι το UTF-8, εκτός από περιπτώσεις όπου πραγματικά χρειάζεται, θα προσφέρει κάτι, τουλάχιστον στο άμεσο μέλλον.

Η λογική είναι οτι πληρώνεις (σε χώρο και ταχύτητα) για κάτι που δεν χρειάζεσαι.

Επιπλέον δεν έχει καθιερωθεί, ούτε βλέπω να καθιερώνεται, σαν στάνταρντ στα PC στην Ελλάδα αλλά και χώρες με πολύ μεγαλύτερο πληθυσμό.

  For Greek aeromodellers and our friends around the world  - Greek Button sets for SMF - Greeklish to Greek mod
Δeν αφιερώνω χρόνο για μηνύματα σε greeklish.

Advertisement: