[FORUM] Problema caratteri

Area di discussione libera.

Moderatore: Staff

Regole del forum
1) Rispettare le idee altrui.
2) Evitare le offese dirette.
3) Leggere attentamente le risposte ricevute
4) Scrivere i messaggi con il colore di default, evitare altri colori.
5) Scrivere in Italiano o in Inglese, se possibile grammaticalmente corretto, evitate stili di scrittura poco chiari, quindi nessuna abbreviazione tipo telegramma o scrittura stile SMS o CHAT.
6) Appena registrati è consigliato presentarsi nel forum dedicato.

La non osservanza delle regole porta a provvedimenti di vari tipo da parte dello staff, in particolare la non osservanza della regola 5 porta alla cancellazione del post e alla segnalazione dell'utente. In caso di recidività l'utente rischia il ban temporaneo.
ilmich
Master
Master
Messaggi: 1563
Iscritto il: lun 16 lug 2007, 17:39
Slackware: 14.2 64bit
Kernel: 4.19.46
Desktop: dwm
Località: Roma

Re: [FORUM] Problema caratteri

Messaggio da ilmich »

dai un occhiata qua dove ho letto, in base anche al risultato che vediamo che è come se avesse convertito l'utf8 in codifica Windows-1252 causata probabilmente da
Mainly caused by wrongly configured web services or webmail clients, which were not tested for international usage (as the problem remains concealed for English texts). In this case the actual (often generated) content is in UTF-8; however, it is not configured in the HTML headers, so the rendering engine displays it with the default Western encoding.
purtroppo iconv non è sufficiente (ho provato poco fa).
forse l'unico modo è provare con un sed o comunque replace dei caratteri del tipo tutte le coppie ù convertirle in ù ma è rischioso (anche se dubito ci sia volontariamente gente che scriva in questo modo.. a parte questo post)
ho visto cose che voi astemi non potete immaginare
https://github.com/ilmich

rik70
Iper Master
Iper Master
Messaggi: 2207
Iscritto il: gio 10 mar 2011, 9:21
Slackware: 64-current
Kernel: 5.4.x
Desktop: Xfce 4.14
Distribuzione: Arch Linux

Re: [FORUM] Problema caratteri

Messaggio da rik70 »

Non se se può essere utile, ma da shell python:

Codice: Seleziona tutto

>>>
x = 'è'
print x
è
Ma se si da:

Codice: Seleziona tutto

print x.decode('utf-8').encode('latin_1')
restituisce la nostra è accentata.

Proviamo ora il titolo del topic di cui parlava conraid:

Codice: Seleziona tutto

y = "flashplayer plugin di firefox non c'è più nella 14.1?"
e stampiamolo:

Codice: Seleziona tutto

>>> print y
flashplayer plugin di firefox non c'è più nella 14.1?
Niente da fare.

Però:

Codice: Seleziona tutto

>>> print y.decode('utf-8').encode('latin_1')
flashplayer plugin di firefox non c'è più nella 14.1?
Perfetto, no?

Sembra che si siano mischiate le codifiche latin_1 - che dovrebbe essere l'iso8859-1 - e utf-8.

Su come risolvere lascio la parola a voi - se la faccenda vi suggerisce qualcosa.
Ultima modifica di rik70 il mar 14 apr 2015, 17:06, modificato 1 volta in totale.

rik70
Iper Master
Iper Master
Messaggi: 2207
Iscritto il: gio 10 mar 2011, 9:21
Slackware: 64-current
Kernel: 5.4.x
Desktop: Xfce 4.14
Distribuzione: Arch Linux

Re: [FORUM] Problema caratteri

Messaggio da rik70 »

PS
In bash:

Codice: Seleziona tutto

echo "flashplayer plugin di firefox non c'è più nella 14.1?" | iconv --from-code=utf-8 --to-code=iso8859-1
ritorna:

Codice: Seleziona tutto

flashplayer plugin di firefox non c'è più nella 14.1?

Avatar utente
conraid
Staff
Staff
Messaggi: 13526
Iscritto il: gio 14 lug 2005, 0:00
Nome Cognome: Corrado Franco
Slackware: current64
Desktop: kde
Località: Livorno
Contatta:

Re: [FORUM] Problema caratteri

Messaggio da conraid »

Infatti penso che il DB fosse in latin1_swedish_ci come di default in mysql tempo fa.

Avatar utente
targzeta
Iper Master
Iper Master
Messaggi: 6566
Iscritto il: gio 3 nov 2005, 14:05
Nome Cognome: Emanuele Tomasi
Slackware: 64-current
Kernel: latest stable
Desktop: IceWM
Località: Carpignano Sal. (LE) <-> Pisa

Re: [FORUM] Problema caratteri

Messaggio da targzeta »

Però non capisco come mai nel dump, fatto da phpbb, ci siano le create table per utf8. Comunque penso che la soluzione debba essere semplice, anche se ora ci troviamo mezzi post codificati in utf8 e mezzi in latin1_swedish_ci. E man mano che passa il tempo i post in utf8 diventano sempre di più!!!

Il comando bash di rik70 è esattamente quello che volevo lanciare io sul dump di mysql. Solo che al contrario, nel senso che volevo portare tutti i vecchi post in utf8...chissà che casino si farebbe :D.

Emanuele
Linux Registered User #454438
Se pensi di essere troppo piccolo per fare la differenza, prova a dormire con una zanzara -- Dalai Lama
20/04/2013 - Io volevo Rodotà 

Avatar utente
boh
Linux 4.x
Linux 4.x
Messaggi: 1027
Iscritto il: ven 16 set 2005, 0:00
Slackware: 14.2 (x64)
Kernel: 4.4.111
Desktop: KDE 4.14.32
Località: Milano
Contatta:

Re: [FORUM] Problema caratteri

Messaggio da boh »

Alla fine si è deciso di lasciare tutto così com'è? I caratteri si vedono male anche nei riquadri contenenti le Regole del forum (v. screenshot), non solo nei post.
Allegati
regole_forum
regole_forum
screen.png (28.98 KiB) Visto 2306 volte
"Be yourself. Everyone else is already taken." ~ Oscar Wilde

Avatar utente
targzeta
Iper Master
Iper Master
Messaggi: 6566
Iscritto il: gio 3 nov 2005, 14:05
Nome Cognome: Emanuele Tomasi
Slackware: 64-current
Kernel: latest stable
Desktop: IceWM
Località: Carpignano Sal. (LE) <-> Pisa

Re: [FORUM] Problema caratteri

Messaggio da targzeta »

Hahaha è vero. Devo sistemare almeno le regole!!!

Grazie per la segnalazione boh,
Emanuele
Linux Registered User #454438
Se pensi di essere troppo piccolo per fare la differenza, prova a dormire con una zanzara -- Dalai Lama
20/04/2013 - Io volevo Rodotà 

Rispondi