Navigacija
Lista poslednjih: 16, 32, 64, 128 poruka.

Da li postoji odgovarajući LC_COLLATE za sortiranje reči pisanih i ćirilicom i latinicom?

[es] :: Linux/UNIX serveri i servisi :: Da li postoji odgovarajući LC_COLLATE za sortiranje reči pisanih i ćirilicom i latinicom?

[ Pregleda: 1560 | Odgovora: 4 ] > FB > Twit

Postavi temu Odgovori

Autor

Pretraga teme: Traži
Markiranje Štampanje RSS

Lazar-I

Član broj: 6950
Poruke: 169
*.dynamic.isp.telekom.rs.



+727 Profil

icon Da li postoji odgovarajući LC_COLLATE za sortiranje reči pisanih i ćirilicom i latinicom?14.01.2012. u 14:13 - pre 149 meseci
Instalirao sam sr_RS locale na Ubuntu 10.04LTS ali problem je što pri sortiranju uvek idu prvo latinična slova pa zatim ćirilična. Ono što meni treba je LC_COLLATE koji tretira isto i ćirilična i latinična slova. Da li je neko možda već rešio ovaj problem?
 
Odgovor na temu

Mister Big Time
The Consigliere
enterparadajz
Belgrade

Član broj: 15306
Poruke: 4747

Sajt: www.go2bed.net


+43 Profil

icon Re: Da li postoji odgovarajući LC_COLLATE za sortiranje reči pisanih i ćirilicom i latinicom?16.02.2012. u 02:26 - pre 148 meseci
nesto ovako (PHP):
Code:
setlocale(LC_COLLATE, 'en_EN.utf8');


Meni je to pomoglo sa sortiranjem nizova, uz neke minorne nedostatke (Sabac ispred Sartida npr.)



Summary: Currently it is not possible to sort UTF-8 strings on a WIndows machine simply using PHP-provided functions. A possible solution would be to recode the strings to Windows-1252 or ISO-8859-1 encoding (using mb_convert_encoding() or iconv()) and do a sort on the recoded array (provided by ΤΖΩΤΖΙΟΥ on stackoverflow.com).

http://sgehrig.wordpress.com/2...ort-an-array-of-utf-8-strings/

P.S. Zasto ne konvertujes sve u jedno pismo pre sortiranja? To bi ti bilo najsigurnije resenje tj. unificirano.



[Ovu poruku je menjao Mister Big Time dana 16.02.2012. u 03:49 GMT+1]
 
Odgovor na temu

Mister Big Time
The Consigliere
enterparadajz
Belgrade

Član broj: 15306
Poruke: 4747

Sajt: www.go2bed.net


+43 Profil

icon Re: Da li postoji odgovarajući LC_COLLATE za sortiranje reči pisanih i ćirilicom i latinicom?16.02.2012. u 11:33 - pre 148 meseci
Sada sam pogledao moju aplikaciju.
Ovako ide:
Code:
setlocale(LC_ALL, 'en_US.utf8');  


A onda sortiranje:

Code:
ksort($zdrav, SORT_LOCALE_STRING);


Ali ja imam sve na latinici sa nasim slovima - UTF-8.

 
Odgovor na temu

Lazar-I

Član broj: 6950
Poruke: 169
*.dynamic.isp.telekom.rs.



+727 Profil

icon Re: Da li postoji odgovarajući LC_COLLATE za sortiranje reči pisanih i ćirilicom i latinicom?16.02.2012. u 11:58 - pre 148 meseci
Ako ne želiš minorne nedostatke i imaš odgovarajuće privilegije, najbolje bi bilo da instaliraš sr_RS locale. Locale i za ćirilicu i latinicu je odradio Danilo Šegan. Meni je potrebna lokalizacija na nivou operativnog sistema koja objedinjuje ćirilicu i latinicu. Tako bi reči 3-B-E-P i Z-V-E-R imale istu težinu. Sortiranje ne bih radio iz PHP-a, već bi to obavljao Postgresql.

Citat:
Currently it is not possible to sort UTF-8 strings on a WIndows machine simply using PHP-provided functions.


Ovo je forum Linux/UNIX serveri i servisi, ne zanima me Windows.

Citat:
P.S. Zasto ne konvertujes sve u jedno pismo pre sortiranja? To bi ti bilo najsigurnije resenje tj. unificirano.


To je nepotrebno dupliranje podataka i komplikovanje koje želim da izbegnem.

P.S.

Citat:
Ali ja imam sve na latinici sa nasim slovima - UTF-8.


Samo instaliraj i zatim izaberi sr_RS@latin i nećeš imati nikakvih problema.

Sortiranje iz moje aplikacije nije problem, mogu da sortiram kako god hoću i tekstove koji sadrže mešavinu ćirilice i latinice (uz nešto lošije performanse).


 
Odgovor na temu

Mister Big Time
The Consigliere
enterparadajz
Belgrade

Član broj: 15306
Poruke: 4747

Sajt: www.go2bed.net


+43 Profil

icon Re: Da li postoji odgovarajući LC_COLLATE za sortiranje reči pisanih i ćirilicom i latinicom?19.02.2012. u 15:36 - pre 148 meseci
Enable-vao sam sr_RS lokale..


Sada mi locale -a sa konzole vraca:

Code:
C
en_US.utf8
POSIX
sr_RS
sr_RS@latin
sr_RS.utf8
sr_RS.utf8@latin


PHP mi sada koristi: sr_RS@latin
I radi sortiranje po abecedi lepo iako su ovo UTF-8 slova, pa ne znam u cemu je razlika izmedju sr_RS@latin i sr_RS.utf8@latin ili sr_RS.utf8 vs. sr_RS)


Inace, nista nisam morao da instaliam (Debian), samo je bilo potrebno enable-ovati zeljeni locale u /etc/locale.gen a onda odraditi locale-gen i restart (obavezno xD) Apache-a.


Hvala, pozz!
 
Odgovor na temu

[es] :: Linux/UNIX serveri i servisi :: Da li postoji odgovarajući LC_COLLATE za sortiranje reči pisanih i ćirilicom i latinicom?

[ Pregleda: 1560 | Odgovora: 4 ] > FB > Twit

Postavi temu Odgovori

Navigacija
Lista poslednjih: 16, 32, 64, 128 poruka.