Citat:
srki:Zasto to ne biste resili kao sto je google resio. Tamo kada otkucam prenociti ili cacanski izadje mi u pretrazi i sajtovi koji sadrze prenociti, cacanski ali i oni sajtovi koji sadrze čačanski,prenoćiti i isto to na cirilici (nisam napisao jer es ne podrzava).
Pretraga koju posetioci ocekuju od Gogole-a omogucava da Google prosto zanemari specijalne znakove. Moja pretpostavka je da oni vec u toku indeksiranja prekodiraju sve kodne rasporede u obicnu latinicu u meri u kojoj je to moguce, pa i pretragu vrse na takav nacin. Za opsti pretrazivac, to je sasvim ok, i mnogo bolje nego od onoga ranije da si morao trazis istu rec u latinici i cirilici jer je pretrazivac davao razlicite rezultate.
Kada je recnik u pitanju, stvar je drugacija. Korisnik ocekuje da nadje bas ono sto je trazio. Ne mozemo da mu u rezultatu ponudimo reci koje ne odgovaraju upitu samo zato sto on mozda nije znao da ukuca č umesto c. na stranu to sto bi smomorali da imamo utrostrucenu bazu, cirilicnu, latinicnu i "osisanu" latinicnu, da bi smo mogli daipsunimo takav zahtev za pretragu. Ja se jedem sto sam morao da pravim i duplikat a triplikat je vec previse. Ako ne smislimo drugaciji nacin rada sa bazom, bicemo ograniceni i za vaznije opcije nego sto je "osisana" latinica.
Stoji stav da svako kome je potreban ovaj recnik treba da zna da koristi nasu tastaturu. Ako ne zna, treba da nauci. Na sajtu ce biti uputstvo kako se instalira i korsiti nasa tastatura.
Za koriscenje na brzinu, sa tudjeg racunara, olaksanje u vidu popup tastature nije lose resenje. Verujem da ni Igor nece imati nista protiv da ako neko napravi taj popup i posalje nam, da ga implementiramo ako se to bude uklopilo na zadovoljavajuci nacin. Ako neko hoce da poradi na tome evo mu zadatak: Na link treba da iskoci mali prozor a u njemu prikazana pojednostavljena tastatura sa nasim slovima. Korisnik treba da ima mogucnost izbora cirilicne ili latinicne tastature. Klik misem na neki taster u posebno polje upisuje to slovo. Klik na OK dugme upisuje slozeni niz slova u polje za pretragu na glavnoj strani i zatvara popup. Ovo treba napraviti u JavaScriptu i obezbediti da radi na sto vise veb citaca, ukljucujuci i matorije verzije.
Svidja mi se i resenje sa dodavanjem ' ili " iza osisanog slova. Niej veliki posao primeniti ga, a dobice se na funkcionalnosti.
Citat:
teddy:
P.S. Zašto pri pretrazi pojma „ca“ ili „cak“ ispisuje i rezultate koji počinju na „sa“ tj. „sak“? Takođe sam pronašao nekoliko reči koje su loše OCR-ovane (u pretragu upisati „cabe“ i „sabn“).
Xe, xe, izgleda da je prilikom kucanja nekih reci greskom korisceno latinicno "C" umesto cirilicnog "S". Za ovo, kao i druge greske u tekstu baze, vazi kao sto sam rekao, to cemo na kraju, kada budemo obezbedili mehanizam za azuriranje. Azuriranje baze je sada skoro pa nemoguce. Sve primedbe ove vrste ce biti sacuvane pa cemo ih naknadno regulisati.
Citat:
jablan: Skrpio sam na brzaka GreaseMonkey skriptu koja ovo radi:
...
Edit: dodao sam i pravljenje "vidi" linkova, tj. ako definicija upućuje na neku drugu odrednicu.
Dobro je ispalo. Ipak, resenje sa JavaScriptom je neprihvatljivo. Uz to, ja sam pregledao bazu upravo zbog problema raznih oznaka (vidi je samo jedna od njih), i probacu da na slican nacin regulisem sto vise njih, medjutim ima ih dosta koje na neki nacin odstupaju od "pravila" ili prosto, nisu ukucane na isti nacin. Moramo prvo da sredimo bazu da bi smo obezbedili da se oznake mogu tretirati kroz program.
Nisam se sada mnogo upustao u to iz dva razloga: 1) imao sam sta drugo da radimna aplikaciji; 2) ne znam dovoljno o nacinu oznacavanja koji se koristi u recnicima da bih mogao da smislim konacna resenja za oznacavanje.
Ono sto me najvise brine, to je sto mi sve vise lici da ce biti potrebno rucno pregledati i srediti celu bazu, a to nije uopste mali posao. jeidno resenje koje mi pada na pamet je mala armija ljudi kojima se podeli po manji deo baze da ga srede.