[sr.openoffice.org] Формат појмовника — диверглос ИксМЛ

Часлав Илић caslav.ilic at gmx.net
Wed Apr 16 10:56:22 UTC 2008


> [: Игор Милетић :]
> Бар у мојој глави, разлика је да база података већ има разрађене алатке за
> нама потребне ствари (напредна претрага и релације), све што требамо је
> дефинисати табеле, колоне и релације међу табелама. Нажалост, не знам
> тачно шта све постоји за ИксМЛ, тако да мој аргумент може проћи као и први
> мачићи.

У приниципу, са чистог становишта кодирања и овере података, *делује* ми да
су база и ИксМЛ еквивалентни. Оно што су релације у бази, то су везе међу
ознакама у ИксМЛ-у; и једно и друго имају механизме за аутоматску оверу
(онај ДТД што сам већ написао). Несумњива предност базе је брзина прегледа,
али мислим да нам она није критична (објашњавам доле).

Што се допунских овера тиче, скрипта коју помињем треба да проверава само
неколико врло семантичких ствари, и оних специјалних угњеждених мини-
формата — не верујем да би ту база помогла, опет би се то морало
искриптовати. (Скрипта, наравно, не би читала ИксМЛ на своју руку, већ као и
за базу, користила би подршку неке библиотеке; питон подржава ИксМЛ својом
стандардном библиотеком.)

Даље, примарна намена скрипте је заправо грађење различитих излаза.
Направити ХТМЛ појмовник, ХТМЛ речник, и какве друге погодне излазне облике.
База или ИксМЛ, за ово нема друге до наменски скриптованог решења.

Не верујем ни да би база као база баш сијала с претрагом, чим се одмакнемо
од заиста најосновније напредне (ал' је конструкција :) претраге. Нпр. хоћу
да убацим целу реченицу, и добијем све пронађене терминолошке одреднице у
њој? Тако да би претрага била још једна функција поменуте скрипте (а може
постепено бити спрегнута са граматичким алатом, аутоматско одређивање корена
речи, итд.)

У ствари, за основну брзу претрагу (нпр. пошто рашчлани реченицу како ваља),
скрипта би баш могла као један од излаза да гради и користи базу. Та база
може бити и позадина појмовника на Вебу, који сви могу прегледати.

> Рецимо да желимо осим речника да имамо и референцу за корен речи, такође,
> да ли је глагол (време, повратни итд.), именица (род, падеж, множина итд.)
> . Базе дозвољавају оваква проширења. ИксМЛ такође, али би морали сами
> развијати наше скрипте.

Хех, ако погледаш онај дужи текст о формату (онај на енглеском), видећеш да
сам већ предвидео све ово :)

Али је поента да за ИксМЛ не треба урадити ништа више — нити мање — него за
базу. Нове релације у бази -> нове релације у ДТД-у. А што се градње излаза
тиче, свакако би било неопходно размислити како представити нове елементе у
различитим форматима.

> Ово се све наравно може направити по жељи, тј. која поља да се покажу, и
> шта се где уноси. Али phpMyAdmin подразумевано показује сва поља у табели.
> [...] ИксМЛ може бити одбојан за оне који се никад нису сусрели са њим
> раније. Али ако је циљ да само одређена група ради на томе, онда нема
> проблема ни са ИксМЛом.

Баш одређена група, тј. сви који се „функционално“ заинтересују. То значи,
преводилац који је сит више нереда у ономе што му пролази кроз руке, и жели
да има нешто темељито на шта може да упути друге. Они, дакле, које врло
сврби

Па сам тако замислио да за почетак то буде бар по једно-двоје из сваког
већег преводилачког забрана. Прилично сам сигуран да се нико ту неће помести
ИксМЛом, а, мада већ не толико сигуран, да би им решење са базом било само
отежавајуће без неке предности (мени свакако би).

> MySQL је бинарна база података, тако да ће и гит и СВН правити копије за
> сваки нови унос. [...] Али, у том случају се не би ни радило на Гит или
> СВН серверу, већ би се користио MySQL сервер који је и направљен за ту
> сврху (много корисника приступа и мења одређену табелу). [...]

Па да, и мислио сам на неки систем самосвојан одређеној бази (МајСКуЛ-у),
пошто је иначе непрозирна бинарна датотека, тако да нема смисла
употребљавати СУВ превасходно намењен тексту.

Поред губитка историјата, рад директно са базом на серверу обично је врло
заморан у односу на рад у локалу са обичним текстом (тј. наравно, ко се не
грози обичног текста). Па онда питање доступности сервера, итд.

> Што се мене тиче можемо кренути са ИксМЛом па ако датотека превазиђе
> неколико десетина мегабајтова можемо пребацити све на базу података, због
> брзине и организације.

То је већ сасвим у реду, да одложимо базу за „кад загусти“ :) Само не
верујем да ће; ако рачунамо просечно 1000 бајтова по уносу, за 1000 уноса —
а то није мало — треба нам само мегабајт. Поред тога, све ће то бити
исецкано у много датотека (рецимо абецедно по кључу концепта, практично
скоро као по енглеском изразу).
-------------- next part --------------
A non-text attachment was scrubbed...
Name: signature.asc
Type: application/pgp-signature
Size: 189 bytes
Desc: This is a digitally signed message part.
URL: <http://listman.redhat.com/archives/fedora-trans-sr/attachments/20080416/8d51c923/attachment.sig>


More information about the Fedora-trans-sr mailing list