Sisällönhallinta- ja julkaisutyökaluilla ylläpidettyjen Web-sivustojen lokalisointi
Valtaosa nykyisistä WWW-verkkosivuista on tuotettu erilaisilla sisällönhallinta- ja julkaisutyökaluilla (Content Management System, CMS), jotka tuottavat lopullisen kulloinkin näkyvän Web-sivun tietokantaan tallennetun sisällön ja sitä ohjaavan ja muokkaavan ohjelmakoodin dynaamisena yhdistelmänä.
Aikaisemmin käytettyihin staattisiin html-sivuihin verrattuna tällainen kehitys on tuonut uuden ja hankalasti ratkaistavan haasteen tekstisivujen kääntämiselle ja lokalisoinnille, sillä hieman yllättävästi sisällönhallintajärjestelmien ja toisaalta käännöstyökalujen kehittäjät eivät ole löytäneet toisiaan kehittääkseen tapoja, joilla dynaamisen sisällöntuotannon ja monikielisyyden vaatimukset voitaisiin toteuttaa mahdollisimman tehokkaasti ja taloudellisesti.
Staattisten ja dynaamisten sivustojen teknisiä eroja käsitellään lähemmin kohdassa Sivuston suunnittelu.
Useimmat markkinoilla olevista palveluista tarjoavat nykyisin lupauksia ”monikielisyydestä”, mutta vain osa järjestelmistä tarjoaa todellisen rinnakkaisen monikielisen sivuston tuen. Esimerkiksi erittäin yleinen ja suosittu WordPress-ylläpitojärjestelmä, jolla nykyisin tuotetaan jopa neljännes kaikista julkaistavista WWW-sivuista, luotiin alun alkaen helppokäyttöistä ”verkkobloggausta” varten. Sitä kehitettäessä ei siis otettu lainkaan huomioon mahdollisuutta tehokkaasti luoda ja ylläpitää monikielisiä sivustoja, jotka koostuvat monitasoisista tyypiltään staattisen luonteisista tietosivukokonaisuuksista.
Siitä huolimatta, että WordPress-järjestelmään on nykyisin saatavana lukuisia monikielisyyttä tukevia lisäosia, laajojen WordPress-pohjaisten, räätälöidyille mallipohjille rakentuvien sivustojen laajentamisessa kattamaan useita rinnakkaisia kieliversioita törmätään usein odottamattomiin vaikeuksiin. Näin tapahtuu etenkin silloin, jos monikielisyyden tarvetta ei ole osattu riittävästi ennakoida alkuperäistä sivustoa ja sen toteutusympäristöä suunniteltaessa ja luotaessa.
Vaikka järjestelmä valmistajan ilmoituksen mukaan olisikin ”monikielinen”, se ei välttämättä siitä huolimatta ole helposti lokalisoitavissa. Ennen kuin CMS-järjestelmää voidaan pitää lokalisoitavana, sen tulee mahdollistaa jokaiselle sivulle syötettävän rinnakkaisen tekstin tunnistaminen ja erottelu muista kielistä kaikilla sivuston sivuilla. Tällöin jokaiselle järjestelmässä olevalle kielelle on tietokannassa olemassa oma tekstisisältönsä ja otsikkotiedot, jokaiselle sivulle oma sisältönsä.
Useimmiten tietokannoissa käytetään SQL-kieltä kannassa olevan tekstin vientiin tietokannasta ulos ja sen tuontiin takaisin tietokantaan. Kun käännetty teksti palautetaan tietokantaan, tietokannan uudet tietueet sisältävät kyseistä kieltä koskevan tunnisteen ”kieli”-kentässä. Jos tietokantaratkaisu ei tue monikielisyyttä, käytettävissä on tosin erilaisia kiertoteitä, joilla monikielisyys on mahdollista toteuttaa.
Äärimmäisenä vaihtoehtona voidaan pitää useiden erikielisten rinnakkaisten sivustojen luomista. Tällainen käytäntö on nykyisin varsin yleinen esimerkiksi WordPress-järjestelmillä ylläpidettävissä sivustoissa. Ratkaisu on mallina varteenotettava etenkin silloin, jos eri kielillä luodut sivustot ovat sisällöltään tai rakenteeltaan hyvin erilaisia tai niiden ylläpito tapahtuu hajautetusti eri kielialueilla. Rinnakkaisten sivustojen keskitetty ylläpito on toisaalta kömpelöä ja aiheuttaa haasteita etenkin silloin, jos sivustolla halutaan läpinäkyvästi ”hyppiä” samansisältöisten mutta erikielisten sivujen välillä.

Kuva yllä: Monissa tämän hetken julkaisujärjestelmissä on rakenteellisesti toteutettu monikielisyyden tuki. Sivustolle voidaan siis järjestelmän sisällä suoraan luoda rinnakkaisia monikielisiä sivuja. Valitettavasti itse sisällön kääntämisessä on usein rajoituttu ratkaisuun, jossa kääntäjä joutuu toimimaan järjestelmään kytkeytyneenä, joko sisäverkossa tai etäyhteydellä Internetissä.
Aito monikielisyyskään ei takaa, että järjestelmä itsessään tarjoaisi mahdollisuuden modernien käännöstyökalujen käyttämiseen ainakaan ammattimaisella tasolla. Etenkin monissa kehittyneissä ja laajassa käytössä olevissa avoimen lähdekoodin Web-julkaisujärjestelmissä (esim. Drupal, Joomla, WordPress) sekä useissa näitä muistuttavissa sovelluksissa lokalisoitavuus on valitettavasti vielä ymmärretty vain mahdollisuudeksi kääntää tekstejä eri kielille järjestelmän sisällä.
Tämä edellyttää kääntäjän tai ammattimaisen käännöstoimiston voivan kytkeytyä itse järjestelmään tai tekevän käännöstyön Internet-käyttöliittymän kautta. Käytettäessä yrityksen ulkopuolisia kääntäjiä tämä usein merkitsee järjestelmän ylläpitäjille lisääntynyttä työmäärää muun muassa tietoturvan ja sisällön varmistuksen suhteen.
Jos halutaan käyttää nykyaikaisia käännöstyökaluja, joissa hyödynnetään integroituja sanastoja ja käännösmuisteja, keskitetty ratkaisu on kömpelö. Jotta käännöstyössä voitaisiin mahdollisimman tehokkaasti toteuttaa kaupallisia toimintamalleja, julkaisujärjestelmässä tulisi olla mahdollisuus viedä tekstejä järjestelmästä ulos kääntämisen ajaksi ja käännöstyökalujen edellyttämässä muodossa sekä mahdollisuus palauttaa käännetyt tekstit takaisin järjestelmään asianmukaisille paikoilleen.
Vaikuttaa siltä, että vasta aivan viime aikoina on alettu ymmärtää, miten merkittävä kysymys ammattimaisesti toteutettu sivuston monikielisyys on. Julkaisujärjestelmiin on alettu kehittää valmiita sisäisiä tai erikseen liitettäviä ulkoisen lokalisoinnin hallintamoduuleja. Useimmat näistä ratkaisuista tuntuvat perustuvan ajatukselle automaattisen konekäännöksen käytöstä. Vaikka konekäännösteknologia onkin kehittynyt huimasti viime vuosien aikana, automaattiseen konekäännökseen perustuvat sivut ovat lähiajan realiteetti vain joissakin suurissa maailmankielissä ja silloinkin vain sivustokokonaisuuksissa, joissa tekstin ehdottoman virheetön tiedollinen ja tyylillinen sisältö ei ole ratkaisevan tärkeää.

Kuva yllä: Integroidussa CMS-lokalisointijärjestelmässä on erillinen sovellus, joka huolehtii liikennöinnistä Web-sivuston ylläpidon ja tekstin lokalisoinnista vastaavan käännöstoimiston välillä. Sivuston ylläpitäjä voi lähettää uuden tai päivitettävän sisällön suoraan käännöstoimistolle, joka huolehtii tekstin kääntämisestä ja palauttaa aineiston järjestelmässä julkaistavaksi.
Edellä kuvattujen keskitettyjen järjestelmien puutteellisuuksien johdosta monet lokalisointialan kaupalliset yritykset ovat ryhtyneet omatoimisesti luomaan suosituille julkaisujärjestelmille (esim. Alfresco, Drupal, EPiServer, MS SharePoint, Sitecore, WordPress) räätälöityjä ”integroituja ratkaisuja”, joiden avulla Web-sivuston ylläpidosta vastaava käyttäjä voi lähettää lokalisoinnin toimeksiantoja suoraan järjestelmästä kyseiselle yhteistyökumppanille. Kehittyneimmillään tällaiset ratkaisut toimivat hyvin ja sisältävät tekstien automaattisen käsittelyn ohella myös projektihallinnallisia ominaisuuksia kuten automaattisen hinta-arvion antamisen ja työn aikatauluttamisen.
Kehittyneissä integraatiosovelluksissa teknisen manuaalisen työn osuus jää pieneksi, mikä tekee ratkaisusta taloudellisen ja rationaalisen erityisesti sellaisilla sivustoilla, joissa muutosten määrä on suuri mutta kerralla päivitetään vain pieniä tekstimääriä. Integroitujen liittymien avulla myös pienten tietomäärien päivitykset hoituvat nopeasti ja helposti.
Räätälöityihin integraatioliittymiin pohjautuvat ratkaisut sitovat usein asiakkaan ja käännösyrityksen yhteen varsin kiintein sitein, jolloin työn kilpailuttaminen vaikeutuu, ainakin pienimuotoisissa projekteissa. Lisäksi uuden sivuston perustamisen jälkeen myös sen päivitykset joudutaan useimmiten tekemään samassa paikassa kuin alkuperäinen sivusto, sillä asiakaskohtaisesti räätälöidyt sovellukset eivät yleensä ole suoraan yhteensopivia kilpailevien käännösyritysten ratkaisujen kanssa. Integroitujen ratkaisujen hintavuus sulkee myös pois pienten käännösalan yritysten ja freelance-kääntäjien suoran käytön
Joissakin markkinoilla olevista järjestelmistä (esim. eZPublish, Typo3) tiedon vienti ja tuonti erilaisiin käännettäviin tiedostomuotoihin on valmiiksi järjestelmään sisään rakennettu ominaisuus tai erikseen asennettava lokalisointimoduuli. Tällöin lokalisointiprosessin tekninen toteutus on suhteellisen helppoa eikä vaadi kovin vaativaa teknistä osaamista. Valitettavasti tällä hetkellä vain harvoissa avoimen lähdekoodin järjestelmissä tai kaupallisissa sovelluksissa on sellainen toimiva sisäinen ratkaisu, joka mahdollistaa käännettävän ja/tai lokalisoitavan aineiston helpon ulos viennin ja takaisin tuonnin sellaisessa tiedostomuodossa, joka ilman monimutkaisia järjestelyjä tukee yleisesti käytössä olevia käännöstyökaluja.

Kuva yllä: Useissa Web-julkaisemiseen tarkoitetussa sisällönhallintajärjestelmässä on rakenteellisesti toteutetun monikielisyyden tuen ohella myös jonkinlainen mahdollisuus tuoda tekstisisältöä tietokannasta käännösprosessissa tarvittavaan tiedostomuotoon ja palauttaa se kääntämisen jälkeen takaisin omalle paikalleen. Tämä mahdollistaa ammattimaisten käännöstyökalujen käytön.
Jos tietojen vienti ja tuonti tehdään tietokantaa operoimalla, toimenpide edellyttää jonkin verran teknistä erityisosaamista, erillisiä apuohjelmia ja teknisen henkilöstön panosta. Integroidusta ratkaisusta poiketen tavanomainen tietokantaratkaisu vaatii myös enemmän manuaalisia työvaiheita käännösprosessin aikana. Toisaalta yleislokalisoitava CMS-järjestelmä tarjoaa suuremmat joustomahdollisuudet yhteistyökumppanin valinnassa ja työssä sovellettavissa menetelmissä.
Tietokannan operointiin perustuva käännösprosessi sopii hyvin uusien kielisivustojen perustamisvaiheeseen jolloin käännettävää tekstiä on kerralla runsaasti. Pienissä mutta usein toistuvissa päivityksissä manuaalisten työvaiheiden suhteellinen osuus lisääntyy merkittävästi ja yksittäisten käännöstoimeksiantojen sanahinta kasvaa keskitettyjä ja integroituja järjestelmiä korkeammaksi.

Kuva yllä: Todellisen monikielisyyden tuen ja/tai käännettävän tekstin tuonti- ja vientiominaisuuksien puuttuminen voi tehdä dynaamisesti toteutetun Web-sivuston ylläpidosta aikaa vievän ja kalliin prosessin. Pullonkaulaksi muodostuu usein yhteysliikenne sivuston ylläpitäjän ja käännöstoimiston välillä. Pahimmassa tapauksessa kaikki lisäykset ja muutokset joudutaan toteuttamaan manuaalisesti.
Riippumatta siitä, onko käytettävissä oleva järjestelmä alkujaan kehitetty tukemaan monikielisyyttä ja lokalisoitavuutta, tietojen vienti ja tuonti saattaa osoittautua kömpelöksi, jollei järjestelmä mahdollista suoraa pääsyä tekstit sisältävään tietokantatauluun. Kaiken tiedon vienti järjestelmästä ulos kääntämistä varten ja tuonti takaisin käännettyinä teksteinä saattaa vaatia manuaalista työskentelyä järjestelmän käyttöliittymän kautta, mikä huomattavasti lisää työhön kuluvaa aikaa.
Järjestelmistä ne, jotka eivät mahdollista suoraa pääsyä tietokantaan, sisältävät harvoin myöskään omia työkaluja tietojen tuomiseksi ja viemiseksi (yleensä .xml- tai .csv-muodossa). Myöskään monet niistä järjestelmistä, joissa on omia vienti- ja tuontityökaluja, eivät tue monikielisyyttä ja rinnakkaisten kielisivujen viemistä järjestelmään. Sekä puutteellinen mahdollisuus viedä teksti ulos kääntämistä varten että käännetyn tekstin palautusmahdollisuuden puuttuminen tekevät Web-sivuston lokalisoitavuuden kömpelöksi.
CMS-järjestelmällä ylläpidettävän Web-sivuston lokalisoitavuus vaihtelee tapauskohtaisesti ja järjestelmän ominaispiirteet tulisi aina selvittää ennakolta ennen kuin ryhdytään tekemään arvioita sivuston lokalisoinnin kustannuksista ja työhön kuluvasta ajasta.
Jos suunnittelet Web-sivustosi kääntämistä ja/tai lokalisointia ja tiedät, että sivuston ylläpito tapahtuu julkaisu- tai sisällönhallintajärjestelmän avulla, ota huomioon edellä esitetyt seikat ja neuvottele niistä etukäteen työn toteuttajaksi aiotun käännösyrityksen tai ammattitaitoisen lokalisointikonsultin kanssa.