neljapäev, 13. märts 2014

Enter the Matrix

[Sellest tuleb nüüd üks nerdy nerdy nerdy postitus] Aga eile sai üle pika aja natuke jämmi tehtud. Plaan on nimelt kursaõe ja sama programmi vilistlasega kuu lõpus toimuval kursapeol üles astuda. Eks näis; mängisime mõned lood kokku ja kaalusime, kas esitada Suits Vee Peal ukuleleversioonis. Seetõttu tänahommikune tekstiarvutamise harjutustund just väga ärksalt ei läinud...

Ja lisaks tuli seal maatriksitega opereerida, maatrikseid prokjektida, maatrikseid normaliseerida ja veel midagi teha, millest ma veel vähem aru saan. Seda Matlabis, millest ma üldse eriti aru ei saa (Matlab on insenäridele sama mis R arvutilingvistidele või Stata majandusteadlastele, ainult et Matlabis saab lisaks terveid programme programmeerida).
Hilishommikul käisime Liisiga poes ja pärast seda võtsime ette ja sõitsime piknikule (ainus linnaväline ent samas piisavalt lähedal asuv piknikulaud, mida ma hetkel peast teadsin, asub ühes kiirteebensuka parkla mururibal; ent me ei lasknud ent sellest häirida), tegime baguette'ist juustu-praesibula-rukkolasaiu ja nautisime päikest.

Apelsinipuu Gentis
Selle nädala praktikapäevad uduses Gentis läksid põhiliselt mustal ekraanil tiksuvat käsureakursorit põrnitsedes. Leidsin EKI lehelt mingi vana sõnastikuprojekti baasi, mul nimelt tõlkesõnapaaride nimekirja vaja, et paralleelkorpusi joondada. Sõnastikus on 130000+ sissekannet, seega muidugi käsitsi puhastamine kõne alla ei tule. Seega ma võtsin kätte ja õppisin ära regulaaravaldised, ja kuidas neid keerulistesse mustritesse panna, et siis lõpuks ühe klõpsuga sajas väikses failis või ühes suures failis mitutuhat kirjet korraga ära muuta. Pika pusimise järel õnnestus muuhulgas tööle saada umbes reapikkune avaldis, mis otsib üles kirjed, kus on mitu vastet, teeb nii palju uusi kirjeid, kui on n-1 vasteid, paneb lähtesõna igale uuele reale ja igale ühele ühe vaste järele, korjab vahepealt ära üleliigsed komad ja tühikud ja toob mulle värske tassi kohvi ja hommikuse ajalehe.