Archivo para mayo, 2009

Web 3.0

Posted in Lanak, Rdf0809 on mayo 31, 2009 by Alain

Web 3.0 espresioa neologismo bat da erabilpenaren bilakaera eta sarean modu desberdinen bidez dagoen interakzioa definitzeko. Honek esan nahi du aldaketa bat egon behar dela, sarea datu-base bat bihurtuz. Web 3.0 espresioa lehenengo aldiz Jeffrey Zeldman-ek erabili zuen 2006 urtean.

Web 3.0 lortzeko egin den lehen urratsa Data Web-aren sorketa da, interneten erabiltzen diren formatuak informazioa aipatzeko ugariak baitira. Data Web hau lehenengo urratsa bat da Web Semantiko oso bat lortzeko. Honen helbururik garrantzitsuena datu estrukturatuak RDF-aren bidez eskuragarri edukitzea da. Enpresa batzuek, hala nola Google eta IBM, teknologia berriak aplikatzen ari dira Web 3.0-ra egokitzeko.

Web 3.0 honen eremuan, egiten ari diren ikerkuntza akademikoen helburua, logika erabiliz, hausnartu egiten duten programak sortzea da. Dena dela, Sramana Mitra-k ez du uste Web Semantikoa, internetari dagokionez, gizaldi berriaren esentzia izango denik.

Bukatzeko esan beharra dago Web 1.0 baliagarria zela irakurtzeko. Web 2.0 irakurtzeko eta idazteko. Eta Web 3.0-rekin irakurtzeaz eta idazteaz aparte, tartekapenak egin daitezke Web orrialde desberdinetan dauden edukien artean.

Iturriak:

-Jeffrey Zeldman (1995-2009): Zeldman.com [2009ko maiatzaren 31ko erreferentzia]. Web orrialdea: http://www.zeldman.com/

-DataWeb (2009. urtea): DataWeb.com [2009ko maiatzaren 31ko erreferentzia]. Web orrialdea: http://www.dataweb.com/Views/Home.view

-Web semántica (2009ko maiatza): Wikipedia, la enciclopedia libre. [2009ko maiatzaren 31ko erreferentzia]. Web orrialdea: http://es.wikipedia.org/wiki/Web_semantica

-Resource Description Framework (2009ko apirila): Wikipedia, la enciclopedia libre. [2009ko maiatzaren 31ko erreferentzia]. Web orrialdea: http://es.wikipedia.org/wiki/Resource_Description_Framework

-Google Inc. (2009ko maiatza): Wikipedia, la enciclopedia libre. [2009ko maiatzaren 31ko erreferentzia]. Web orrialdea: http://es.wikipedia.org/wiki/Google

-IBM (2009. urtea): IBM España. [2009ko maiatzaren 31ko erreferentzia]. Web orrialdea: http://www.ibm.com/es/es/

-Sramana Mitra (2005-2009): Entrepreneur Journeys. [2009ko maiatzaren 31ko erreferentzia]. Web orrialdea: http://www.sramanamitra.com/bio/

Anuncios

Fonetiker

Posted in Lanak, Rdf0809 on mayo 24, 2009 by Alain

Fonetiker ikerketa-talde bat da, 1993tik Deustuko Unibertsitatearen Fonetika laborategian lan egiten duena. Maila fonikoarekin erlazionatuta dauden mota guztietako proiektuak egiten ditu gaztelaniaz nahiz euskaraz. Hiru pertsonek osatzen dute: Alexander Iribar Ibabe, Ana Elejabeitia Ortuondo eta Rosa Miren Pagola Petrirena.

Fonetiker ikerketa metodo proio bat du “Hizkuntza eta teknologia: Euskara eta gaztelaniaren fonetika experimentala” deitzen dena. Bere ikerketa-helburu batzuk dira:

-> Euskara eta gaztelaniaren deskripzio akustikoa eta artikulatorioa.

-> Euskal Herrian hitz egiten den gaztelaniaren ikerketa sakon bat.

-> Entzutezko “Corpus”-en sorketa.

Aldi berean, Fonetiker ikerketa-taldeak zenbait diru-laguntza jaso ditu proiektu desberdinak atera ahal izateko: “Euskalkien azhoko corpusen etiketatze erdi-automatikoa”, “Fonatari: Euskal fonetikaren ataria” eta abar. Bere ikerketa-proiektu garrantzitsuenak dira:

-> DAREMOSE (Descripción articulatoria experimental y modelizada de los sonidos en euskara)

-> AMPER-EUSK (Atlas multimedia de prosodia del espacio románico)

-> ARNEFE (Aplicación de redes neuronales para la evolución automatica del nivel fónico del euskara)

fonetica

Iturriak:

-Laboratorio de fonética (2009. urtea): Universidad de Deusto. [2009ko maiatzaren 24ko erreferentzia] Web orrialdea: http://www.letras.deusto.es/servlet/Satellite/Page/1134735330092/_cast/%231134735330092%231134735330486%231134735330504/c0/UniversidadDeusto/Page/MapaWebTemplate

-Alexander Iribar Ibabe (2008. urtea) Universidad de Deusto. [2009ko maiatzaren 24ko erreferentzia] Web orrialdea: http://paginaspersonales.deusto.es/airibar/

-Rosa Miren Pagola Petrirena (2009. urtea): Universidad de Deusto, Facultad de Filolosofía y letras. [2009ko maiatzaren 24ko erreferentzia] Web orrialdea: http://www.letras.deusto.es/servlet/Satellite/Page/1117788706901/_cast/%231117781832433%231117781832560%231117788706901/UniversidadDeusto/Profesores/DetalleTutorias?codCentro=&codProfesor=1538

Itzulpen automatikoaren jatorria.

Posted in Lanak, Rdf0809 on mayo 13, 2009 by Alain

Itzulpen automatikoari ere Machine Translation (MT) deitzen zaio. Hizkuntzalaritza konputazionalaren alor bat da, software-ren bidez, testuak hizkuntza batetik bestera pasatzeko. Bi maila eduki ditzake:

Erraza-> Hizkuntzen artean baliokideak diren hitzak aldatu, nahiz eta jatorrizko zentzua desagertu (Itzulpen literala)

Zehatzagoa -> “Corpus” linguistikoen bidez, itzulpen zailagoak egiten dira, non egokiagoak eta errealagoak baitira.

Baina itzulpen automatikoarena ez da atzo goizekoa; aspalditik dator. Esaten da XVIII. mendean hiztegi mekaniakoak (zenbaki-kode unibertsalak erabiliz) erabiltzen zirela,  hizkuntza desberdineko pertsonak elkarren artean ulertzeko, printzipio logiko eta ikonoetan oinarritutako hizkuntza unibertsal bat lortu arte.

Horregatik, lehenengo ordenagailuak erabilgarri egon zirenetik, 1940. urtearen inguruan, itzulpen automatikoaren afera hil ala bizikoa izan da. Gainera, bigarren mundu-gerra dela medio, metodo konputzazional ugari erabiltzen ziren kodifikatuta zeuden mezuak argitzeko.

Urteak joan urteak etorri, esperimentu eta inbertsio asko egin dira, ikaragarrizko aurrerapenak lortuz. Gaur egun, lengoaiaren industrian itzulpen automatikoa derrigorrezkoa da. Eremu honetan, badaude bi izen aipagarriak direnak: John Hutchins eta Johnatan Slocum.

Iturriak:

-Machine translation (2009ko ekaina): Wikipedia, the free encyclopedia. [2009ko maiatzaren 13ko erreferentzia] Web orrialdea: http://en.wikipedia.org/wiki/Machine_translation

-John Hutchins (2009ko martxoa): Publications on machine translation, computer-based translation technologies, linguistics and other topics. [2009ko maiatzaren 13ko erreferentzia] Web orrialdea: http://www.hutchinsweb.me.uk/

-Jonathan Slocum (2009ko maiatza): Linguistics Research Center. [2009ko maiatzaren 13ko erreferentzia] Web orrialdea: http://www.utexas.edu/cola/centers/lrc/general/facultyhomes/jonathan.html

Hiztegiak

Posted in Lanak, Rdf0809 on mayo 12, 2009 by Alain

Hiztegi bat bilketa-lan bat da hitzak hurrenkera alfabetikoan kontsulta ditzagun. Hitzei buruz zenbait gauza esaten zazikigu, hala nola, kategoria, ortografia,  etimologia, eta hainbat kasutan baita ahoskera ere. Hiztegiak egiten dituen zientzia lexikografia da. Bizitzan zehar, hiztegiak aipatu direnean, paperezko bertsioei egin zaie erreferentzia, baina gaur egun internet-en eskuragarri ditugu.

Hiztegi mota asko daude, haietako batzuk dira:

Lengoaia hiztegiak-> Hitz batek duen esanahia azaltzen da.

Hiztegi etimologikoak-> Hitzen sorrerari buruz informazioa eskaintzen da.

Antonimo eta sinonimo hiztegiak-> Esanahi berdina edo antzekoa daukaten hitzak tartekatzen dira hiztegi hauetan, eta baita kontrakoak direnak ere.

Hizkuntzen hiztegiak -> Beste hizkuntza batzuetan baliokideak diren hitzak aipatzen zaizkigu.

Hiztegi bereziak -> Alor zehatz bateko hitzak argitzen zaizkigu.

Gramatika hiztegiak-> Hemen hurrenkeran agertzen dena estruktura gramatikalak dira.

Dena dela, gehien erabiltzen diren hiztegiak, lengoaia hiztegiak dira. Adibide bi ipintzeagatik, euskaraz eta ingelesez hauek nabarmenduko genituzke:

Ingelesez-> Collins dictionary (Elebakarra) eta Word Reference (Eleaskodun)

Euskaraz-> Euskaltzaindia (Elebakarra) eta Elhuyar (Elebiduna)

o_Diccionarios

Iturriak:

– Lexicografía (2009ko martxoa): Wikipedia, La enciclopedia libre. [2009ko maitzaren 12ko erreferentzia] Web orrialdea: http://es.wikipedia.org/wiki/Lexicografia

Collins dictionary (2009. urtea): Collins lenguage. [2009ko maitzaren 12ko erreferentzia] Web orrialdea: http://www.collinslanguage.com/

– Word reference (2009. urtea) Diccionarios de Español, Inglés, Francés y Portugués. [2009ko maitzaren 12ko erreferentzia] Web orrialdea: http://www.wordreference.com/es/

Hiztegi batua (2008. urtea) Euskaltzaindia. [2009ko maitzaren 12ko erreferentzia] Web orrialdea: http://www.euskaltzaindia.net/hiztegibatua/

– Elhuyar hiztegia (2004. urtea) Elhuyar Fundazioa. [2009ko maitzaren 12ko erreferentzia] Web orrialdea: http://www.euskara.euskadi.net/r59-15172x/eu/hizt_el/index.asp

BNC

Posted in Lanak, Rdf0809 on mayo 9, 2009 by Alain

British National Corpus-a (BNC) 100 milioiko hitz-bilduma da, Erresuma Batuan hitz egiten den ingelesaren erakusgarri dena. BNC-k 4.054 testu ditu; hots, inprimatuz gero 100 metro-paper izango litzateke, eta osorik irakurtzeko 4 urte beharko genituzke.

BNC-a 1990ean sortu zuten eta hurrengo urterako dagoeneko martxan zegoen, lehenengo hiru urteetan ehunka hitz bilduz. 100 milioi horietatik, ehuneko laurogeita hamarra idatzita dauden hitzak dira, eta gelditzen den hamarra literalki transkribatuta daude. Bere lehenengo edizioa 1994an argiratua izan zen.

Bere produktuetako batzuk dira:

-> BNC XML Edition

-> BNC Baby

-> BNC Sampler

-> BNC Corpus

BNC-K duen helbururik garrantzitsuena ingeles hizkuntzaren benetako erabilpenaren berri ematea da,  gramatika liburuek eta hiztegiek ezin baitute modu zehatzean eman. Dena dela, BNC-a pentsatuta dago mundu guztiak erabil dezan, hala nola, ikasleek, irakasleek, ikertzaileaek, linguistek, eta abar.

Iturriak:

British National Corpus (January, 2009) : About the BNC [2009ko maiatzaren 09ko erreferentzia] Web orrialdea:  http://www.natcorp.ox.ac.uk/

British National Corpus (January, 2009) : BNC products [2009ko maiatzaren 09ko erreferentzia] Web orrialdea:  http://www.natcorp.ox.ac.uk/corpus/index.xml.ID=products

“Corpus” linguistikoa

Posted in Lanak, Rdf0809 on mayo 9, 2009 by Alain

“Corpus” linguistiko bat hizkuntza batetik ateratako adibide multzo bat da. Adibide hauek guztiak testuak izaten dira normalean, baina ahozko formatoan ere egon daitezke. Hizkuntzalaraitzak badu adar bat hizkuntzak ikertzen dituena adibide hauen bidez.  Adar honi “Corpus-linguistika” deitzen zaio. Pentsaera honek  talka egiten du Chomsky-k esandakoarekin, hizkuntza hiztunaren intuizioaren bidez ikertu behar baita haren ustez.

“Corpus linguitika” hau parekatzen da “Hizkuntzalaritza konputazionala”-rekin. Disziplina hau 1967an hasi zen Henry Kucera-k eta Nelson Francis-ek “Computational Analysis of Present-Day American English” publikatu zutenean. Hala egiteko, Brown corpus-ean oinarritu ziren,  non gutxi gorabehera Amerikako Estatu Batuetan erabiltzen den ingelesaren milioi bat hitz agertzen baitira.

Iturriak:

Noam Chomsky (2009ko maiatza): Wikipedia, La enciclopedia libre. [2009ko maiatzaren 09ko erreferentzia] Web orrialdea: http://es.wikipedia.org/wiki/Chomsky

Lingüistica computacional (2006. urtea): El portal educativo del Estado argentino. [2009ko maiatzaren 09ko erreferentzia] Web orrialdea: http://aportes.educ.ar/lengua/nucleo-teorico/influencia-de-las-tic/tecnologias-de-la-informacion-y-la-comunicacion-tic-y-lingueistica/lingueistica_computacional.php

Henry Kucera (2009ko apirila): Wikipedia, The Free Encyclopedia. [2009ko maiatzaren 09ko erreferentzia] Web orrialdea: http://en.wikipedia.org/wiki/Henry_Kucera

The Bown Corpus (1998ko otsaila): W-3 Corpora project [2009ko maiatzaren 09ko erreferentzia] Web orrialdea: http://www.essex.ac.uk/linguistics/clmt/w3c/corpus_ling/content/corpora/list/private/brown/brown.html