https://www.proz.com/forum/italian/30494-corpus_della_lingua_italiana.html

Corpus della lingua italiana?
Thread poster: Colin Ryan (X)
Colin Ryan (X)
Colin Ryan (X)  Identity Verified
Local time: 09:26
Italian to English
+ ...
Mar 16, 2005

Salve
Sto frequentando un corso di linguistica dove studio l'inglese con un 'corpus' di brani di inglese parlato e scritto. Qualcuno di voi saprà se esiste un corpus simile in italiano? Parlo dell'equivalente del Collins COBUILD e il Longman corpus...
Grazie
Colm


 
Gaetano Silvestri Campagnano
Gaetano Silvestri Campagnano  Identity Verified
Italy
Local time: 09:26
Member (2005)
English to Italian
+ ...
Wordtheque di Logos Mar 16, 2005

Ciao Ryan

Se cerchi una raccolta di testi in una stessa lingua, esiste la Wordtheque di Logos, una delle più grandi raccolte on line di testi nella maggior parte delle lingue del mondo, di cui ti riporto qui il link relativo all'italian
... See more
Ciao Ryan

Se cerchi una raccolta di testi in una stessa lingua, esiste la Wordtheque di Logos, una delle più grandi raccolte on line di testi nella maggior parte delle lingue del mondo, di cui ti riporto qui il link relativo all'italiano:

http://www.wordtheque.com/pls/wordtc/new_wordtheque.wcom_literature.literaturea_page?lang=IT&letter=A&source=search&page=1

Credo comunque che questa raccolta, composta da ben 5814 documenti, comprenda solo testi scritti, sia tecnici che letterari, alcuni dei quali anche in versione sonora.

Non so però se ti riferivi esattamente a questo nella tua domanda.

Hope This Helps,

Gaetano

[Edited at 2005-03-16 15:06]
Collapse


 
Sara Castagnoli
Sara Castagnoli
Local time: 09:26
English to Italian
+ ...
corpus di italiano giornalistico Mar 16, 2005

ryancolm wrote:

Parlo dell'equivalente del Collins COBUILD e il Longman corpus...


Purtroppo non conosco corpora simili per l'italiano, ma...

esiste un corpus di circa 400.000.000 milioni di parole formato da 10 annate del quotidiano La Repubblica, creato e sviluppato dalla Scuola Superiore di Lingue Moderne per Interpreti e Traduttori di Forlì, Università di Bologna. E' disponibile a questo indirizzo, previa registrazione assolutamente gratuita:
http://sslmitdev-online.sslmit.unibo.it/corpora/corpus.php?path=&name=Repubblica

E' un corpus mono-source, con tutte le implicazioni del caso, ma è POS-taggato e lemmatizzato, quindi si possono fare ricerche piuttosto sofisticate.

Spero ti possa essere utile!
Sara


 
Colin Ryan (X)
Colin Ryan (X)  Identity Verified
Local time: 09:26
Italian to English
+ ...
TOPIC STARTER
Grazie a tutti! Mar 18, 2005

Ciao
Voglio ringraziare tutti che mi ha risposto e dato dei link in internet. Sono stati utilissimi.
Grazie di nuovo!
Colm Ryan


 


To report site rules violations or get help, contact a site moderator:


You can also contact site staff by submitting a support request »

Corpus della lingua italiana?






Anycount & Translation Office 3000
Translation Office 3000

Translation Office 3000 is an advanced accounting tool for freelance translators and small agencies. TO3000 easily and seamlessly integrates with the business life of professional freelance translators.

More info »
TM-Town
Manage your TMs and Terms ... and boost your translation business

Are you ready for something fresh in the industry? TM-Town is a unique new site for you -- the freelance translator -- to store, manage and share translation memories (TMs) and glossaries...and potentially meet new clients on the basis of your prior work.

More info »