Pages in topic:   [1 2] >
Lunghezza media parole italiane
Thread poster: Francesco Barbuto
Francesco Barbuto
Francesco Barbuto  Identity Verified
Local time: 22:43
English to Italian
+ ...
Aug 21, 2003

Salve,

Sapete dirmi qual è la lunghezza media delle parole italiane?

Grazie in anticipo.

FFB


 
Claudio Nasso
Claudio Nasso  Identity Verified
Italy
Local time: 22:43
English to Italian
+ ...
Non è oro colato!!!!! Aug 21, 2003

Per esperienza a me risulta di 5/6 caratteri.

Qualcun altro ha altri valori?


 
Valentina Pecchiar
Valentina Pecchiar  Identity Verified
Italy
English to Italian
+ ...
Come sopra Aug 21, 2003

Nessuna fonte certa o scientifica, ma anch'io ho sentito 5.5 car/parola.

 
Claudio Nasso
Claudio Nasso  Identity Verified
Italy
Local time: 22:43
English to Italian
+ ...
Matematica Aug 21, 2003

Muja wrote:

Nessuna fonte certa o scientifica, ma anch'io ho sentito 5.5 car/parola.



Non c'è bisogno di fonti certe. In sostanza basta dividere il numero dei caratteri di un testo (spazi compresi) per il numero delle parole e il gioco è fatto.

È una mera questione matematica. Ciao Valentina

Claudio


 
gianfranco
gianfranco  Identity Verified
Brazil
Local time: 17:43
Member (2001)
English to Italian
+ ...
Calcolo pratico Aug 21, 2003

Ho preso dei testi campione dal sito http://www.liberliber.it/home/index.asp (testi in formato elettronico), di vari autori e di lunghezza non eccessiva.

Ho scelto quattro testi non troppo lunghi, ovvero con lunghezza compresa tra le dodicimila e le trentaseimila parole l'uno, e autori tra i piu' moderni (Gianni Brera, Cesare Beccaria, Alessandro Manzoni e Luigi Milani), li ho importa
... See more
Ho preso dei testi campione dal sito http://www.liberliber.it/home/index.asp (testi in formato elettronico), di vari autori e di lunghezza non eccessiva.

Ho scelto quattro testi non troppo lunghi, ovvero con lunghezza compresa tra le dodicimila e le trentaseimila parole l'uno, e autori tra i piu' moderni (Gianni Brera, Cesare Beccaria, Alessandro Manzoni e Luigi Milani), li ho importati in Word ed ho contato parole e caratteri.

I risultati oscillano tra 5,18 e 5,81 caratteri per parola, con una media di 5,36
(il totale e' di 93296 parole e 495204 caratteri).

Aggiungendo altri testi il risultato non varia in modo significativo. Infatti, ho preso una quindicina di articoli da La Repubblica di oggi, ed ho ottenuto 12554 parole con 68624 caratteri, per una media di 5,47.

Ho preso infine "I promessi sposi", che non ho incluso nel conteggio precedente perche' le sue dimensioni rischiavano di alterare il risultato (203168 parole con 1087056 caratteri), ed ho ottenuto una media di 5,35.

Come vedi i risultati tra le quattro opere iniziali (5,36), gli articoli di giornale (5,47) ed "I promessi sposi" (5,35) indicano che la lingua italiana presenta una media approssimativa di circa 5,4 caratteri per parola.

Interessante!! avrei detto di piu'...

Gianfranco

PS: questo mio intervento conta 207 parole e 1105 caratteri: media 5,34



[Edited at 2003-08-22 11:56]
Collapse


 
Francesco Barbuto
Francesco Barbuto  Identity Verified
Local time: 22:43
English to Italian
+ ...
TOPIC STARTER
Sei un mito! Aug 21, 2003

Gianfy,

Sei un mito!!!

Analizzando un pò di testi miei, ho trovato
la media di 6 caratteri per parola. Evidentemente, più esteso è il testo analizzato, più precisa la valutazione.

By the way: conoscete qualche programma Completissimo e Free per l'analisi di testi, analisi di ogni tipo ?

FFB

[Edited at 2003-08-21 14:19]


 
Lorenzo Lilli
Lorenzo Lilli  Identity Verified
Local time: 22:43
German to Italian
+ ...
analisi? Aug 21, 2003

Francesco Barbuto wrote:

By the way: conoscete qualche programma Completissimo e Free per l'analisi di testi, analisi di ogni tipo ?

[Edited at 2003-08-21 14:19]


in che senso analisi di ogni tipo? in ogni caso complimenti a Gianfranco, non avrei mai pensato a una soluzione del genere.


 
Francesco Barbuto
Francesco Barbuto  Identity Verified
Local time: 22:43
English to Italian
+ ...
TOPIC STARTER
Analisi... Aug 21, 2003

...di ogni tipo.

Ciao Lorenzo!

Dalle più banali (numero caratteri, parole, linee, etc) alle più complesse (leggibilità, complessità stilistica, aggettivazione, coordinazione e subordinazione, etc.)

E chi più ne ha più ne metta!

Saluti,

FFB


 
Valentina Pecchiar
Valentina Pecchiar  Identity Verified
Italy
English to Italian
+ ...
Matematica Aug 21, 2003

Claudio,
Intendevo che non ho, anzi AVEVO, mai visto la verifica di questo dato generale che si sente ripetere qui e là ma nessuno sa da dove ha avuto origine.

Gianfranco ha dimostrato che non serve essere linguististi computazionali (con tutto il rispetto per Gianfranco e per i computazionalisti) e utilizzare superapplicazioni appositamente sviluppate (e magari protette da dongle

Nobel virtuale a GM (no, non per la matematica: per il buon senso!)

Gianfranco Manca wrote:

Ho preso dei testi campione dal sito http://www.liberliber.it/home/index.asp ...

Ho scelto quattro testi non troppo lunghi, con autori scelti tra i piu' moderni (Gianni Brera, Cesare Beccaria, Alessandro Manzoni e Luigi Milani) ...

I risultati oscillano tra 5,18 e 5,81 caratteri per parola, con una media di 5,36
(il totale e' risultato di 93296 parole e 495204 caratteri).

Aggiungendo altri testi il risultato non varia in modo significativo...


Gianfranco

PS: questo mio intervento conta 207 parole e 1105 caratteri: media 5,34


====================

Gianfranco Manca wrote:

Interessante, avrei detto di piu'.



Immagino che sia soprattutto il generoso uso di preposizioni - rispetto all'inglese, per esempio, con i suoi terrificanti sintagmi nominali a ripetizione calibro .32 - ad abbassare la lunghezza media delle parole italiane:

ENG > network administrator applications (7+13+12 caratteri)/3 parole = 10.67

ITA > applicazioni per amministratori di rete (12+3+14+2+4 caratteri)/5 parole = 7.0





[Edited at 2003-08-21 15:18]

[Edited at 2003-08-21 22:45]


 
gianfranco
gianfranco  Identity Verified
Brazil
Local time: 17:43
Member (2001)
English to Italian
+ ...
Significato di questi valori Aug 21, 2003

Muja wrote:

ENG > network administrator applications (7+13+12 caratteri)/3 parole = 10.67

ITA > applicazioni per amministratori di rete (12+3+14+2+4 caratteri)/5 parole = 7.0



Questi calcoli hanno significato solo se applicati a grandi volumi di testo.

Per questo motivo non ha molto senso prendere piu' di 100.000 parole, anche per un milione o dieci milioni il risultato non si discosta molto da quello ottenuto con 100.000, e ovviamente non ha senso prendere campioni troppo ristretti perche' si ottengono risultati non significativi.

Credo che il numero di caratteri medi per parola inglese sia inferiore all'italiano, con una lunghezza media leggermente inferiore a 5 caratteri.

Gianfranco



[Edited at 2003-08-21 16:52]


 
Valentina Pecchiar
Valentina Pecchiar  Identity Verified
Italy
English to Italian
+ ...
Valori: solo un esempio, infatti... Aug 21, 2003

Gianfranco Manca wrote:

Questi calcoli hanno significato solo se applicati a grandi volumi di testo ... ovviamente non ha senso prendere campioni troppo ristretti perche' si ottengono risultati non significativi.



...la lunghezza delle parole che risulta dallo striminzito esempio è superiore a quella che avevo riportato in precedenza per sentito dire e ai valori che hai ottenuto con i tuoi calcoli, semplici e brillanti insieme (anche e soprattutto per la scelta del campione).

Il mio esempio aveva lo scopo principale di mettere in evidenza il (forse) più frequente uso di parole brevi in italiano (le preposizioni) rispetto ad esempio all'inglese.

E comunque rimane soltanto una mia opinione, generata quando trovandomi davanti a una "tirata" di 5-6 sostantivi inglesi devo risolvere tutti i collegamenti logici tramite preposizioni, possibilmente evitanto ripetizioni e anglicismi... Sì, talvolta quelle "paroline" che (forse) abbassano la lunghezza media dei bei paroloni italici talvolta mi stanno proprio qui!


Gianfranco Manca wrote:

Credo che il numero di caratteri medi per parola inglese sia inferiore all'italiano, con una lunghezza media leggermente inferiore a 5 caratteri.



Eddài, applica il metodo del tuo mail precedente anche all'inglese, così possiamo avere dati scientifici, per favore...


PS Per la lettere di presentazione ai signori di Stoccolma ("Preg.mi professori, pregasi voler prendere in considerazione la candidatura di Gianfranco Manca per il Vs. premio Nobel al Buon senso in quanto ecc. ecc.") scrivimi in privato



[Edited at 2003-08-21 17:27]


 
Lorenzo Lilli
Lorenzo Lilli  Identity Verified
Local time: 22:43
German to Italian
+ ...
dongle? Aug 21, 2003

Muja wrote:

superapplicazioni appositamente sviluppate (e magari protette da dongle



Scusate la mia ignoranza: cosa si intende per dongle? Per Francesco: purtroppo non conosco questi programmi. E, per curiosità: per cosa sta la F nell'acronimo FFB?


 
Francesco Barbuto
Francesco Barbuto  Identity Verified
Local time: 22:43
English to Italian
+ ...
TOPIC STARTER
Effe centrale... Aug 21, 2003

La F centrale ... è un segreto di stato!
Non posso assolutamente rivelarne le scopo!
O è la F iniziale quella sotto segreto???

FFB


 
Valentina Pecchiar
Valentina Pecchiar  Identity Verified
Italy
English to Italian
+ ...
Dongle Aug 21, 2003

Muja wrote:
superapplicazioni appositamente sviluppate (e magari protette da dongle)


and Lorenzo Lilli asked:
Scusate la mia ignoranza: cosa si intende per dongle?


Il dongle è una chiave hardware antipirateria informatica che alcuni programmi richiedono per poter funzonare correttamente. Ovvero, se la chiave non è installata sul computer il programma non funziona oppure offre solo funzionalità ridotte (ad esempio non puoi salvare documenti oppure puoi utilizzare l'applicazione solo in versione demo). Ergo non basta che uno compri il programma e ne faccia qualche copia per gli amici includendo un'etichetta dymo con il codice Product key: gli amici devono dotarsi anche del dongle [whisper]oppure delle apposite patch che inevitabilmente si trovano sui siti "specializzati"[/whisper]
Il dongle è un affarino driver che viene inserito in una delle porte del computer (di solito la seriale, ma esistono anche dongle USB), che lo risconosce tramite l'apposito driver e attiva le piene funzionalità dell'applicazione.

Io alludevo al popolare programma di traduzione assistita che comincia per T e finisce per S (anzi s)...



[Edited at 2003-08-21 22:48]

PS per Gianfranco (già che sei da "queste parti"): è possibile che inserendo una (falsa) tag contenuta tra gli appositi marker, ProZ si mangi il resto del messaggio, da quel punto il poi? E' quello che è successo con [whisper] nel corpo del messaggio (in precedenza racchiusa fra le due "orecchiette").


[Edited at 2003-08-22 07:31]


 
Lorenzo Lilli
Lorenzo Lilli  Identity Verified
Local time: 22:43
German to Italian
+ ...
capito Aug 22, 2003

Muja wrote:

Il dongle è una chiave hardware antipirateria informatica che alcuni programmi richiedono per poter funzonare correttamente.



Allora ho capito, ho un dongle nel Mac per QuarkXpress, ma finora tanto per essere preciso l'avevo sempre chiamato "coso attaccato alla tastiera" Grazie!


 
Pages in topic:   [1 2] >


To report site rules violations or get help, contact a site moderator:


You can also contact site staff by submitting a support request »

Lunghezza media parole italiane






Wordfast Pro
Translation Memory Software for Any Platform

Exclusive discount for ProZ.com users! Save over 13% when purchasing Wordfast Pro through ProZ.com. Wordfast is the world's #1 provider of platform-independent Translation Memory software. Consistently ranked the most user-friendly and highest value

Buy now! »
Protemos translation business management system
Create your account in minutes, and start working! 3-month trial for agencies, and free for freelancers!

The system lets you keep client/vendor database, with contacts and rates, manage projects and assign jobs to vendors, issue invoices, track payments, store and manage project files, generate business reports on turnover profit per client/manager etc.

More info »