Pages in topic:   [1 2] >
Lunghezza media parole italiane
Thread poster: Francesco Barbuto

Francesco Barbuto  Identity Verified
Local time: 22:22
English to Italian
+ ...
Aug 21, 2003

Salve,

Sapete dirmi qual è la lunghezza media delle parole italiane?

Grazie in anticipo.

FFB


 

Claudio Nasso  Identity Verified
Italy
Local time: 22:22
Member (2003)
English to Italian
+ ...
Non è oro colato!!!!! Aug 21, 2003

Per esperienza a me risulta di 5/6 caratteri.

Qualcun altro ha altri valori?


 

Valentina Pecchiar  Identity Verified
Italy
English to Italian
+ ...
Come sopra Aug 21, 2003

Nessuna fonte certa o scientifica, ma anch'io ho sentito 5.5 car/parola.

 

Claudio Nasso  Identity Verified
Italy
Local time: 22:22
Member (2003)
English to Italian
+ ...
Matematica Aug 21, 2003

Muja wrote:

Nessuna fonte certa o scientifica, ma anch'io ho sentito 5.5 car/parola.



Non c'è bisogno di fonti certe. In sostanza basta dividere il numero dei caratteri di un testo (spazi compresi) per il numero delle parole e il gioco è fatto.icon_smile.gif

È una mera questione matematica. Ciao Valentinaicon_wink.gif

Claudio


 

gianfranco  Identity Verified
Brazil
Local time: 17:22
Member (2001)
English to Italian
+ ...
Calcolo pratico Aug 21, 2003

Ho preso dei testi campione dal sito http://www.liberliber.it/home/index.asp (testi in formato elettronico), di vari autori e di lunghezza non eccessiva.

Ho scelto quattro testi non troppo lunghi, ovvero con lunghezza compresa tra le dodicimila e le trentaseimila parole l'uno, e autori tra i piu' moderni (Gianni Brera, Cesare Beccaria, Alessandro Manzoni e Luigi Milani), li ho importati in Word ed ho contato parole e caratteri.

I risultati oscillano tra 5,18 e 5,81 caratteri per parola, con una media di 5,36
(il totale e' di 93296 parole e 495204 caratteri).

Aggiungendo altri testi il risultato non varia in modo significativo. Infatti, ho preso una quindicina di articoli da La Repubblica di oggi, ed ho ottenuto 12554 parole con 68624 caratteri, per una media di 5,47.

Ho preso infine "I promessi sposi", che non ho incluso nel conteggio precedente perche' le sue dimensioni rischiavano di alterare il risultato (203168 parole con 1087056 caratteri), ed ho ottenuto una media di 5,35.

Come vedi i risultati tra le quattro opere iniziali (5,36), gli articoli di giornale (5,47) ed "I promessi sposi" (5,35) indicano che la lingua italiana presenta una media approssimativa di circa 5,4 caratteri per parola.

Interessante!! avrei detto di piu'...

Gianfranco

PS: questo mio intervento conta 207 parole e 1105 caratteri: media 5,34



[Edited at 2003-08-22 11:56]


 

Francesco Barbuto  Identity Verified
Local time: 22:22
English to Italian
+ ...
TOPIC STARTER
Sei un mito! Aug 21, 2003

Gianfy,

Sei un mito!!!

Analizzando un pò di testi miei, ho trovato
la media di 6 caratteri per parola. Evidentemente, più esteso è il testo analizzato, più precisa la valutazione.

By the way: conoscete qualche programma Completissimo e Free per l'analisi di testi, analisi di ogni tipo ?

FFB

[Edited at 2003-08-21 14:19]


 

Lorenzo Lilli  Identity Verified
Local time: 22:22
German to Italian
+ ...
analisi? Aug 21, 2003

Francesco Barbuto wrote:

By the way: conoscete qualche programma Completissimo e Free per l'analisi di testi, analisi di ogni tipo ?

[Edited at 2003-08-21 14:19]


in che senso analisi di ogni tipo? in ogni caso complimenti a Gianfranco, non avrei mai pensato a una soluzione del genere.


 

Francesco Barbuto  Identity Verified
Local time: 22:22
English to Italian
+ ...
TOPIC STARTER
Analisi... Aug 21, 2003

...di ogni tipo.

Ciao Lorenzo!

Dalle più banali (numero caratteri, parole, linee, etc) alle più complesse (leggibilità, complessità stilistica, aggettivazione, coordinazione e subordinazione, etc.)

E chi più ne ha più ne metta!

Saluti,

FFB


 

Valentina Pecchiar  Identity Verified
Italy
English to Italian
+ ...
Matematica Aug 21, 2003

Claudio,
Intendevo che non ho, anzi AVEVO, mai visto la verifica di questo dato generale che si sente ripetere qui e là ma nessuno sa da dove ha avuto origine.

Gianfranco ha dimostrato che non serve essere linguististi computazionali (con tutto il rispetto per Gianfranco e per i computazionalisti) e utilizzare superapplicazioni appositamente sviluppate (e magari protette da dongleicon_biggrin.gif

Nobel virtuale a GM (no, non per la matematica: per il buon senso!)

Gianfranco Manca wrote:

Ho preso dei testi campione dal sito http://www.liberliber.it/home/index.asp ...

Ho scelto quattro testi non troppo lunghi, con autori scelti tra i piu' moderni (Gianni Brera, Cesare Beccaria, Alessandro Manzoni e Luigi Milani) ...

I risultati oscillano tra 5,18 e 5,81 caratteri per parola, con una media di 5,36
(il totale e' risultato di 93296 parole e 495204 caratteri).

Aggiungendo altri testi il risultato non varia in modo significativo...


Gianfranco

PS: questo mio intervento conta 207 parole e 1105 caratteri: media 5,34


====================

Gianfranco Manca wrote:

Interessante, avrei detto di piu'.



Immagino che sia soprattutto il generoso uso di preposizioni - rispetto all'inglese, per esempio, con i suoi terrificanti sintagmi nominali a ripetizione calibro .32icon_smile.gif - ad abbassare la lunghezza media delle parole italiane:

ENG > network administrator applications (7+13+12 caratteri)/3 parole = 10.67

ITA > applicazioni per amministratori di rete (12+3+14+2+4 caratteri)/5 parole = 7.0





[Edited at 2003-08-21 15:18]

[Edited at 2003-08-21 22:45]


 

gianfranco  Identity Verified
Brazil
Local time: 17:22
Member (2001)
English to Italian
+ ...
Significato di questi valori Aug 21, 2003

Muja wrote:

ENG > network administrator applications (7+13+12 caratteri)/3 parole = 10.67

ITA > applicazioni per amministratori di rete (12+3+14+2+4 caratteri)/5 parole = 7.0



Questi calcoli hanno significato solo se applicati a grandi volumi di testo.

Per questo motivo non ha molto senso prendere piu' di 100.000 parole, anche per un milione o dieci milioni il risultato non si discosta molto da quello ottenuto con 100.000, e ovviamente non ha senso prendere campioni troppo ristretti perche' si ottengono risultati non significativi.

Credo che il numero di caratteri medi per parola inglese sia inferiore all'italiano, con una lunghezza media leggermente inferiore a 5 caratteri.

Gianfranco



[Edited at 2003-08-21 16:52]


 

Valentina Pecchiar  Identity Verified
Italy
English to Italian
+ ...
Valori: solo un esempio, infatti... Aug 21, 2003

Gianfranco Manca wrote:

Questi calcoli hanno significato solo se applicati a grandi volumi di testo ... ovviamente non ha senso prendere campioni troppo ristretti perche' si ottengono risultati non significativi.



...la lunghezza delle parole che risulta dallo striminzito esempio è superiore a quella che avevo riportato in precedenza per sentito dire e ai valori che hai ottenuto con i tuoi calcoli, semplici e brillanti insieme (anche e soprattutto per la scelta del campione).

Il mio esempio aveva lo scopo principale di mettere in evidenza il (forse) più frequente uso di parole brevi in italiano (le preposizioni) rispetto ad esempio all'inglese.

E comunque rimane soltanto una mia opinione, generata quando trovandomi davanti a una "tirata" di 5-6 sostantivi inglesi devo risolvere tutti i collegamenti logici tramite preposizioni, possibilmente evitanto ripetizioni e anglicismi... Sì, talvolta quelle "paroline" che (forse) abbassano la lunghezza media dei bei paroloni italici talvolta mi stanno proprio qui!


Gianfranco Manca wrote:

Credo che il numero di caratteri medi per parola inglese sia inferiore all'italiano, con una lunghezza media leggermente inferiore a 5 caratteri.



Eddài, applica il metodo del tuo mail precedente anche all'inglese, così possiamo avere dati scientifici, per favore...


PS Per la lettere di presentazione ai signori di Stoccolma ("Preg.mi professori, pregasi voler prendere in considerazione la candidatura di Gianfranco Manca per il Vs. premio Nobel al Buon senso in quanto ecc. ecc.") scrivimi in privatoicon_wink.gif

[Edited at 2003-08-21 17:27]


 

Lorenzo Lilli  Identity Verified
Local time: 22:22
German to Italian
+ ...
dongle? Aug 21, 2003

Muja wrote:

superapplicazioni appositamente sviluppate (e magari protette da dongleicon_biggrin.gif



Scusate la mia ignoranza: cosa si intende per dongle? Per Francesco: purtroppo non conosco questi programmi. E, per curiosità: per cosa sta la F nell'acronimo FFB?


 

Francesco Barbuto  Identity Verified
Local time: 22:22
English to Italian
+ ...
TOPIC STARTER
Effe centrale... Aug 21, 2003

La F centrale ... è un segreto di stato!icon_smile.gif
Non posso assolutamente rivelarne le scopo!
O è la F iniziale quella sotto segreto???icon_wink.gif

FFB


 

Valentina Pecchiar  Identity Verified
Italy
English to Italian
+ ...
Dongle Aug 21, 2003

Muja wrote:
superapplicazioni appositamente sviluppate (e magari protette da dongleicon_biggrin.gif)


and Lorenzo Lilli asked:
Scusate la mia ignoranza: cosa si intende per dongle?


Il dongle è una chiave hardware antipirateria informatica che alcuni programmi richiedono per poter funzonare correttamente. Ovvero, se la chiave non è installata sul computer il programma non funziona oppure offre solo funzionalità ridotte (ad esempio non puoi salvare documenti oppure puoi utilizzare l'applicazione solo in versione demo). Ergo non basta che uno compri il programma e ne faccia qualche copia per gli amici includendo un'etichetta dymo con il codice Product key: gli amici devono dotarsi anche del dongle [whisper]oppure delle apposite patch che inevitabilmente si trovano sui siti "specializzati"[/whisper]icon_wink.gif
Il dongle è un affarino driver che viene inserito in una delle porte del computer (di solito la seriale, ma esistono anche dongle USB), che lo risconosce tramite l'apposito driver e attiva le piene funzionalità dell'applicazione.

Io alludevo al popolare programma di traduzione assistita che comincia per T e finisce per S (anzi s)...



[Edited at 2003-08-21 22:48]

PS per Gianfranco (già che sei da "queste parti"): è possibile che inserendo una (falsa) tag contenuta tra gli appositi marker, ProZ si mangi il resto del messaggio, da quel punto il poi? E' quello che è successo con [whisper] nel corpo del messaggio (in precedenza racchiusa fra le due "orecchiette").


[Edited at 2003-08-22 07:31]


 

Lorenzo Lilli  Identity Verified
Local time: 22:22
German to Italian
+ ...
capito Aug 22, 2003

Muja wrote:

Il dongle è una chiave hardware antipirateria informatica che alcuni programmi richiedono per poter funzonare correttamente.



Allora ho capito, ho un dongle nel Mac per QuarkXpress, ma finora tanto per essere preciso l'avevo sempre chiamato "coso attaccato alla tastiera"icon_smile.gif Grazie!


 
Pages in topic:   [1 2] >


To report site rules violations or get help, contact a site moderator:


You can also contact site staff by submitting a support request »

Lunghezza media parole italiane

Advanced search






Anycount & Translation Office 3000
Translation Office 3000

Translation Office 3000 is an advanced accounting tool for freelance translators and small agencies. TO3000 easily and seamlessly integrates with the business life of professional freelance translators.

More info »
memoQ translator pro
Kilgray's memoQ is the world's fastest developing integrated localization & translation environment rendering you more productive and efficient.

With our advanced file filters, unlimited language and advanced file support, memoQ translator pro has been designed for translators and reviewers who work on their own, with other translators or in team-based translation projects.

More info »



Forums
  • All of ProZ.com
  • Term search
  • Jobs
  • Forums
  • Multiple search