Glossary entry (derived from question below)
English term or phrase:
termhood
Russian translation:
терминологичность
Added to glossary by
Igor_2006
Feb 3, 2010 05:03
14 yrs ago
1 viewer *
English term
termhood
English to Russian
Science
Linguistics
компьютерная лингвистика
Как я понимаю, это некая характеристика термина. Рассчитывается статистически при обработке текста. Вот пояснение:
Termhood refers to the degree that a linguistic unit is related to a domain-specific concept.
Termhood is usually calculated based on term frequency and bias of frequency (so called Inverse Document Frequency (Harman 1992:363-392)). Even though these calculations give a good approximation of termhood, still they do not directly reflect termhood because these calculations are based on superficial statistics. This is not a meaning in a writer's mind but a meaning in use.
Apparently, termhood is intended to reflect the former type of meaning.
Поскольку я сам в лингвистике, мягко говоря, не силен, то и предположений что-то никаких нет. Не могу понять, есть ли на русском языке аналогичный термин? Или каким словом его можно было бы перевести?
Termhood refers to the degree that a linguistic unit is related to a domain-specific concept.
Termhood is usually calculated based on term frequency and bias of frequency (so called Inverse Document Frequency (Harman 1992:363-392)). Even though these calculations give a good approximation of termhood, still they do not directly reflect termhood because these calculations are based on superficial statistics. This is not a meaning in a writer's mind but a meaning in use.
Apparently, termhood is intended to reflect the former type of meaning.
Поскольку я сам в лингвистике, мягко говоря, не силен, то и предположений что-то никаких нет. Не могу понять, есть ли на русском языке аналогичный термин? Или каким словом его можно было бы перевести?
Proposed translations
(Russian)
Change log
Apr 28, 2010 06:51: Igor_2006 Created KOG entry
Proposed translations
+1
4 hrs
Selected
терминологичность
способность выступать в качестве термина для данной предметной области, определяемая частотностью
--------------------------------------------------
Note added at 5 hrs (2010-02-03 10:06:48 GMT)
--------------------------------------------------
исходный термин, похоже, выбран его автором без претензий, поэтому и предложенный перевод - по сути дела, просто калька
--------------------------------------------------
Note added at 5 hrs (2010-02-03 10:06:48 GMT)
--------------------------------------------------
исходный термин, похоже, выбран его автором без претензий, поэтому и предложенный перевод - по сути дела, просто калька
Peer comment(s):
agree |
stasbetman
: все же терминологичность мне нравится больше - и по форме, и по содержанию + опять же, есть еще unithood который в данном случае стал бы чем-нибудь наподобие синтагмоподобности или?
23 mins
|
вот еще неплохой вариант: "терминоподобность" (В.Морозов, личное сообщение)
|
4 KudoZ points awarded for this answer.
Comment: "спасибо"
33 mins
проблемное ориентирование (термина)
проблемная направленность (термина)
Note from asker:
Спасибо, Андрей. Мне нравится Ваш вариант перевода. |
1 hr
дефинитивная характеристика термина
Вот гляньте
http://www.russian.slavica.org/article1190.html
--------------------------------------------------
Note added at 1 час (2010-02-03 06:26:01 GMT)
--------------------------------------------------
Или просто "дефинитивность"
http://www.lib.ua-ru.net/diss/cont/221599.html
http://www.russian.slavica.org/article1190.html
--------------------------------------------------
Note added at 1 час (2010-02-03 06:26:01 GMT)
--------------------------------------------------
Или просто "дефинитивность"
http://www.lib.ua-ru.net/diss/cont/221599.html
1 hr
степень соотнесенности с концептом
Это термин Кагеуры, я не думаю, что он переводился.
Корпусная лингвистика
Корпусная лингвистика
2 hrs
употребительность термина
употребительность термина
"В большинстве случаев употребительность понимается как частота
использования той или иной языковой единицы в речи, поэтому употребительность и
частотность нередко используются как взаимозаменяемые термины-синонимы."
http://open.slavica.org/index.php/bulrus/article/view/187/30...
"В большинстве случаев употребительность понимается как частота
использования той или иной языковой единицы в речи, поэтому употребительность и
частотность нередко используются как взаимозаменяемые термины-синонимы."
http://open.slavica.org/index.php/bulrus/article/view/187/30...
+1
2 hrs
вес термина
TF-IDF (от англ. TF — term frequency, IDF — inverse document frequency) — статистическая мера, используемая для оценки важности слова в контексте документа, являющегося частью коллекции документов или корпуса. Вес некоторого слова пропорционален количеству употребления этого слова в документе, и обратно пропорционален частоте употребления слова в других документах коллекции.
http://ru.wikipedia.org/wiki/TF-IDF
Инверсная частота термина i = log (количество документов в базе данных / количество документов с термином i).
Теперь каждому термину можно присвоить весовой коэффициент, отражающий его значимость:
Вес термина i в документе j = частота термина i в документе j х инверсная частота термина i.
http://www.citforum.ru/pp/search_03.shtml
...вес термина в теме (показатель, как часто данный термин соотносится теме), отношение частоты термина во всей выборке к частоте термина в теме...http://www.dialog-21.ru/Archive/2005/Sidorova E/SidorovaEA.h...
--------------------------------------------------
Note added at 5 час (2010-02-03 10:08:02 GMT)
--------------------------------------------------
пожалуй, TF-IDF это больше способ определения степени терминологичности, а весовой коэффициент/вес - единица измерения
--------------------------------------------------
Note added at 5 час (2010-02-03 10:30:42 GMT)
--------------------------------------------------
К ответу Владимира Демина:
Первостепенную роль при определении степени моносемантичности (терминологичности) / полисемантичности (общеупотребительности) слова играет контекст его функционирования. Количественный учет семантических свойств, реализованных словом в синтагматическом плане языка посредством его сочетаемости с другими словами, дает возможность не только фиксировать факт многозначности слова, но и устанавливать меру этой многозначности, причем эта мера может быть выражена некоторой (конкретной) количественной оценкой. Количественный учет сочетаемости рассматриваемого слова с другими словами в тексте показывает, что, чем больше разных слов, сочетающихся с рассматриваемым, приходится на заданный объем извлеченных из текстов сочетаний, тем шире многозначность слова в синтагматическом плане языка.
Это дает возможность рассматривать проблемы полисемии не в дихотомическом плане «многозначность – однозначность (терминологичность)», а в плане установления степени многозначности слова на градуированной шкале «многозначность – немногозначность» (4, с. 920). Увеличение числа сочетаний с разными словами характеризуется как возрастание степени полисемичности слова в синтагматическом плане языка, а соответствующее уменьшение числа сочетаний может использоваться для определения степени терминологичности слова. Иными словами, чем в большем числе значений употребляется слово в тексте, т. e. чем шире круг сочетаемости его с разными словами, тем дальше от средней точки шкалы по направлению к полюсу полисемии должно находиться данное слово, и наоборот, чем меньшее число значений реализует в тексте исследуемое слово, тем уже круг его сочетаемости с разными словами и тем дальше от средней точки шкалы в сторону полюса моносемии должно находиться это слово.
Исследовательский подход от текста к полисеманту / термину с использованием дистрибутивно-статистических методов представляется плодотворным, так как он дает возможность идентифицировать лексическую единицу в тексте в рамках всех встречающихся словоупотреблений (5, с. 47), что позволяет установить степень многозначности / терминологичности тех или иных лексем текста на основе выявления их частотности и информационной нагрузки в тексте.
conf.stavsu.ru/_WordDocs/973.doc
http://ru.wikipedia.org/wiki/TF-IDF
Инверсная частота термина i = log (количество документов в базе данных / количество документов с термином i).
Теперь каждому термину можно присвоить весовой коэффициент, отражающий его значимость:
Вес термина i в документе j = частота термина i в документе j х инверсная частота термина i.
http://www.citforum.ru/pp/search_03.shtml
...вес термина в теме (показатель, как часто данный термин соотносится теме), отношение частоты термина во всей выборке к частоте термина в теме...http://www.dialog-21.ru/Archive/2005/Sidorova E/SidorovaEA.h...
--------------------------------------------------
Note added at 5 час (2010-02-03 10:08:02 GMT)
--------------------------------------------------
пожалуй, TF-IDF это больше способ определения степени терминологичности, а весовой коэффициент/вес - единица измерения
--------------------------------------------------
Note added at 5 час (2010-02-03 10:30:42 GMT)
--------------------------------------------------
К ответу Владимира Демина:
Первостепенную роль при определении степени моносемантичности (терминологичности) / полисемантичности (общеупотребительности) слова играет контекст его функционирования. Количественный учет семантических свойств, реализованных словом в синтагматическом плане языка посредством его сочетаемости с другими словами, дает возможность не только фиксировать факт многозначности слова, но и устанавливать меру этой многозначности, причем эта мера может быть выражена некоторой (конкретной) количественной оценкой. Количественный учет сочетаемости рассматриваемого слова с другими словами в тексте показывает, что, чем больше разных слов, сочетающихся с рассматриваемым, приходится на заданный объем извлеченных из текстов сочетаний, тем шире многозначность слова в синтагматическом плане языка.
Это дает возможность рассматривать проблемы полисемии не в дихотомическом плане «многозначность – однозначность (терминологичность)», а в плане установления степени многозначности слова на градуированной шкале «многозначность – немногозначность» (4, с. 920). Увеличение числа сочетаний с разными словами характеризуется как возрастание степени полисемичности слова в синтагматическом плане языка, а соответствующее уменьшение числа сочетаний может использоваться для определения степени терминологичности слова. Иными словами, чем в большем числе значений употребляется слово в тексте, т. e. чем шире круг сочетаемости его с разными словами, тем дальше от средней точки шкалы по направлению к полюсу полисемии должно находиться данное слово, и наоборот, чем меньшее число значений реализует в тексте исследуемое слово, тем уже круг его сочетаемости с разными словами и тем дальше от средней точки шкалы в сторону полюса моносемии должно находиться это слово.
Исследовательский подход от текста к полисеманту / термину с использованием дистрибутивно-статистических методов представляется плодотворным, так как он дает возможность идентифицировать лексическую единицу в тексте в рамках всех встречающихся словоупотреблений (5, с. 47), что позволяет установить степень многозначности / терминологичности тех или иных лексем текста на основе выявления их частотности и информационной нагрузки в тексте.
conf.stavsu.ru/_WordDocs/973.doc
Discussion