Разпределителна семантика

Разпределителна семантика Значенията на думите са в главата ви? Питър Колб на 9 декември 2010 г.

семантика

Общ преглед Функционална семантика (MS) Разпределителна семантика (DS) Метод Сравнение Сравнение MS DS

яздене на кон хранене на кон инсулт конят галопира коня спи коня яде бързия кон стар кон див див кон * форматиране на кон * желязо на кон * удар на кон * конът се аргументира * конът телета * конът храни * обратно Кон * горен кон * ъглов кон

Ограничения за избор на модел със семантични характеристики: Конски спор спори [+ оживен] [- човешки] SUBJ: [+ оживен] SUBJ: [+ човешки] конят спи * конят спори

Четене на еднозначност: кон 1 [+ жив] [- човешки] кон 2 [-жив] сън SUBJ: [+ жив] аргумент SUBJ: [+ човек] конят спи кон 1

Pferd конски жребец [+ възрастен] [+ мъжки] жребец кобила [+ възрастен] [+ женски] кобила жребче [-възрастно] жребче [-възрастно] [+ женско] кобилица [-възрастно] [+ мъжко] жребче черно [+ черно ] черен кон сив [+ бял] бял кон [+ сив] сив кон лисица [+ червено-кафяв] киселец

Методи за обяснение на думи: (1) Покажи: Това е кон (2) Превод: Кон означава „кон“ (3) Определете: Бял кон е бял кон

Методи за обяснение на думи: (1) Покажи: Това е кон (2) Превод: Кон означава „кон“ (3) Определете: Бял кон е бял кон Може ли да се дефинира целият речник? Думи, обяснени с думи: опасност от кръгови определения

кръг = формата на кръг, показващ сфера Кръг = равномерно кръгла, самостоятелна линия сфера = напълно кръгло тяло (Duden Deutsches Universal приблизително през 1996 г.)

От само себе си се разбира, че семантичните характеристики са абстрактни, теоретични единици, които представляват сложни, психични структури. [] Термините [] не трябва да водят до предположението, че самите характеристики отново са лексикални единици на някакъв естествен език. Всички семантични структури [в крайна сметка] могат да бъдат проследени назад [] до характеристики, които представляват основните разположения на структурата на мисълта и възприятието на човешкия организъм. (Манфред Биеруиш 1969)

Кон [+ K027] [-S143] [+ B415] [+ R024].

Последици: значенията се състоят от семантични признаци, те са нелингвистични и вродени Значението на отделните думи може да бъде дадено изолирано Използване на значението и справка (справка)

Значенията са умствени представи: термини, понятия, прототипични образи в главата

семантичен обективизъм: думите представляват нещо, което вече е дадено във възприятието или в мисленето, т.е. има ли го независимо от езика. Значението предхожда езиковите знаци. Думите са като таблички с имена, които са прикрепени към значенията (Wittgenstein)

Проблеми: (1) практическо изпълнение: как да проследя Zeitgeist обратно до осезаеми или логически градивни елементи? Кои са те изобщо? (2) много категории имат размити стереотипи на границите, не е задължително да има характеристика, която да се прилага за всички представители на категория, някои представители на категория са по-представителни от другите естествени категории, които нямат остри граници (например дърво срещу.

Общ преглед Функционална семантика (MS) Разпределителна семантика (DS) Метод Сравнение Сравнение MS DS

яздене на кон хранене на кон инсулт конът галопира коня спи конът яде бърз кон стар кон див див кон * форматиране на кон * гладене на кон * издухване на кон * конът се аргументира * конът телета * конът храни * обратно Кон * горен кон * ъглов кон

яздене на кон хранене на кон инсулт конът галопира коня спи конът яде бърз кон стар кон див див кон * форматиране на кон * гладене на кон * издухване на кон * конът се аргументира * конът телета * конът храни * обратно Рос * горен кон * ъглов кон

* язди пиле фураж пиле инсулт пиле * пилето галопира пилето спи пилето яде бързо пиле старо пиле диво пиле * форматиране пиле * желязо пиле * духа пиле * пилето спори * пилетата телета * пилето храни * обърнато пиле * гористи пилета * ъглово пиле

* карам чаша * захранвам чаша галя чаша * чашата галопира * чашата спи * чашата яде? бързо стъкло стара чаша * дива чаша * форматирайте чаша * изгладете чаша * издухайте чаша * чашата твърди * чашата телета * стъклото се храни * обратно стъкло * дървено стъкло ъглово стъкло

Разпределителна хипотеза (Харис 1968): Думите, които се използват в сходен контекст, имат подобно значение. Използване Значение Използване = разпределение в корпуса = сбор от всички контексти

Какво означава контекст? често срещани думи Какво означава общо? Синтактична връзка на разстояние

Разпределението определя съгласуваността:

Прозорец ± 3 думи (обърнете внимание само на съдържателни думи):

Прозорец ± 3 думи (обърнете внимание само на съдържателни думи):

Прозорец ± 3 думи (обърнете внимание само на съдържателни думи):

Прозорец ± 3 думи (обърнете внимание само на съдържателни думи):

Прозорец ± 3 думи (обърнете внимание само на съдържателни думи):

Списък на често срещаните думи с честота: Колокационен профил (= разпределение на думата), преобразуващ абсолютните честоти със статистическа мярка за значимост в стойности на значимост Конна езда 18,7 Езда 16,9 Тръс 15,2 Ездач 14,5 Камила 13,1 Магаре 13,0 Езда 12, 3 езда 12,1 планина 10,8 слон 10,8 муле 10,8 юзди 10,6

Списък на често срещаните думи с честота: Профилът на колокация (= разпределение на думата) преобразува абсолютните честоти със статистическа мярка за значимост в стойности на значимост Конна езда 18,7 Езда 16,9 Трос с дължина 15,2 Ездач 14,5 Камила 13,1 Магаре 13,0 Езда 12, 3 езда 12,1 планина 10,8 слон 10,8 муле 10,8 юзди 10,6. Рос ездач 14.4 монтиране 11.7 стабилни 9.9 юзди 9,7 фута 8,2 бели 7,9 ездач 7,6 охранявани 6,8 златни 6,8 бързи 6,7 скачане 6,3 камила 6,2.

Списък на често срещаните думи с честота: Профилът на колокация (= разпределение на думата) преобразува абсолютните честоти със статистическа мярка за значимост в стойности на значимост Конна езда 18,7 Езда 16,9 Трос с дължина 15,2 Ездач 14,5 Камила 13,1 Магаре 13,0 Езда 12, 3 езда 12,1 планина 10,8 слон 10,8 муле 10,8 юзди 10,6. Рос ездач 14,4 изкачване 11,7 стабилни 9,9 юзди 9,7 фута 8,2 бели 7,9 ездач 7,6 охранявани 6,8 златни 6,8 бързи 6,7 скачане 6,3 камила 6,2.

Сравнение на всички думи (колони в таблицата) помежду си: високи стойности за думи, които са били използвани в сходен контекст за всеки списък с думи на най-сходните думи кон: кон кон магаре животно овца куче камила стъкло: чаши бутилка чаша глътка бира чаша.

срамежлив: срамежлив колеблив колеблив колеблив тихо нервен тъжен уплашен скромно неудобно развълнуван неуверен вежлив добродушен загрижен. Капитализъм: социализъм комунизъм демокрация империализъм фашизъм капиталистическа пазарна икономика либерализъм сталинизъм. писък: плач, вой, смях, ридание, обаждане, пеене, рев, кора, дъжд, писък, стенание, кървене, писък, кашлица, псуване, кажи, говори.

Общ преглед Функционална семантика (MS) Разпределителна семантика (DS) Метод Сравнение Сравнение MS DS

Ограничения за избор на модел с подобие на разпределение (Erk et al. 2010)

Предсказване на мозъчната активност при обработка на съществителни (Mitchell et al. 2008) Мозъчна активност, измерена с ядрено-магнитен резонанс (ЯМР) 25 глагола: вижте чуйте слушайте вкус мирис ядете докоснете бягайте ход кажете страх шофиране износване.

60 съществителни: целина царевица самолет в корпуса често срещано явление на 60 съществителни с 25 глагола определя стойности на значимост напр. целина: яжте 0,84 вкус 0,35 запълнете 0,32 въз основа на тези стойности и научените модели на активност от 25 глагола предсказват модели на активност на съществителността степен на успех 77%

Разпределение на пространства от думи на различни езици Превод на колокациите (редове на таблицата), доколкото е известно: Кон: езда, езда, тръс, тръс, ездач, ездач, камила, камила, монтиране на нова колона в таблица на целевия език, сравнение с всички колони на целевия език

Експериментирайте с немски английски думи от немски и английски Двуезичен речник на английската Уикипедия с 16 000 записа 800 тестови думи с известен превод Съществителни: 60% правилни (очакваният превод е най-сходната дума) Глаголи: 45% правилни Прилагателни: 66% очакван превод сред 20-те най-сходни при съществителните: 87% Глаголи: 78% прилагателни: 93% от случаите.

означава: означава 0,046 означава 0,034 означава, 0,033 означава 0,032 глагол 0,031 суфикс 0,030 произлиза 0,030. Тиква: авокадо 0,084 зеле 0,081 диня 0,080 царевица 0,078 тиква 0,077 ягода 0,076 необходимо: необходимо 0,150 достатъчно 0,103 подходящо 0,097 подходящо 0,080 необходимо 0,079. годишно: годишно 0,151 годишно 0,135 годишно 0,099 месечно 0,073 седмично 0,060 справедливо 0,058.

Моделите Vector Space са може би най-успешният подход към семантиката досега. (Turney & Pantel 2010)

Общ преглед Функционална семантика (MS) Разпределителна семантика (DS) Метод Сравнение Сравнение MS DS

Августинов образ на езика (по Витгенщайн PU 1) Думите на езика обект на име Всяка дума има значение, което е присвоено на думата. Това е обектът, за който думата стои. Изучаване на езика така, сякаш детето вече има език, сякаш вече може да попита: Какъв обект имат предвид възрастните под думата „дърво“? като възрастен, който вече говори език и идва в чужда държава

възрастният учи езика: „синьо“ означава синьо „дърво“ означава дърво радикална интерпретация (Д. Дейвидсън). сякаш детето е дошло в чужда страна и не разбира езика на страната; т.е.: сякаш вече е имал език, само не този. (PU 32), но детето няма език преди езика: „син“ означава X X = не дума, а нещо извън езиково, обектът, за който думата стои

Рубен ван де Вижвер: Фонология. Самите звуци нямат никакво значение. В комбинация те образуват думи, които имат значение. Следователно речевият звук трябва да се различава от другите звуци. Само тогава може да се изгради речник. Структуралисти: Различия и опозиция В една структура всичко има смисъл само от цялото. По този начин думите на даден език не стоят поотделно като носители на значение, но всяка от тях има своето значение само защото другите имат значение заедно с нея. (Трир 1931, стр. 643)

Самите знаци се състоят само от разграничения, които не се определят положително от тяхното съдържание, а отрицателно от връзките им с останалите членове на системата. Най-категоричният им белег е, че те са нещо, което другите не са. (Сосюр 1916, стр. 139), което означава пълни относително отделни думи, не могат да имат значение независимо от останалите значения, дадени в езика значение = място в езиковата система

четвърти метод на дефиниция: структурна идентификация (Carnap 1961) всяка дума, която може ясно да се идентифицира чрез вграждането й в структурата на думата пространство работи, въпреки че циркулярност думата пространство възниква от използването на думи в текстове език е самореферентна система, думите не съдържат своята функция чрез приписване отвън Значението не е нещо чуждо или прелингвистично, което е прикрепено към думите, а тяхната използваемост в системата

Въпросът „Какво всъщност е дума?“ е аналогично на „Какво е шахматна фигура?“ (Wittgenstein 1953, 108) Езикът не съдържа нито идеи, нито звуци, които биха съществували по-рано по отношение на езиковата система, а само концептуални и фонетични различия, произтичащи от системата. (Сосюр 1916, стр. 143)

Къде е смисълът? Смисълът е в дискурса. (Teubert 2005)

Литература Bierwisch, Manfred: Структурна семантика. В Hoffmann, L. (ed.), Linguistics: A Reader. De Gruyter 1996. Carnap, Rudolf: Логическата структура на света. Felix Meiner Verlag, 1961. Erk, Katrin, Padó, Sebastian and Padó, Ulrike: Гъвкав, управляван от корпуса модел на редовни и обратни селективни предпочитания. Компютърна лингвистика 2010. Харис, Зелиг: Математически структури на езика. Interscience Publishers 1968. Mitchell, Tom M. et al.: Предсказване на човешката мозъчна активност, свързана със значенията на съществителните. Science, Vol. 320, 2008. Putnam, Hilary: Значението на значението. Klostermann 1979th de Saussure, Ferdinand: Основни въпроси на общата лингвистика. De Gruyter 1967.

Литература Teubert, Wolfgang: Моята версия на корпусната лингвистика. International Journal of Corpus Linguistics 10: 1, 2005. Trier, Jost: Лингвистични области. В Hoffmann, L. (ed.), Linguistics: A Reader. De Gruyter 1996. Turney, Peter et al. Пантел, Патрик: От честота към значение: Векторни космически модели на семантика. Journal of Artificial Intelligence Research, 37, 2010. Wellmer, Albrecht: Sprachphilosophie. Suhrkamp 2004. Wittgenstein, Ludwig: Философски изследвания. Работно издание т. 1, Suhrkamp 1984.