Относно представителността на колокациите в света

Курсова работа (семинар за напреднали) 2015 г. 23 страници

представителността

Проба за четене

структура

1. Въведение - За представителността на колокациите в мрежата
1.1. Какво представляват колокациите?
1.2. Въпрос
1.3. Мрежата като корпус
а) Корпусната лингвистика като емпиричен изследователски метод
б) Предимства и недостатъци на мрежата като корпус
в) Да изследва колокациите в мрежата

2. Собствено корпусно лингвистично изследване на избрани колокации в мрежата
2.1. "Речникът на колокациите на немски език" - избор на колокации, които ще бъдат изследвани
2.2. Анализ на корпуса с помощта на WebCorp
2.3. Резултати и сравнение с речника за колокация

3. Интерпретация и обсъждане на резултатите
3.1. перспектива

1. Въведение - За представителността на колокациите в мрежата

1.1. Какво представляват колокациите?

Във фразеологичните изследвания терминът колокация се използва „за обозначаване на фиксирани неидиоматични словосъчетания“ (срв. Редер 2006: 160). Колокациите по този начин са конвенционализирани на отделни езици, определени комбинации от думи са здраво закрепени в един език и по този начин представляват фиксирани „единици от езиковата система“ (вж. Lehr 1996: 1). В лингвистичните изследвания колокациите често се третират като бинарни лексикални единици, както в примерите, споменати по-горе. Съществуват обаче и „връзки с повече от две думи“ (срв. Hollós 2010: 85), както в примера, масово критикуван (вж. Hausmann 2004: 316). Тук обаче не бива да се разглежда това, тъй като те биха надхвърлили обхвата на тази работа.

В обобщение, основавам своето корпусно-лингвистично изследване на следното разбиране на колокациите: Колокациите са статистически чести комбинации от думи от двоичен характер, които се характеризират със синтагматични и семантични зависимости на колокатора от основа (вж. Hausmann 2001: 316, Reder 2006: 158). Настоящата работа ще се съсредоточи върху словесните и съдържателни колокации, тъй като те са лесни за идентифициране от лингвистична гледна точка на корпуса и следователно са много подходящи за оценка на представителността на колокациите в уеб корпуса (вж. Breidt 1995: 5). Разнообразието от възможни колокативни словосъчетания може да доведе до неясноти при търсенето и анализа на корпусите, поради което е необходимо ясно разграничаване на обекта, който ще се изследва.

1.2. Въпрос

Преди да вляза в шансовете и рисковете на мрежата като корпус за анализ на колокацията в следващата глава, бих искал да изложа целенасочения въпрос на това разследване на този етап. Целта е да се изследва дали “World Wide Web” е представителна за употребата на словесни и съществителни колокации. Резултатите от собствения анализ на корпуса на мрежата трябва да бъдат сравнени със записите в „Речник на колокациите на немски език“ (Quasthoff 2011), за да може да се оцени представителността на реалното използване на езика в мрежата. Записите в речника вече показват съответно висока честота на съответните колокации на немски език (вж. Quasthoff 2011: XII). Тъй като количественият анализ е възможен само в ограничена степен в уеб корпуса 1, при оценяването на данните на корпуса трябва да се извърши и качествен анализ на резултатите.

1.3. Мрежата като корпус

В следващата глава ще бъдат направени предварителни съображения относно пригодността на мрежата като лингвистичен корпус, което ще се влее в обсъждането на по-късните резултати от анализа на колокацията.

а) Корпусната лингвистика като емпиричен изследователски метод

С помощта на корпусната лингвистика емпирично може да се изследва използването на различни езикови явления на един език. Като се използват автентични езикови материали, например, могат да се предоставят доказателства за значението и използването на конкретни колокации и да се определи тяхната честота на появяване. Следователно те могат да бъдат анализирани качествено и количествено (вж. Scherer 2006: 35f.). Тогава това може да бъде основа за създаването на речници, както в случая с „Речник на колокациите на немски език“. Повечето корпуси - с други думи, „колекции от текстове или части от текстове, които (...) са избрани и класифицирани според определени лингвистични критерии“ (2006: 3) - сега са цифровизирани и могат да бъдат анализирани с помощта на персонални компютри. „Световната мрежа“ предоставя изключително голяма колекция от данни от писмен (и отчасти говорим) език и разширява възможностите за анализ на езиковия корпус. Има обаче някои недостатъци или ограничения. Различните характеристики на така наречените „уеб корпуси“ 2 ще бъдат разгледани по-подробно по-долу.

б) Предимства и недостатъци на мрежата като корпус

в) Да изследва колокациите в мрежата

Въпреки дискутираните по-горе ограничения, мрежата може да се използва за лексикографски и езикови статистически изследвания (Scherer 2006: 75, Diemer 2008: 36). Корпусните лингвистични проучвания на Bickel 3 ясно показват, че въпреки големия растеж и непрекъснатото по-нататъшно развитие на уеб корпуса, резултатите от търсенето са „присъщи по своята същност“ и „възпроизводими“ в определени моменти (Bickel 2006: 80). Подобни резултати могат да бъдат постигнати по различно време, което показва известна стабилност на тъканото тяло (вж. 2006: 78 и сл.).

2. Собствено корпусно лингвистично изследване на избрани колокации в мрежата

За да проверя дали „World Wide Web“ е представителна за използването на вербални и съдържателни колокации, бих искал да базирам своя анализ на корпуса на избрани колокации от „Речник на колокациите на немски“ за сравнение.

2.1. "Речникът на колокациите на немски език" - избор на колокации, които ще бъдат изследвани

„Речникът на колокациите на немски език“ е първият речник на колокациите на немски език (вж. Quasthoff 2011: XII). Тъй като той е замислен въз основа на емпиричното, корпусно-лингвистично изследване на лайпцигския езиков корпус, той изобразява езиковата реалност на колокативните употреби (вж. Radzik 2013: 64, Quasthoff 2011: XII). Колокационният речник на Quasthoff събира най-често срещаните събиратели за общо 3253 съществителни, глаголи и прилагателни, които са изброени като основа на комбинации от двоични думи (2011: X). Радзик (2013: 71) разглежда корпусното създаване на „Речник за колокации на немски език“ като „голямо постижение на немската лексикография“. Съответните колокации на ключова дума не са структурирани според тяхната действителна честота на срещане в референтния корпус, а са сортирани според синтактичната и семантичната връзка в така наречените колокационни групи 4 (вж. Quasthoff 2011: X).

За независимия корпусен анализ се анализират словесни колокации (съществително + глагол) въз основа на основната диета. От друга страна, трябва да се изследват съществителните колокации (прилагателно + съществително) въз основа на споменатото по-горе. Колокационният речник първо изброява следните глаголи и прилагателни като събиратели на съществителното хранене (срв. 2011: 150):

1 с. Раздел 1.3б).

2 „Уеб корпуси“ е езиково подготвен езиков материал от Интернет. Трябва да се прави разлика между тези „корпуси, достъпни онлайн“, които са достъпни в Интернет, но не се обработват лингвистично (вж. Storrer 2011: 12).

3 За структурата и изпълнението на това лингвистично изследване на корпуса вижте гл. Bickel (срв. 2006: 75 и сл.). 6-то

4 Тези групи за колокация са изброени, разделени с точка и запетая. Въз основа на тази структура, аз също представих резултатите от тази корпусна лингвистична работа от точка 2.3 (стр. 10).