AntConc LinguTools

Общи инструменти за анотиране и анализ на корпуса в лингвистиката

lingutools

Какво е AntConc?

AntConc е инструмент за съгласуване на писмени корпуси, с който сравнително лесно може да се извършат стандартни заявки за търсене за компютърно базиран анализ на корпуса. Софтуерът автоматично създава списъци с думи (честота на думи) и статистически данни, например за връзката между „маркер“ и „типове“, с които, наред с други неща, изследвайте богатството на речника на даден текст. Инструментът поддържа общия формат UTF-8 и позволява заявки за търсене с регулярни изрази. AntConc е част от редица много други инструменти за анализ на текстове (напр. AntWordProfiler, AntGram, AntPConc или FireAnt).

Ползи:

  • проста, интуитивна работа
  • ясни списъци за съответствие
  • Сортируем изглед на хитове
  • Възможни са клъстерни и n-грамови изчисления
  • Възможни са оценки с текстове, маркирани с POS и анотирани текстове
  • Контрастивни анализи
  • на разположение за PC и Mac
  • Видео уроци и помощ

Недостатък:

  • не е възможно ръчно коментиране/транскрипция
  • без анализ на текст-изображение
  • само за корпуси до приблизително 1,5 милиона токена

Първи стъпки/сценарий на използване:

Често случайни наблюдения в ежедневието водят до лингвистично интересен въпрос. Това могат да бъдат забележими формулировки, мода и думи табу, но също така и случаи на езиково съмнение. Използвайки примера на сравнително новата суперхрана от категория храни от настоящия хранителен дискурс, следното показва възможностите на лингвистичния анализ на корпуса с помощта на AntConc.

Оценка:

Ако въведете думата суперхрана в реда за търсене, първо ще видите всички попадения в изгледа за съответствие. Големият и малкият регистър се вземат предвид само ако отметката е зададена за „Case“. За да получите първо впечатление за езиковия котекст, можете също да сортирате посещенията, като използвате бутона "Сортиране" (екранна снимка 1). Ако няма отметка до „Думи“, заявката за търсене не взема под внимание никакви граници на думи, поради което са изброени както множествената форма, така и различни съединения като суперхрана на прах. Дискурсивните дебати с термина суперхрана (7) и тенденцията на суперхрани (14) вече са посочени в общия преглед на съответствието. Различни храни като броколи (8) или годжи бери (11) също изглежда са свързани с ключовата дума.

Екранна снимка 1: Центрирани конкорданси за думата за търсене „суперхрана“

Атрибутите реално и екзотично също сочат към тези две области: първо, дискусионно договореният въпрос за това какво правят суперхрани по принцип и, второ, кои храни са включени. За систематичен списък на прилагателни атрибути, първо трябва да се създаде корпус, маркиран според части на речта. Инструментът AntTag прави това възможно по прост начин. При конвертиране трябва да се избере езиковата настройка „немски“ и вариантът на маркиране „хоризонтален“ (не „вертикален“). Маркираният документ се записва автоматично под оригиналния txt документ. Ако заредите всички POS-маркирани файлове, създадени по този начин, в AntConc, ще получите преглед на всички прилагателни атрибути, които следват непосредствено ключовата дума вляво, използвайки заявката за търсене „ADJA superfood“ (снимка 2). Лингвистично дискурсът е препратка към оспорвана тема, в която публично се обсъжда какво е истинско или какво е истинско суперхрана. Разгледано е и самото дискурсивно надграждане, напр. за фишове на свръх, нови и хип суперхрани. Очевидно думата описва различни продукти в рамките на настоящата хранителна мода.

Екранна снимка 2: Центрирани конкорданси за думата за търсене „суперхрана“ с корпус, маркиран с POS

Преглед на честотите на думите може да бъде създаден сравнително лесно в раздела „Списък с думи“ (екранна снимка 3). Там първите думи със съдържание са единствената форма суперхрана (37), словоформите ядат (34) и здравословни (40). Както се очаква, има редица високочестотни, по-малки думи в горните ешелони, от определящи до спомагателни глаголи, а високо горе са предлозите в и с.

Снимка на екрана 3: Списък с думи

Друга перспектива за оценка на метод, задвижван от корпус, е изчисляването на N грама, което може да се извърши както с маркирания, така и с немаркирания корпус. Полето за въвеждане остава празно, отметката "N-грама" трябва да бъде зададена вдясно. Прегледът на биграмите (екранна снимка 4) дава индикация за ключовия англицизъм на чистото хранене, а често срещаната комбинация от думи също показва, че текстовете са склонни да бъдат съобразени, за да определят кои видове суперхрана се консумират къде и как (екранна снимка 5) . Ако следвате пътя на фразите, въведени с, може да намерите специфично за дискурса предложно вграждане (екранна снимка 6), в което съответното съществително изразява това, което се счита за суперхрана:

От семантична гледна точка суперхрани представляват обогатяване.Този хранително-физиологичен излишък се състои морфологично от съединения (чиа пудинг) и синтактично, наред с други неща. реализирана в съвместна конструкция. Тези конструкции се използват за комбиниране на добре познати ястия и храни - по здравословни причини - със здравословни храни (салата с къдраво зеле, купи за смути със семена от чиа).

Снимка 4: Биграми

Снимка на екрана 5: Доказателства за фразата „там“ в изгледа за съответствие

Екранна снимка 6: Преглед на биграмата за предлога "с"

Екранна снимка 7: Съвместно появяване на думата за търсене „суперхрана“ (събира се) в среда от пет думи отляво и отдясно

За оценяването съгласно "Collocates" трябва да бъде избрана изходна дума или фраза, с които други думи да се ко-ко-срещат в предварително избрана среда (среда от пет думи отляво и отдясно на думата за търсене е предварително зададена). За суперхрана има натрупване на единични и множествени форми на sein (има и са) (екранна снимка 7), което предполага предположението, че англицизмът редовно се среща в предикации, в които се правят дефиниционни атрибуции, както в следните предикативни конструкции:

Доказателствата за лечебната сила на суперхрани са редки. (Фокус онлайн 7.6.2018)

Овесът е истинска „суперхрана“. (Spiegel онлайн, 19 април 2018 г.)

Списък с ключови думи може да бъде създаден само ако корпус за сравнение е качен предварително в AntConc под „Предпочитания на инструмента“. За корпуса на суперхрана, напр. предлагат тематичен контраст на по-глобални хранителни артикули, които вероятно имат по-малко метадискурсивни следи, тъй като определенията са по-малко противоречиви. Освен това може да се приеме, че конструкциите за определяне и присвояване се срещат в по-малка степен.

Заключение:

Това корпусно-лингвистично мини-проучване идентифицира термина суперхрана като модна дума, чието въздействие върху здравето съответства на отделни храни и съставки и чието въздействие върху здравето (критично) се обсъжда в публичните дискусии.