Заключителна работа по предмета "Основи на информационните технологии" използване на информация

Беларуски държавен университет

Заключителна работа по темата

"Основи информационни технологии"

ИЗПОЛЗВАНЕ НА ИНФОРМАЦИОННИТЕ ТЕХНОЛОГИИ В ЛИНГВИСТИКАТА

Катедра по теоретично и славянско езикознание

Базилева Ирина Сергеевна

Доктор по филология, професор

старши учител П.П. Кожич

Съдържание

Резюме по темата "Използването на информационните технологии в лингвистиката" 4

ГЛАВА 1
ЗНАЧЕНИЕТО НА КОРПУСНАТА ЛИНГВИСТИКА В ИЗСЛЕДВАНЕТО НА СЪВРЕМЕННИЯ ЕЗИК 7

1.1. Основни понятия на корпусната лингвистика: текстови корпуси, анализ на корпуса 7

1.2. Универсални и специални текстови корпуси 9

Глава 2
Използване на интернет ресурси в лингвистичните изследвания 11

2.1. Съвременното състояние на интернет ресурсите, посветени на проблемите на лингвистиката 11

2.2. Анализ на съдържанието на интернет ресурси, посветени на лингвистичните въпроси 13

списък с препратки към резюмето 17

ИНТЕРНЕТ РЕСУРСИ В ПРЕДМЕТНАТА ОБЛАСТ НА ИЗСЛЕДВАНИЯ 19

Валиден личен уебсайт в Интернет 21

Графика на изследователския интерес 22

Презентация на докторска дисертация 24

Основи на тестовите въпроси за информационните технологии 25

Резюме по темата "Използването на информационни технологии в лингвистиката"

Информационните технологии (наричани по-долу ИТ) започнаха да играят огромна роля при преподаването на чужди езици, в процеса на алгоритмизиране на езикови задачи, при обработката на езикови текстове и т.н. (виж Зубов 2004). Използването на информационни технологии в лингвистиката се превърна в необходимост. В действителност обаче само малка част от целия обем ИТ се използва за лингвистични задачи: електронни речници и справочници, някои програми от пакета Microsoft Office. Най-често срещаната езикова задача у нас е търсенето на информация в Интернет [3, 239].

За съжаление значителният потенциал на съвременните информационни технологии остава неизползван поради недостатъчна компютърна грамотност на филолозите, липса на финансиране за изследователски проекти по приложни въпроси на лингвистиката, тясно специализирани интереси на изследователите и редица други причини.

Целта на тази работа е да идентифицира основните начини и области на приложение на информационните технологии в лингвистичните изследвания.

Тази работа се състои от въведение, две глави, заключение, списък на използваните източници в размер на 13 заглавия, както и тематичен указател.

Въведението обосновава уместността на изследваната тема. Първата глава обхваща основните понятия на корпусната лингвистика, както и начините за нейното приложение в езиковите изследвания. Втората глава описва текущото състояние на интернет ресурсите, анализира проблемите на езиковото търсене в мрежата, извършва анализ на съдържанието на някои сайтове в Интернет.

ГЛАВА 1
ЗНАЧЕНИЕТО НА КОРПУСНАТА ЛИНГВИСТИКА В ИЗСЛЕДВАНЕТО НА СЪВРЕМЕННИЯ ЕЗИК

1.1. Основни понятия на корпусната лингвистика: текстови корпуси, анализ на корпуса

С помощта на текстови корпуси могат да бъдат решени различни задачи, поради което работата с тях се е превърнала в един от водещите методи за лингвистични изследвания [6, 68-77]. Така че, въз основа на анализа на набор от текстове, може да се направи заключение за езиковия феномен, който представлява интерес за изследователя, например за поведението на граматическа или синтактична структура, използването на изразителни средства в естествена езикова среда, т.е. в реалния живот, а не изкуствено конструиран контекст. В допълнение, корпусните изследвания позволяват, използвайки статистически методи, да се формулира, потвърди или опровергае хипотеза за определен лингвистичен феномен върху голямо количество материал. Освен това, ако изследователят използва вече съществуващ корпус, той напълно заобикаля дългия и трудоемък етап на събиране на материали (интервюиране на информатори, работа с картотечни речници или писмени текстове). По този начин възможността за широко използване на електронни ресурси, от една страна, значително улесни процеса на събиране на информация за филолози и лингвисти, от друга страна, затегна изискванията за доказателствената база на лингвистичните изследвания.

Централната концепция на корпусната лингвистика е писмен текстов масив или корпус от текстове. В лингвистичната литература има няколко определения за текстов корпус. Например, А. Н. Баранов разглежда текстовия корпус като вид корпус с данни, чиито единици са текстове или техните доста значими фрагменти, включително например някои пълни фрагменти от макроструктурата на текстове от дадена проблемна област. В този случай корпус от данни се разбира като извадка от проблемна област, оформена съгласно определени правила, т.е. от областта на внедряване на езикова система, съдържаща явления и която е обект на лингвистично описание [1, 112-113].

А.В. Зубов разглежда корпуса от текстове „като колекция от текстове, които са достатъчна основа за осигуряване на надеждни научни заключения за определен език или друга подгрупа на езика“ [4, 64]. След D.Biber, S. Conrad, R. Reppen, A.V. Zubov разбира анализа на корпуса като използване на текстови корпуси за лингвистичен анализ и подчертава следните характеристики на този тип анализ:

1. Той е чисто емпиричен, тъй като разчита на анализа на реални примери, използвани в естествени текстове.

2. Базира се на специално изградена голяма колекция от текстове на естествен език.

3. Той широко използва компютърния анализ, включително автоматични и интерактивни техники.

4. Разчита на количествена и качествена аналитична техника [4, 64].

Има няколко изисквания за състава и структурата на тялото. Първото е изискването за пълнота. Всеки лингвистичен феномен, колкото и рядък да е той, трябва да бъде отразен в корпуса. Второ, изискването за представителност. Корпусът трябва да отразява определени параметри на изучавания лингвистичен феномен в същата пропорция, както в езика като цяло. Важен параметър на тялото е и неговият обем. Така че, ако първите корпуси достигнаха милион символи, тогава обемът на съвременните корпуси се изчислява на стотици милиони или дори милиарди (известно е, че обемът на английския корпус Bank of English надхвърля 2,5 милиарда думи).