Технически университет Берлин
Technische Universität Berlin Факултет I Институт за език и комуникация Катедра за аудиокомуникация Оценка на аудиовизуалното качество на високоговорителите Магистърска теза, подадена от Paul Mainz Студентски номер 225610 Берлин, 18 март 2015 г. Първи рецензент: проф. Д-р Стефан Вайнциерл Втори рецензент: Dr. Ханс-Йоахим Маемпел

С декларация заявявам вместо клетва, че съм подготвил настоящата работа самостоятелно и лично, без неоторизирана външна помощ и използвайки изключително изброените източници и ресурси. Берлин, 18 март 2015 г. Paul Mainz
Съдържание 1 Въведение 1 2 Състояние на изследванията 3 2.1 Мултимодално възприятие. 3 2.2 Аудиовизуално възприятие. 4 2.2.1 Аудиовизуална оценка на качеството. 7 2.2.2 Аудиовизуално възприятие от високоговорители. 9 3 Тест за слушане 11 3.1 Предмет на разследване. 11 3.2 Дизайн на теста. 12 3.2.1 Парадигма за съвместно присъствие. 12 3.2.2 Парадигма на коничния стимул. 12 3.3 Високоговорители. 14 3.4 Настройка на структурно изпитване. 17 3.5 Измерване. 19 3.6 Аудио съдържание. 23 3.7 Инструмент за проучване. 24 3.8 Изграждане на скала. 25 3.9 Настройка на технически експеримент. 29 3.9.1 Събиране на данни. 29 3.9.2 Акустична симулация. 32 3.9.3 Грамофон. 35 3.10 Изпълнение. 36 4 Оценка 39 4.1 Парадигма за съвместно присъствие. 41 4.1.1 Слухови атрибути. 44 4.1.2 Визуални атрибути. 49 I.
4.1.3 Аудиовизуални атрибути. 50 4.2 Парадигма на коничния стимул. 52 4.2.1 Слухови атрибути. 53 4.2.2 Визуални атрибути. 57 4.2.3 Аудиовизуални атрибути. 58 4.3 Връзки между променливите. 60 4.3.1 Парадигма за съвместно присъствие. 60 4.3.2 Парадигма на коничния стимул. 65 5 Резюме 70 Библиография 73 Списък на фигури 76 Списък на таблици 79 Анализ на вариацията 82 A.1 Парадигма за съвместно присъствие. 82 A.2 Парадигма на коничния стимул. 85 B Регресия 89 B.1 Парадигма за съвместно присъствие. 89 Б.2 Коничен стимул. 91 C Полярност Prole 93 C.1 Парадигма за съвместно присъствие. 93 D LimeSurvey 97 D.1 Инструкции за изпитване. 97 Г.2 Въпросници. 98 D.3 osc-web. 99 E Matlab функции 100 E.1 reset_turntable.m. 100 E.2 move_turntable.m. 102 E.3 setup_righttable.m. 105 E.4 outline_callback.m. 106 II
1. ВЪВЕДЕНИЕ Възприемане на възпроизвеждания от тях звук, както и оценка на качеството на целия продукт с високоговорители. Ако има връзка тук, трябва да се направи опит за нейното количествено определяне. На аудиовизуалното възприятие като научна област на изследване се обръща все по-голямо внимание, но това е млада дисциплина, която предлага много отворени въпроси. Целта на тази работа е да допринесе за по-доброто разбиране на връзките между слуха и виждането на предмети. Освен това познаването на тези взаимоотношения по отношение на високоговорителите може да бъде от практическа полза при производството на високоговорители. 2
2.2. АУДИОВИЗУАЛНО ВЪЗПРИЯТИЕ 2. СЪСТОЯНИЕ НА ИЗСЛЕДВАНЕТО, подредено едно срещу друго. По този начин, отвътре навън, има постоянно нарастваща разлика между зрителния и слуховия стимул. Преди експеримента тестваните са били посъветвани, че и двата високоговорителя произвеждат един и същ звук и поради това не могат да чуят стерео звук и че звучи така, сякаш сигналът идва от центъра. Въпреки това остава съмнително дали това съобщение прави стимула за зачитане правдоподобен за системата за възприятие и има смисъл да се извърши подобен експеримент при условия, които представляват ситуация, която е по-позната на тестваните и ежедневните естествени преживявания при чуване на аудио сигнали през високоговорителите карти по-добре. В експеримента си авторите винаги са питали за качеството на звука при всякакви условия (включително чисто визуални). Те също така посочват, че може да бъде от интерес да се проучи кои отделни фактори са важни за цялостното възприемане на продукта с високоговорители. 10
3.4. СТРУКТУРНА ЕКСПЕРИМЕНТАЛНА НАСТРОЙКА (a) Adam Classic Column Mk3 (c) JVC SP-E5 3rd TEST LISTENING (b) B&W DM601 S2 (d) Braun L420/1 (e) Heco Victa 201 Фигура 3.1: Високоговорители, използвани в теста за слушане 18
3.5. ИЗМЕРВАНЕ 3-ТИ ИЗПИТВАНЕ ЗА СЛУШАНЕ Фигура 3.4: Измервателен робот FABIAN на стола за изпитваните преди измерването на BRIR. Въз основа на данните за положението на тракера за глава, тогава може да бъде избран подходящ BRIR за текущата позиция на главата за сгъване с входния сигнал. За слушателя това създава виртуален източник на звук, който не се движи при завъртане на главата, но остава в позицията си. За измерване на BRIR е използван измервателният робот FABIAN, разработен в отдела за аудио комуникация [24]. Роботът предлага лесен начин за автоматично измерване на BRIR в диапазон от позиции на главата от ± 80. Разделителната способност тук беше 1. BRIRs бяха измерени на стъпки от 1 от въртене на главата с 80 наляво до 80 надясно. По този начин в края на измерването на източник получавате 80 BRIR във всяка посока плюс един в нулевата позиция, т.е.позицията на главата, в която роботът гледа право напред. Това дава 2 80 + 1 = 161 BRIR (стерео) на източник. Всеки високоговорител в стерео двойка се измерва отделно. Така че в крайна сметка има 2161 = 322 BRIR на модел високоговорител
3.6. АУДИО СЪДЪРЖАНИЕ 3-И ТЕСТ ЗА СЛУШАНЕ Фигура 3.6: Прехвърляне на функцията на съответния ляв високоговорител в стаята при измерване с измервателния робот и ъгъл 30 (т.е. челен изглед на робота към високоговорителя), високоговорител на дясното ухо до под кърпата на грамофона. Фигури 3.5 и 3.6 показват примери за трансферните функции на експерименталната настройка за всичките пет високоговорителя, изчислени от импулсните характеристики на левия високоговорител за ъгъл 30 (следователно измервателният робот гледа внимателно към високоговорителя). 3.6 Аудио съдържание Трябва да се направи опит да се създаде възможно най-нормална ситуация за слушане на тестваните субекти. Следователно съдържанието на стимулите, които трябва да бъдат оценени от изпитваните, т.е. аудио материалът, сгънат с BRIR, трябва да бъде избрано от жанр, който е доста познат на много слушатели. В същото време този сигнал трябва да може да разкрие слабостите на високоговорител и да ги направи звукови или да подчертае силните страни, така че изпитваните да имат възможност да чуят разликите между петте модела високоговорители. Както е описано в 3.2 23
3.9. ТЕХНИЧЕСКИ ТЕСТ НАСТРОЙКА 3-И ТЕСТ ЗА СЛУШАНЕ Фигура 3.7: Схематична техническа настройка по време на теста за слушане Интерфейс. Примери за отделни страници с въпроси могат да бъдат намерени в Приложение D. За всички различни части на експеримента (чисто акустични, чисто оптични и оптоакустични) в LimeSurvey са създадени страници с въпроси със съответните атрибути. Това гарантира, че тестваните субекти виждат само атрибутите, които в момента са подходящи. Всяка страница може да бъде присвоена на група за рандомизация в LimeSurvey. В рамките на такава група отделните страници се показват в произволен ред. В същото време групите могат да бъдат подредени във всеки определен ред. В този случай беше създадена група за чисто акустичната, чисто оптичната и оптоакустичната част на експеримента. Това прави много лесно създаването на желаната последователност от стимули в експеримента (първо акустично, след това оптично, след това 30
3.9. ТЕХНИЧЕСКИ ЕКСПЕРИМЕНТАЛНИ НАСТРОЙКИ 3-ти ЕКСПЕРИМЕНТ ЗА СЛУШАНЕ Фигура 3.8: Път на аудиоданните в акустичната симулация през слушалките с помощта на субуфер, който беше поставен в ъгъла на стаята зад другите високоговорители. Трудно беше да се види за тестваните и участниците не можеха да забележат въздушни взривове, причинени от движенията на мембраната. Следователно субуферът не беше ясно разпознаваем като компонент, активно участващ в експеримента и акустичната локализация на кутията не беше възможна поради възпроизвежданите ниски честоти. Тъй като целта при използване на субуфера е да се възпроизвеждат последователните компоненти на животни на сигналите, но само до точката в честотния спектър, при който слушалките могат да поемат отново, и в същото време трябва да се регулира и нивото на сигнала за субуфера За да се гарантира, че отговаря на нивото на симулационната част на слушалките в позицията на тестваните субекти, изходният сигнал от fwonder, т.е.сигналът, сгънат с BRIR, е изпратен към софтуера JACKRack 9. JACKRack предлага 9 Bob Ham et al., Http://jack-rack.sourceforge.net/ 33
3.10. ИЗПЪЛНЕНИЕ НА 3-ТИЯ ПРОБЛОК ЗА СЛУШАНЕ Кръпнете акустичната симулация на текущия стимул. 3.10 Изпълнение Курсът на експеримента предвиждаше първо да представи на изпитваните субекти чисто акустични стимули, т.е. само да им позволи да чуят високоговорителите, но да не виждат, след това да генерира чисто оптични стимули, т.е. само да покаже високоговорителите, без да използва акустичната симулация Пуснете звукови проби и накрая представете оптоакустичните стимули. Тази заповед гарантира, че участниците все още не са повлияни от външния вид на високоговорителите по време на чисто слухова оценка. Тъй като не можете да видите нито един високоговорител при първото слушане, не е възможно просто да присвоите предварително изслушаните звукови образци на оптично показаните високоговорители за последваща чисто визуална оценка. Стимулите бяха представени на случаен принцип във всяка от тези три групи (вж. 3.9.1). Фигура 3.10: Възрастова структура на участниците в теста Общо 20 лица с германско гражданство 36
3.10. ИЗПЪЛНЕНИЕ 3. ИЗСЛЕДВАНЕ НА ПРОСЛУШВАНЕ, че по-късно отново ще се възпроизведе сигнал през слушалките, поради което ще трябва да държите слушалките включени за целия експеримент. На хората също беше съобщено, че ще чуят всеки високоговорител няколко пъти и че поради различните използвани електроакустични настройки всеки един и същ високоговорител може да звучи различно. Затова те трябва да се опитват да слушат или да виждат и оценяват наново всеки път. За да се позволи чисто слухова оценка на високоговорителите, високоговорителите бяха покрити с кърпи в началото на експеримента. Следователно хората не можеха да ги видят. След петте чисто акустични стимула следователно субектите бяха помолени да направят кратка почивка, докато експериментаторът не свали кориците. 38
4.1. ПАРАДИГМА НА КОПЕСЕНЦИЯ 4. ОЦЕНКА Всички променливи са кодирани със стойностите от -2 до 2. Най-малката или най-отрицателната стойност по скалата съответства на стойността -2, най-голямата или най-положителната на стойността 2. 4.1 Парадигмата за съвместно присъствие са в парадигмата за съвместно присъствие както вече беше обяснено, съдържат всички стимули, които не произвеждат коничен стимул. Двата фактора модалност (3 факторни нива) и високоговорител (5 факторни нива) са различни тук. За всички зависими променливи първо бяха изчислени средните стойности и по този начин бяха създадени профили на полярност за всички високоговорители и всички модалности за илюстриране на данните. Те дават добър преглед на записаните рейтинги и някои неща привличат вниманието при гледане на Prole. Пролето за високоговорителя B&W и за слуховата модалност са показани тук като пример (Фигури 4.1 и 4.2). Prole за останалите високоговорители и начините за тях можете да намерите в приложението. Фигура 4.1: Профил на полярност на B&W DM601 S2 в парадигмата за съвместно присъствие Промяната от слуховата към аудиовизуалната модалност изглежда е основна промяна
4.1. ПАРАДИГМА НА СЪДЪРЖАНИЕТО 4. ОЦЕНКАТА се използва в парадигмата за съвместно присъствие от този тип III, за да се запази простота и еднородност. В случаите, когато това представлява интерес, са извършени и сравнения на отделни двойки (без корекция) между отделните нива на фактора. 4.1.1 Слухови атрибути Както се очаква, повечето слухови атрибути показват значителни резултати при променлив фактор на високоговорителя. Това не е изненадващ резултат, тъй като възпроизвеждането на акустични сигнали и генерирането на добри слухови впечатления е основната задача на високоговорителя. Фигура 4.3: Средни стойности на слуховите атрибути максимуми, минимуми, твърдост и обем, нанесени спрямо модалността; отделните стойности са свързани с редове за по-добра четливост, редовете не представляват стойности между модалностите, но промяната на фактора на високоговорителя не води до значителна разлика в оценката на високите честоти. Това може да се види и на Фигура 4.3. В тази фигура и в следващите представления на средната стойност абсцисата е номинално мащабирана и върху всеки е нанесен коефициент. Това означава, че между точките, отбелязани по оста x, разбира се, няма 44
4.1. ПАРАДИГМА НА КОПЕСЕНСИЯ 4. ОЦЕНКА Стойностите бяха измерени. Въпреки това между въведените стойности беше изчертана свързваща линия, за да се улеснят четенето на графиките. Стойностите за височините са близки една до друга. Тестваните субекти почти не забелязват никакви разлики във възпроизвеждането на височина. В допълнение към силата на звука, атрибутът височина е единственият слухов елемент, който не показва значими наблюдения в парадигмата за съвместно присъствие. Това се отнася и за фактора на модалност. Въпреки че високоговорителите също показват разлики в високите честоти, може да не е било толкова лесно за участниците да ги чуят. За фактора на високоговорителя обаче резултатът е само незначително незначителен (p = 0, 080). Изпитвателната якост също не е особено висока при 0,539. Следователно може да се окаже, че тук не е открито очакваното влияние на високоговорителите. Делът на възприеманите минимуми показва изключително значими резултати за фактора на високоговорителя (стр