Лекция 5 Насоки за развитие на микропроцесорите
Ivy Bridge НОВ процес
Този цикъл обикновено се повтаря на всеки 2 години. Новаторската микроархитектура се „разгръща“ в текущия производствен процес, след което се прехвърля към нова производствена технология. Този модел за развитие позволява прилагането на еднаква микроархитектура на процесора във всички пазарни сегменти. Архитектурата и стратегията на полупроводниковите технологии на Intel не само поддържат нови решения в релси, но и стимулират иновациите в индустрията на ниво платформа, използвайки предимствата на високата производителност и енергийната ефективност.
След семейството процесори Ivy Bridge, ще се появи изцяло нова (както твърди Intel) микроархитектура Haswell.
5.2. Характеристики на микроархитектурата Sandy Bridge
Основните характеристики на процесорите Sandy Bridge са:
Изчислителното ядро се подобри в сравнение с Nehalem.
Монолитен дизайн - процесорът се състои от един полупроводников кристал, произведен по 32 nm технологична технология.
Нови инструкции на Intel Advanced Vector Extensions (AVX), зададени за ускоряване на обработката с плаваща запетая.
Оптимизирана технология Intel Turbo Boost.
Забележимо повишена енергийна ефективност.
Ефективността на интегрираното графично ядро е значително увеличена.
Нова пръстенна шина Ring Interconnect.
Наличието на нова функционална единица на процесора - системен агент.
Усъвършенстван интегриран контролер на паметта.
Изчислете основните подобрения
Най-важните промени в изчислителното ядро на процесора с архитектура Sandy Bridge (фиг. 5.1):

Фигура: 5.1. Основна структура
Връщане към разпределението на кеш паметта за около 1,5 хиляди декодирани микрооперации L0 (използвани в Pentium 4), което е отделна част от L1, което едновременно осигурява по-равномерно натоварване на тръбопроводи и намалява консумацията на енергия поради увеличаване на паузите в работа на доста сложни схеми за декодиране;
Увеличаване на капацитета на буфера на пренаредени инструкции (ROB - ReOrder Buffer) и увеличаване на ефективността на тази част на процесора поради въвеждането на файл с физически регистър (PRF - Physical Register File, също характерна характеристика на Pentium 4) за съхранение на данни, както и разширяване на други буфери;
Удвояване на капацитета на регистрите за работа с поточни реални данни, което в някои случаи може да осигури двойна скорост на операциите, които ги използват;
Повишаване на ефективността на изпълнение на инструкциите за криптиране за алгоритми AES, RSA и SHA;
Оптимизация на първата L1 и втора L2 кеш памет.
Оптимизиран за по-ефективна виртуализация и изпълнение на сървърни приложения.
Едно от най-важните нововъведения в микроархитектурата на Sandy Bridge е декодираният кеш за микро-операция или кешът с инструкции L0. По същество кешът на декодирани микрооперации наподобява кеша на проследяването на микроархитектурата NetBurst (Pentium 4), но принципът на тяхното функциониране е съвсем различен, сходството завършва с факта, че и двамата работят с микрооперации.
Благодарение на структурната организация на формата 32x8 с възможност за съхраняване на шест микрооперации в линия, декодираният кеш на микрооперации съдържа малко над една и половина хиляди микрооперации. Без много шум, той кешира всички предварително декодирани микрооперации на изхода на декодерите. Веднага след като пристигне нова инструкция за обработка, блокът за предварително извличане първо проверява срещу кеша L0 и ако се намери съвпадение, конвейерът се зарежда четири микрооперации на часовник, заобикаляйки декодерите от кеша L0. Неизползваните и празните декодерни вериги, между другото, са много сложни и следователно доста „лакоми“, в този момент те са просто ... изключени от захранването. В противен случай, когато кешът на декодираните операции не е заявен, нормалната работа по извличане и декодиране на инструкциите продължава и кешът на декодираните операции се превежда в режим на пестене на енергия.
L0 кешът може до известна степен да се счита за част от кеша L1, в който между другото той е интегриран, но отделна и много бърза част от него. Според представители на Intel при работа с повечето приложения вероятността за успешен „удар“ в кеша на декодирани микрооперации е много голяма и може да достигне 80%.